NVIDIA vừa tung ra hệ thống GB300 NVL72 mới nhất. Chúng có thể xử lý khối lượng công việc gấp 50 lần trên mỗi megawatt điện so với nền tảng Hopper cũ. Điều đó có nghĩa là chi phí giảm 35 lần cho mỗi phần thông tin được xử lý.
Signal65 đã thực hiện thử nghiệm riêng trên GB200 NVL72 và phát hiện ra rằng nó xử lý thông tin gấp hơn 10 lần trên mỗi watt, giảm chi phí xuống còn một phần mười so với trước đây.
Các cải tiến liên tục đến. Chỉ riêng các nâng cấp thư viện TensorRT-LLM của NVIDIA đã mang lại cho GB200 hiệu suất tăng gấp 5 lần chỉ trong bốn tháng đối với các tác vụ cần phản hồi tức thì. Các nhóm làm việc trên các công cụ Dynamo, Mooncake và SGLang đang đẩy hiệu suất còn cao hơn nữa.
Các công cụ AI này sẽ bị hỏng nếu có độ trễ hoặc chúng không thể ghi nhớ đủ ngữ cảnh. Các công ty cần chúng thực sự hoạt động trong các tình huống kinh doanh thực tế, không chỉ là bản demo.
Các công cụ trí tuệ nhân tạo viết mã và hoạt động như trợ lý kỹ thuật số hiện chiếm gần một nửa tất cả các tìm kiếm liên quan đến AI, tăng từ chỉ 11% một năm trước.
Các con số đến từ báo cáo State of Inference của OpenRouter và cho thấy mọi thứ đang thay đổi nhanh như thế nào trong lĩnh vực này.
Sự tăng đột ngột này khiến các công ty phải vội vã xây dựng phần cứng có thể theo kịp. Các trợ lý AI này cần phản hồi ngay lập tức và ghi nhớ ngữ cảnh từ toàn bộ các dự án phần mềm, điều này đặt ra yêu cầu nghiêm túc về sức mạnh tính toán.
Sự bùng nổ thị trường thúc đẩy cuộc chiến giành ưu thế của các gã khổng lồ công nghệ
Số tiền liên quan là rất lớn. Thị trường AI Agent trị giá 4,92 tỷ đô la vào năm 2024. Ước tính đạt 6,016 tỷ đô la cho năm 2025, sau đó tăng vọt lên 44,97 tỷ đô la vào năm 2035. Đó là mức tăng trưởng 22,28% mỗi năm trong thập kỷ tới. Các ngân hàng, bệnh viện, cửa hàng và nhà máy là những người tiên phong.
Các doanh nghiệp đang đưa những AI Agent này vào hệ thống quản lý khách hàng, công cụ lập kế hoạch và thiết lập bảo mật để tiết kiệm tiền và hoàn thành nhiều việc hơn. Những gì bắt đầu như công nghệ tùy chọn đang trở thành cơ sở hạ tầng cơ bản.
Như báo cáo của Cryptopolitan, Alibaba vừa ra mắt Qwen3.5 nhắm vào thị trường Trung Quốc, tuyên bố chi phí xử lý thấp hơn 60% so với trước đây. Mô hình có thể xem màn hình và thực hiện các tác vụ trên điện thoại và máy tính. Nó đang cạnh tranh trực tiếp với ứng dụng Doubao của ByteDance, và cũng có bản cập nhật DeepSeek sắp ra mắt.
OpenAI đã thuê Peter Steinberger vào ngày 15. Anh ấy đã xây dựng OpenClaw, một AI Agent mã nguồn mở. CEO Sam Altman cho biết Steinberger sẽ dẫn đầu công việc về các AI Agent cá nhân thế hệ tiếp theo và gọi anh ấy là thiên tài với những ý tưởng tuyệt vời về trợ lý thông minh có thể hoàn thành những việc hữu ích.
Cuộc khủng hoảng nhân tài mà không ai có thể giải quyết
94% lãnh đạo doanh nghiệp nói rằng họ thiếu kỹ năng AI. Đến năm 2028, 44% dự kiến vẫn còn thiếu hụt từ 20 đến 40%. Workera cho biết những khoảng trống này có thể khiến nền kinh tế toàn cầu mất 5,5 nghìn tỷ đô la vào năm 2026 do sản phẩm bị trì hoãn, vấn đề chất lượng và doanh số bị mất.
Hiện tại nhu cầu về nhân tài AI vượt cung 3,2 trên 1 trên toàn thế giới. Công việc AI trả lương cao hơn 67% so với vị trí phần mềm thông thường. Tuy nhiên, 85% nhân viên văn phòng đang tự học về những thứ này vào thời gian riêng của họ, và 83% nói rằng họ chủ yếu tự dạy mình thay vì được đào tạo chính thức.
Khi các công ty mua công cụ AI từ các nhà cung cấp chuyên biệt, họ thành công 67% thời gian. Các bản dựng nội bộ chỉ hoạt động khoảng một phần ba thường xuyên như vậy.
Salesforce chứng kiến mức tăng trưởng AI Agent 119% vào đầu năm 2025 và vượt qua 500 triệu đô la doanh thu định kỳ cho các sản phẩm này. Họ đã thêm 6,000 khách hàng doanh nghiệp trong ba tháng.
Các doanh nghiệp có thể sẽ mua giải pháp thay vì tự xây dựng chúng. Điều đó chỉ ra thị trường đang tập trung xung quanh một số ít những người chơi lớn có thể cung cấp những gì thực sự hoạt động.
Nguồn: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


