NVIDIA Blackwell Phá Vỡ Benchmark AI Tài Chính Với Tốc Độ Tăng 3,2 Lần
Iris Coleman 18:17 05/03/2026 (Giờ VN)
GB200 NVL72 của NVIDIA thiết lập kỷ lục STAC-AI mới cho suy luận LLM trong giao dịch tài chính, mang lại hiệu suất cao hơn tới 3,2 lần so với kiến trúc Hopper.
Kiến trúc Blackwell của NVIDIA vừa đạt kết quả nhanh nhất từ trước đến nay trên benchmark STAC-AI cho suy luận LLM tài chính, với GB200 NVL72 mang lại cải thiện hiệu suất GPU đơn lẻ lên tới 3,2 lần so với thế hệ Hopper trước đó. Kết quả ngày 05/03/2026 có ý nghĩa quan trọng đối với các công ty giao dịch đang chạy đua để khai thác alpha từ phân tích dữ liệu phi cấu trúc.
Trung tâm Phân tích Công nghệ Chiến lược, đã đánh giá khối lượng công việc công nghệ tài chính trong hơn 15 năm, đã thử nghiệm Blackwell với các tình huống thực tế sử dụng hồ sơ EDGAR 10-K—các báo cáo thường niên dày đặc mà các quỹ định lượng phân tích để tìm tín hiệu đầu tư. Chạy các mô hình Llama 3.1 của Meta, GB200 NVL72 đạt 37,480 từ mỗi giây trên các câu hỏi tài chính có độ dài trung bình, so với 8,237 WPS cho hệ thống GH200 kép.
Những Con Số Thô Nói Lên Câu Chuyện
Trên mô hình Llama 3.1 8B với dữ liệu EDGAR4, Blackwell xử lý 224 yêu cầu mỗi giây so với 51,5 RPS của Hopper—cải thiện 4,3 lần ở cấp độ hệ thống. Khoảng cách mở rộng trên các tác vụ tính toán nặng hơn: mô hình tham số 70B trên hồ sơ EDGAR5 ngữ cảnh dài chứng kiến thông lượng tăng từ 41,4 WPS lên 150 WPS.
Điều gì tạo ra những cải thiện này? Định dạng lượng tử hóa NVFP4 mới của NVIDIA, độc quyền cho Blackwell, nén các mô hình vào dung lượng bộ nhớ nhỏ hơn mà không làm giảm độ chính xác. Hopper chạy lượng tử hóa FP8; bước nhảy kiến trúc sang độ chính xác bốn bit trên Blackwell mở khóa sự chênh lệch thông lượng.
Hiệu Suất Tương Tác Quan Trọng Đối Với Giao Dịch
Xử lý hàng loạt là một chuyện. Các quyết định giao dịch theo thời gian thực đòi hỏi phản hồi nhanh nhạy. Ở đây, Blackwell duy trì thời gian phản ứng thấp hơn (tương tự như thời gian đến token đầu tiên) và độ trễ giữa các từ tốt hơn ngay cả khi đẩy đến thông lượng tối đa. Ở các mức độ sử dụng tương đương, GB200 NVL72 liên tục vượt trội GH200 về các chỉ số khả năng phản hồi trong hầu hết các tình huống thử nghiệm.
Đối với các bàn giao dịch chạy phân tích cảm xúc trên các cuộc gọi về thu nhập hoặc phân tích tin tức nóng hổi, lợi thế về độ trễ đó chuyển đổi trực tiếp thành việc ra quyết định nhanh hơn. Benchmark đã thử nghiệm rõ ràng toàn bộ quy trình suy luận bao gồm cả tokenization—công việc mà các triển khai thực tế không thể bỏ qua.
Bối Cảnh Thị Trường
Cổ phiếu NVIDIA được giao dịch ở mức $181,41 vào ngày 05/03, tăng 1,1% trong ngày, với vốn hóa thị trường của công ty ở mức $4,42 nghìn tỷ. Kiến trúc Blackwell, được công bố tại GTC 2024, được thiết kế đặc biệt cho khối lượng công việc AI tạo sinh. CEO Jensen Huang định vị nó như nguồn năng lượng cho "một cuộc cách mạng công nghiệp mới," và các kết quả benchmark này cung cấp bằng chứng cụ thể cho tuyên bố đó trong lĩnh vực tài chính.
Siêu chip GB200 Grace Blackwell kết hợp hai GPU B200 với một CPU Grace, có các AI Tensor Core được thiết kế lại và NVLink thế hệ thứ năm để mở rộng lên tới 576 GPU. Các kết quả MLPerf trước đó cho thấy lợi ích huấn luyện 2,2 lần trên Llama 3.1 405B; các con số STAC-AI này xác nhận lợi thế tương tự mở rộng đến suy luận.
Hopper Vẫn Còn Phù Hợp
Đáng chú ý: kiến trúc Hopper ba năm tuổi đã đạt những con số đáng kính. Các công ty giao dịch với triển khai GH200 hiện có không trở nên lỗi thời qua đêm. Nhưng đối với các xây dựng mới hoặc các công ty mà tốc độ suy luận tác động trực tiếp đến lợi nhuận, kinh tế của Blackwell trông hấp dẫn—NVIDIA tuyên bố giảm tới 25 lần chi phí vận hành suy luận LLM so với các thế hệ trước.
Các báo cáo STAC đầy đủ, bao gồm các chỉ số chế độ tương tác chi tiết trên các tỷ lệ đến khác nhau, có sẵn thông qua các kênh chính thức của STAC. Các tổ chức tài chính đang đánh giá nâng cấp cơ sở hạ tầng AI hiện có dữ liệu được kiểm toán từ bên thứ ba để đưa ra quyết định mua sắm.
Nguồn hình ảnh: Shutterstock- nvidia
- blackwell
- ai inference
- financial trading
- llm


