NVIDIA Blackwell ทำลายสถิติเบนช์มาร์ก AI ด้านการเงินด้วยความเร็วเพิ่มขึ้น 3.2 เท่า
Iris Coleman 5 มี.ค. 2026 18:17
GB200 NVL72 ของ NVIDIA สร้างสрекорด STAC-AI ใหม่สำหรับการอนุมาน LLM ในการเทรดการเงิน มอบประสิทธิภาพสูงกว่าสถาปัตยกรรม Hopper ถึง 3.2 เท่า
สถาปัตยกรรม Blackwell ของ NVIDIA เพิ่งประกาศผลลัพธ์ที่เร็วที่สุดเท่าที่เคยมีมาในเบนช์มาร์ก STAC-AI สำหรับการอนุมาน LLM ด้านการเงิน โดย GB200 NVL72 มอบการปรับปรุงประสิทธิภาพ GPU เดี่ยวสูงถึง 3.2 เท่าเมื่อเทียบกับ Hopper รุ่นก่อนหน้า ผลลัพธ์เมื่อวันที่ 5 มีนาคม 2026 มีความสำคัญสำหรับบริษัทเทรดที่แข่งขันกันเพื่อดึงมูลค่าเพิ่มจากการวิเคราะห์ข้อมูลที่ไม่มีโครงสร้าง
ศูนย์วิเคราะห์เทคโนโลยีเชิงกลยุทธ์ซึ่งทำการเบนช์มาร์กภาระงานเทคโนโลยีทางการเงินมานานกว่า 15 ปี ได้ทดสอบ Blackwell กับสถานการณ์จริงโดยใช้เอกสาร EDGAR 10-K ซึ่งเป็นรายงานประจำปีที่มีความหนาแน่นที่กองทุนเชิงปริมาณใช้วิเคราะห์เพื่อหาสัญญาณการลงทุน เมื่อใช้โมเดล Llama 3.1 ของ Meta, GB200 NVL72 ทำความเร็วได้ 37,480 คำต่อวินาทีในพรอมต์ทางการเงินความยาวปานกลาง เทียบกับ 8,237 WPS สำหรับระบบ GH200 แบบคู่
ตัวเลขดิบบอกเรื่องราว
ในโมเดล Llama 3.1 8B กับข้อมูล EDGAR4, Blackwell ประมวลผล 224 คำขอต่อวินาที เทียบกับ 51.5 RPS สำหรับ Hopper ซึ่งเป็นการปรับปรุง 4.3 เท่าในระดับระบบ ช่องว่างขยายใหญ่ขึ้นในงานที่หนักกว่าในการคำนวณ: โมเดลพารามิเตอร์ 70B บนเอกสาร EDGAR5 บริบทยาวเห็นปริมาณงานเพิ่มขึ้นจาก 41.4 WPS เป็น 150 WPS
อะไรทำให้ได้ผลลัพธ์เหล่านี้? รูปแบบควอนไทเซชัน NVFP4 ใหม่ของ NVIDIA ที่เฉพาะสำหรับ Blackwell บีบอัดโมเดลให้มีพื้นที่หน่วยความจำเล็กลงโดยไม่สูญเสียความแม่นยำ Hopper ใช้ควอนไทเซชัน FP8 การก้าวกระโดดทางสถาปัตยกรรมสู่ความแม่นยำสี่บิตบน Blackwell ปลดล็อกความแตกต่างของปริมาณงาน
ประสิทธิภาพเชิงโต้ตอบมีความสำคัญสำหรับการเทรด
การประมวลผลแบบแบตช์เป็นเรื่องหนึ่ง การตัดสินใจเทรดแบบเรียลไทม์ต้องการการตอบสนองที่รวดเร็ว ในที่นี้ Blackwell รักษาเวลาตอบสนองที่ต่ำกว่า (คล้ายกับเวลาถึงโทเค็นแรก) และความหน่วงระหว่างคำที่ดีกว่าแม้ว่าจะถูกผลักดันไปสู่ปริมาณงานสูงสุด ในระดับการใช้งานที่เท่ากัน GB200 NVL72 เอาชนะ GH200 อย่างสม่ำเสมอในเมตริกการตอบสนองในสถานการณ์ทดสอบส่วนใหญ่
สำหรับโต๊ะเทรดที่ทำการวิเคราะห์ความรู้สึกในการประชุมผลประกอบการหรือแยกวิเคราะห์ข่าวด่วน ข้อได้เปรียบด้านความหน่วงนี้แปลเป็นการตัดสินใจที่เร็วขึ้นโดยตรง เบนช์มาร์กทดสอบไปป์ไลน์การอนุมานแบบเต็มรวมถึงการแบ่งโทเค็นอย่างชัดเจน ซึ่งเป็นงานที่การใช้งานจริงไม่สามารถข้ามได้
บริบททางการตลาด
หุ้น NVIDIA ซื้อขายที่ $181.41 เมื่อวันที่ 5 มีนาคม เพิ่มขึ้น 1.1% ในวันนั้น โดยมูลค่าตลาดของบริษัทอยู่ที่ $4.42 ล้านล้าน สถาปัตยกรรม Blackwell ที่ประกาศใน GTC 2024 ได้รับการออกแบบมาโดยเฉพาะสำหรับภาระงาน AI เชิงสร้างสรรค์ CEO Jensen Huang วางตำแหน่งว่ามันขับเคลื่อน "การปฏิวัติอุตสาหกรรมใหม่" และผลลัพธ์เบนช์มาร์กเหล่านี้ให้หลักฐานที่เป็นรูปธรรมสำหรับการอ้างสิทธิ์นั้นในภาคการเงิน
ซูเปอร์ชิป GB200 Grace Blackwell รวม GPU B200 สองตัวกับ CPU Grace มี AI Tensor Cores ที่ออกแบบใหม่และ NVLink รุ่นที่ห้าสำหรับขยายขนาดได้ถึง 576 GPU ผลลัพธ์ MLPerf ก่อนหน้านี้แสดงให้เห็นการเพิ่มขึ้นการฝึกฝน 2.2 เท่าใน Llama 3.1 405B ตัวเลข STAC-AI เหล่านี้ยืนยันข้อได้เปรียบที่คล้ายคลึงกันขยายไปถึงการอนุมาน
Hopper ยังคงมีความเกี่ยวข้อง
น่าสังเกต: สถาปัตยกรรม Hopper อายุสามปีประกาศตัวเลขที่น่านับถือ บริษัทเทรดที่มีการใช้งาน GH200 อยู่แล้วไม่ได้ล้าสมัยในชั่วข้ามคืน แต่สำหรับการสร้างใหม่หรือบริษัทที่ความเร็วในการอนุมานส่งผลกระทบโดยตรงต่อผลตอบแทน เศรษฐศาสตร์ของ Blackwell ดูน่าสนใจ—NVIDIA อ้างว่าลดต้นทุนการดำเนินงานการอนุมาน LLM ได้ถึง 25 เท่าเมื่อเทียบกับรุ่นก่อนหน้า
รายงาน STAC แบบเต็มรวมถึงเมตริกโหมดเชิงโต้ตอบโดยละเอียดในอัตราการมาถึงต่างๆ มีให้ผ่านช่องทางอย่างเป็นทางการของ STAC สถาบันการเงินที่ประเมินการอัปเกรดโครงสร้างพื้นฐาน AI ตอนนี้มีข้อมูลบุคคลที่สามที่ได้รับการตรวจสอบเพื่อใช้ในการตัดสินใจจัดซื้อจัดจ้าง
แหล่งที่มาของภาพ: Shutterstock- nvidia
- blackwell
- การอนุมาน ai
- การเทรดการเงิน
- llm


