NVIDIA Nemotron 3 Super เปิดตัวบน Together AI พร้อมหน้าต่างบริบท 1 ล้านโทเค็น

Jessie A Ellis 11 มี.ค. 2026 21:43

โมเดล NVIDIA Nemotron 3 Super พารามิเตอร์ 120B พร้อมให้ใช้งานบน Together AI แล้ว ให้ผลลัพธ์เพิ่มขึ้น 5 เท่าสำหรับระบบ AI แบบหลายเอเจนต์และงานระดับองค์กร

NVIDIA Nemotron 3 Super เปิดตัวบน Together AI พร้อมหน้าต่างบริบท 1 ล้านโทเค็น

Together AI ประกาศความพร้อมของ NVIDIA Nemotron 3 Super บนแพลตฟอร์ม Dedicated Inference เมื่อวันที่ 11 มีนาคม ทำให้นักพัฒนาระดับองค์กรสามารถเข้าถึงโมเดลการใช้เหตุผลพารามิเตอร์ 120 พันล้านตัวที่ปรับให้เหมาะสมสำหรับระบบ AI แบบหลายเอเจนต์ หุ้น NVIDIA ซื้อขายที่ $186.03 เพิ่มขึ้น 0.66% จากข่าวนี้

จังหวะเวลามีความสำคัญ Nemotron 3 Super เป็นโมเดลน้ำหนักเปิดตัวที่สองของ NVIDIA ในตระกูล Nemotron 3 ตามหลังการเปิดตัว Nano ในเดือนธันวาคม และมุ่งเป้าไปที่จุดปวดเฉพาะในการผลิต AI: ภาระการคำนวณของการรันเวิร์กโฟลว์เอเจนต์ที่ซับซ้อนในระดับใหญ่

ทำไมสถาปัตยกรรมจึงสำคัญ

นี่คือสิ่งที่ทำให้โมเดลนี้แตกต่างจากการแข่งขันจำนวนพารามิเตอร์ทั่วไป แม้จะมีพารามิเตอร์ทั้งหมด 120B แต่มีเพียง 12B เท่านั้นที่ใช้งานระหว่างการอนุมาน การออกแบบแบบผสม—รวม Transformer attention กับการประมวลผลลำดับ Mamba—ให้ผลลัพธ์ที่ NVIDIA อ้างว่าสูงกว่าโมเดล Nemotron Super รุ่นก่อนถึง 5 เท่า

หน้าต่างบริบท 1 ล้านโทเค็นแก้ไขสิ่งที่นักพัฒนาเรียกว่า "การระเบิดของบริบท" แอปพลิเคชันแบบหลายเอเจนต์สามารถใช้โทเค็นมากกว่าการโต้ตอบแชทมาตรฐานถึง 15 เท่า และโมเดลส่วนใหญ่จะติดขัดกับภาระนั้น Nemotron 3 Super จัดการกับโค้ดเบสทั้งหมด ที่เก็บเอกสารยาว และวิถีเอเจนต์แบบขยายโดยไม่มีการตกต่ำของประสิทธิภาพ

การฝึก Multi-Token Prediction ช่วยให้โมเดลสร้างโทเค็นหลายตัวพร้อมกันต่อการส่งต่อหนึ่งครั้ง สำหรับการสร้างโค้ดหรือผลลัพธ์ที่มีโครงสร้าง NVIDIA รายงานว่าการสร้างโทเค็นเร็วขึ้น 50% เมื่อเทียบกับโมเดลเปิดชั้นนำ

กลยุทธ์ของ Together AI

การรันโมเดลผสม 120B ที่มีบริบทล้านโทเค็นโดยทั่วไปต้องใช้การคำนวณแบบกระจายข้ามหลายโหนด ข้อเสนอ Dedicated Inference ของ Together AI ทำให้การปรับใช้ง่ายขึ้นเป็น GPU NVIDIA H200 หรือ H100 เดี่ยว—ไม่ต้องจัดเตรียม GPU ในส่วนของนักพัฒนา

แพลตฟอร์มสัญญา SLA การทำงาน 99.9% และการปฏิบัติตาม SOC 2 วางตำแหน่งนี้เป็นโครงสร้างพื้นฐานที่พร้อมสำหรับองค์กรมากกว่าการทดลองระดับวิจัย

แอปพลิเคชันการผลิต

กรณีการใช้งานเป้าหมายรวมถึงผู้ช่วยนักพัฒนาที่วิเคราะห์โค้ดเบส ระบบประมวลผลเอกสารองค์กร การคัดกรองช่องโหว่ด้านความปลอดภัยทางไซเบอร์ และชั้นการจัดระเบียบที่กำหนดเส้นทางงานข้ามเอเจนต์เฉพาะทาง

แนวทางน้ำหนักเปิด—เปิดตัวภายใต้ใบอนุญาต NVIDIA Nemotron Open Model License—อนุญาตให้ทีมปรับแต่งสำหรับสภาพแวดล้อมเฉพาะและปรับใช้ภายในองค์กร ซึ่งเป็นข้อพิจารณาสำคัญสำหรับองค์กรที่มีข้อกำหนดเรื่องอธิปไตยข้อมูล

NVIDIA ยังประกาศ NemoClaw เมื่อวันที่ 10 มีนาคม ซึ่งเป็นแพลตฟอร์มโอเพนซอร์สสำหรับเอเจนต์ AI ที่สามารถเสริม Nemotron 3 Super ได้ นักพัฒนาสามารถเข้าถึงโมเดลผ่านระดับ dedicated inference ของ Together AI ได้ทันที

แหล่งที่มาของภาพ: Shutterstock