NVIDIA เปิดตัว GPU-Accelerated Endpoints สำหรับโมเดล Kimi K2.5 ของ Moonshot AI
Jessie A Ellis 04 ก.พ. 2026 20:11
NVIDIA ขณะนี้เปิดให้เข้าถึง API แบบเร่งด้วย GPU ฟรีสำหรับ Kimi K2.5 โมเดล AI แบบมัลติโมดอลที่มีพารามิเตอร์ 1T พร้อม 384 ผู้เชี่ยวชาญและความยาวบริบท 262K สำหรับนักพัฒนา
NVIDIA ได้เปิดตัว GPU-accelerated endpoints สำหรับ Kimi K2.5 ของ Moonshot AI ให้นักพัฒนาเข้าถึง API ฟรีสำหรับโมเดลมัลติโมดอลแบบโอเพนซอร์สที่มีความสามารถสูงที่สุดรุ่นหนึ่งในปัจจุบัน การผสานรวมที่ประกาศเมื่อวันที่ 4 กุมภาพันธ์ 2026 ทำให้โมเดลพารามิเตอร์ 1 ล้านล้านตัวพร้อมสำหรับการนำไปใช้ในองค์กรอย่างรวดเร็วผ่านแพลตฟอร์ม build.nvidia.com ของ NVIDIA
Kimi K2.5 มาพร้อมข้อมูลจำเพาะทางเทคนิคที่สำคัญสำหรับการใช้งานจริง โมเดลใช้สถาปัตยกรรม Mixture-of-Experts ที่มี 384 ผู้เชี่ยวชาญ เปิดใช้งานเพียง 32.86 พันล้านพารามิเตอร์ต่อโทเค็น—อัตราการเปิดใช้งาน 3.2% ที่ช่วยให้ต้นทุนการอนุมานอยู่ในระดับที่จัดการได้แม้จะมีจำนวนพารามิเตอร์จำนวนมหาศาล ความยาวบริบทขยายไปถึง 262,000 โทเค็น รองรับการวิเคราะห์เอกสารจำนวนมากและการสนทนาที่ยาวนาน
ความสามารถด้านวิชันสมควรได้รับความสนใจ Moonshot สร้าง MoonViT3d Vision Tower แบบกำหนดเองที่ประมวลผลภาพและเฟรมวิดีโอเป็นเอ็มเบดดิ้ง รองรับด้วยคลังคำศัพท์ 164,000 โทเค็นที่มีโทเค็นเฉพาะด้านวิชัน นี่ไม่ใช่มัลติโมดอลแบบเสริมเข้าไป—มันเป็นส่วนหนึ่งของสถาปัตยกรรมโดยกำเนิด
สิ่งที่นักพัฒนาได้รับ
การเข้าถึงแบบสร้างต้นแบบฟรีผ่าน NVIDIA Developer Program หมายความว่าทีมสามารถทดสอบกับภาระงานจริงก่อนที่จะลงทุนในโครงสร้างพื้นฐาน API ปฏิบัติตามรูปแบบที่เข้ากันได้กับ OpenAI รวมถึงการรองรับการเรียกใช้เครื่องมือสำหรับเวิร์กโฟลว์แบบเอเจนติก ไมโครเซอร์วิส NVIDIA NIM สำหรับการอนุมานการผลิตแบบคอนเทนเนอร์กำลังจะมาถึง แม้ว่าจะยังไม่ได้ระบุกำหนดเวลาที่แน่นอน
สำหรับการใช้งานแบบโฮสต์เอง การผสานรวม vLLM พร้อมใช้งานแล้ว NVIDIA ยังยืนยันการรองรับการปรับแต่งผ่าน NeMo Framework แบบโอเพนซอร์ส โดยใช้ NeMo AutoModel เพื่อปรับแต่งโมเดลโดยตรงจากเช็คพอยท์ Hugging Face โดยไม่ต้องมีขั้นตอนการแปลง
บริบทตลาด
Moonshot AI เปิดตัว Kimi K2.5 เมื่อวันที่ 27 มกราคม 2026 ฝึกอบรมด้วยโทเค็นภาพและข้อความผสมประมาณ 15 ล้านล้านตัวที่สร้างขึ้นจากรากฐาน K2 รุ่นก่อน โมเดลถูกเปรียบเทียบโดยตรงกับ Gemini 3 Pro ของ Google โดยแสดงผลเบนช์มาร์กที่แข่งขันได้รวมถึงคะแนน 78.5% ในการทดสอบความเข้าใจภาพ MMMU-Pro และ 76.8% ใน SWE-Bench Verified สำหรับงานเขียนโค้ด
คุณสมบัติที่แตกต่าง: กลไก "Agent Swarm" ที่ประสานงานซับเอเจนต์แบบขนานได้สูงสุด 100 ตัว ซึ่งรายงานว่าลดเวลาการทำงานลง 4.5 เท่าเมื่อเทียบกับแนวทางซิงเกิลเอเจนต์ สำหรับองค์กรที่สร้างระบบอัตโนมัติที่ซับซ้อน นี่คือช่องว่างความสามารถที่มีความหมาย
การรองรับสถาปัตยกรรม Blackwell ของ NVIDIA บ่งชี้ว่าบริษัทมอง Kimi K2.5 เป็นผู้แข่งขันจริงจังในการใช้งาน AI ขององค์กร นักพัฒนาสามารถเข้าถึงโมเดลได้ทันทีผ่าน build.nvidia.com หรือผ่าน Kimi API Platform โดยตรงจาก Moonshot
แหล่งที่มาของภาพ: Shutterstock- nvidia
- kimi k2.5
- moonshot ai
- multimodal ai
- gpu computing


