Rongchai Wang
24 ม.ค. 2026 00:07
EigenAI บรรลุผลลัพธ์ LLM ที่ทำซ้ำได้ 100% บน GPU โดยมี overhead ต่ำกว่า 2% ช่วยให้เอเจนต์ AI อัตโนมัติที่ตรวจสอบได้สำหรับการซื้อขายและตลาดคาดการณ์
EigenCloud ได้เปิดตัวแพลตฟอร์ม EigenAI บน mainnet โดยอ้างว่าสามารถแก้ปัญหาพื้นฐานที่รบกวนระบบ AI อัตโนมัติ: คุณไม่สามารถตรวจสอบสิ่งที่คุณไม่สามารถทำซ้ำได้
ความสำเร็จทางเทคนิคในที่นี้มีนัยสำคัญ EigenAI ให้การอนุมานแบบกำหนดที่แม่นยำถึงระดับบิตบน GPU ที่ใช้งานจริง ซึ่งหมายความว่าอินพุตเหมือนกันจะให้ผลลัพธ์เหมือนกันในการทดสอบ 10,000 รอบ โดยมี latency เพิ่มเพียง 1.8% สำหรับทุกคนที่สร้างเอเจนต์ AI ที่จัดการเงินจริง สิ่งนี้มีความสำคัญ
ทำไมความสุ่มของ LLM ทำลายแอปพลิเคชันทางการเงิน
รันพรอมต์เดียวกันผ่าน ChatGPT สองครั้ง คำตอบต่างกัน นั่นไม่ใช่ bug แต่เป็นวิธีที่คณิตศาสตร์จุดลอยตัวทำงานบน GPU การจัดตาราง kernel, การแบตช์ตัวแปร และการสะสมแบบไม่เชื่อมโยง ล้วนแนะนำความแปรผันเล็กน้อยที่รวมกันเป็นผลลัพธ์ที่แตกต่างกัน
สำหรับแชทบอต ไม่มีใครสังเกตเห็น แต่สำหรับเอเจนต์ AI ซื้อขายที่ดำเนินการด้วยเงินทุนของคุณ? สำหรับออราเคิลตลาดคาดการณ์ที่ตัดสินว่าใครชนะเงินเดิมพัน 200 ล้านดอลลาร์? ความไม่สอดคล้องกลายเป็นภาระหนี้สิน
EigenCloud ชี้ไปที่ตลาดที่มีชื่อเสียงของ Polymarket "Zelenskyy สวมสูทหรือไม่?" เป็นกรณีศึกษา ปริมาณการซื้อขายกว่า 200 ล้านดอลลาร์ ข้อกล่าวหาเรื่องการแก้ไขตามอำเภอใจ และท้ายที่สุดการกำกับดูแลโดยมนุษย์ต้องเข้ามาแทรกแซง เมื่อตลาดขยายตัว การตัดสินโดยมนุษย์ไม่สามารถทำได้ ผู้พิพากษา AI กลายเป็นสิ่งที่หลีกเลี่ยงไม่ได้ แต่ก็ต่อเมื่อผู้พิพากษานั้นให้คำตัดสินเดียวกันทุกครั้ง
สแต็กทางเทคนิค
การบรรลุความเป็นกำหนดบน GPU ต้องการการควบคุมทุกเลย์เยอร์ ชิป A100 และ H100 ให้ผลลัพธ์ที่แตกต่างกันสำหรับการดำเนินการเดียวกันเนื่องจากความแตกต่างทางสถาปัตยกรรมในการปัดเศษ วิธีแก้ปัญหาของ EigenAI: ผู้ดำเนินการและผู้ตรวจสอบต้องใช้ GPU SKU เดียวกัน การทดสอบของพวกเขาแสดงอัตราการจับคู่ 100% บนการรันสถาปัตยกรรมเดียวกัน 0% ข้ามสถาปัตยกรรม
ทีมแทนที่ cuBLAS kernel มาตรฐานด้วยการใช้งานแบบกำหนดเองโดยใช้ warp-synchronous reductions และการจัดลำดับเธรดแบบคงที่ ไม่มี floating-point atomics พวกเขาสร้างบน llama.cpp เนื่องจาก codebase ขนาดเล็กและตรวจสอบได้ ปิดการใช้งาน dynamic graph fusion และการปรับให้เหมาะสมอื่นๆ ที่แนะนำความแปรผัน
ต้นทุนประสิทธิภาพอยู่ที่ 95-98% ของปริมาณงาน cuBLAS มาตรฐาน การทดสอบข้ามโฮสต์บนโหนด H100 อิสระสร้าง SHA256 hash ที่เหมือนกัน การทดสอบความเครียดด้วย GPU workloads พื้นหลังที่ทำให้เกิด scheduling jitter? ยังคงเหมือนกัน
การตรวจสอบผ่านเศรษฐศาสตร์
EigenAI ใช้โมเดลการตรวจสอบแบบมองในแง่ดีที่ยืมมาจาก blockchain rollups ผู้ดำเนินการเผยแพร่ผลลัพธ์ที่เข้ารหัสไปยัง EigenDA ซึ่งเป็นเลย์เยอร์ความพร้อมใช้งานข้อมูลของโครงการ ผลลัพธ์ได้รับการยอมรับโดยค่าเริ่มต้น แต่สามารถท้าทายได้ในช่วงหน้าต่างข้อพิพาท
หากถูกท้าทาย ผู้ตรวจสอบจะดำเนินการอีกครั้งภายในสภาพแวดล้อมการดำเนินการที่เชื่อถือได้ เนื่องจากการดำเนินการเป็นแบบกำหนด การตรวจสอบจึงกลายเป็นไบนารี: ไบต์ตรงกันหรือไม่? ความไม่ตรงกันจะทริกเกอร์การ slashing จาก bonded stake ผู้ดำเนินการสูญเสียเงิน ผู้ท้าทายและผู้ตรวจสอบได้รับเงิน
การออกแบบทางเศรษฐกิจมีจุดมุ่งหมายเพื่อทำให้การโกงเป็นค่าที่คาดหวังเชิงลบเมื่อความน่าจะเป็นของการท้าทายข้ามเกณฑ์บางอย่าง
สิ่งที่สร้างขึ้นตอนนี้
แอปพลิเคชันทันทีตรงไปตรงมา: ผู้พิพากษาตลาดคาดการณ์ที่คำตัดสินสามารถทำซ้ำและตรวจสอบได้ เอเจนต์ซื้อขายที่ทุกการตัดสินใจถูกบันทึกและท้าทายได้ และเครื่องมือวิจัยที่ผลลัพธ์สามารถตรวจสอบโดยเพื่อนร่วมงานผ่านการดำเนินการซ้ำแทนที่จะเชื่อ
แนวโน้มที่กว้างขึ้นในที่นี้สอดคล้องกับความสนใจของธุรกิจที่เพิ่มขึ้นใน AI แบบกำหนดสำหรับภาคที่มีการปฏิบัติตามกฎระเบียบหนัก การดูแลสุขภาพ การเงิน และแอปพลิเคชันทางกฎหมายต้องการความสามารถในการทำซ้ำที่ระบบความน่าจะเป็นไม่สามารถรับประกันได้มากขึ้นเรื่อยๆ
ว่า overhead 2% ของ EigenAI จะพิสูจน์ว่ายอมรับได้สำหรับแอปพลิเคชันความถี่สูงหรือไม่ยังคงต้องรอดู แต่สำหรับเอเจนต์อัตโนมัติที่จัดการเงินทุนจำนวนมาก ความสามารถในการพิสูจน์ความสมบูรณ์ของการดำเนินการอาจคุ้มค่ากับภาษีประสิทธิภาพ
whitepaper ฉบับสมบูรณ์รายละเอียดการวิเคราะห์ความปลอดภัยอย่างเป็นทางการ ข้อกำหนดการออกแบบ kernel และกลไก slashing สำหรับผู้ที่สร้างบนโครงสร้างพื้นฐาน
แหล่งที่มาของภาพ: Shutterstock
แหล่งที่มา: https://blockchain.news/news/eigenai-deterministic-inference-mainnet-launch








