Mistral AI เปิดตัว Leanstral เอเจนต์พิสูจน์หลักฐานโอเพนซอร์สสำหรับ Lean 4
Zach Anderson 16 มี.ค. 2026 19:13
Mistral ปล่อย Leanstral เอเจนต์ AI พารามิเตอร์ 6B สำหรับการตรวจสอบความถูกต้องอย่างเป็นทางการของ Lean 4 เอาชนะโมเดลขนาดใหญ่กว่าด้วยต้นทุน 1/15 ภายใต้ไลเซนส์ Apache 2.0
Mistral AI ปล่อย Leanstral เมื่อวันที่ 16 มีนาคม 2026 ซึ่งเป็นเอเจนต์ AI โอเพนซอร์สตัวแรกที่สร้างขึ้นโดยเฉพาะสำหรับการตรวจสอบความถูกต้องอย่างเป็นทางการของ Lean 4 โมเดลพารามิเตอร์ 120B ทำงานด้วยพารามิเตอร์ที่ใช้งานเพียง 6B และมาพร้อมกับไลเซนส์ Apache 2.0 ทำให้การพิสูจน์ทฤษฎีบทระดับการผลิตเข้าถึงได้โดยไม่ต้องใช้งบประมาณระดับองค์กร
ทำไมสิ่งนี้จึงสำคัญสำหรับคริปโต? การตรวจสอบความถูกต้องอย่างเป็นทางการ ซึ่งเป็นการพิสูจน์ทางคณิตศาสตร์ว่าโค้ดทำตรงตามที่อ้างไว้ได้กลายเป็นมาตรฐานทองคำในการรักษาความปลอดภัยของสมาร์ทคอนแทรกต์และโปรโตคอลบล็อกเชน ข้อบกพร่องในโค้ด DeFi ได้ก่อให้เกิดความเสียหายหลายพันล้าน Leanstral อาจลดอุปสรรคอย่างมากสำหรับโครงการที่แสวงหาความปลอดภัยที่ได้รับการตรวจสอบ
ประสิทธิภาพเทียบกับการแลกเปลี่ยนต้นทุน
Mistral ทดสอบประสิทธิภาพ Leanstral กับคู่แข่งทั้งแบบกรรมสิทธิ์และโอเพนซอร์สโดยใช้ FLTEval ชุดการประเมินใหม่ที่ทดสอบงานวิศวกรรมการพิสูจน์จริงจากโครงการทำให้เป็นทางการของทฤษฎีบทสุดท้ายของแฟร์มาต์
ตัวเลขน่าประทับใจ Leanstral ที่ pass@2 ได้คะแนน 26.3 คะแนนด้วยต้นทุนการคำนวณ $36 Claude Sonnet 4.6 ได้ 23.7 คะแนนแต่มีค่าใช้จ่าย $549 ซึ่งมากกว่า 15 เท่าสำหรับประสิทธิภาพที่แย่กว่า แม้แต่ที่ pass@16 ซึ่ง Leanstral ได้ 31.9 คะแนนในราคา $290 ก็ยังคงมีต้นทุนน้อยกว่าหนึ่งในห้าของราคา $1,650 ของ Claude Opus 4.6 (แม้ว่า Opus จะนำในด้านคุณภาพที่ 39.6)
เมื่อเทียบกับทางเลือกโอเพนซอร์ส ช่องว่างประสิทธิภาพยิ่งกว้างขึ้น GLM5-744B-A40B และ Kimi-K2.5-1T-A32B อยู่ที่ประมาณ 16-20 คะแนนแม้จะมีพารามิเตอร์ที่ใช้งานมากกว่า 6-8 เท่า Qwen3.5-397B-A17B ต้องการสี่รอบเพื่อให้ถึง 25.4 คะแนน ซึ่ง Leanstral ชนะด้วยสองรอบ
สถาปัตยกรรมทางเทคนิค
Leanstral ใช้สถาปัตยกรรม sparse mixture-of-experts ที่ปรับให้เหมาะสมสำหรับเวิร์กโฟลว์วิศวกรรมการพิสูจน์ โมเดลผสานรวมกับโปรโตคอลเซิร์ฟเวอร์ภาษาของ Lean ผ่าน MCP (Model Context Protocol) ได้รับการฝึกฝนเป็นพิเศษเพื่อประสิทธิภาพสูงสุดกับเครื่องมือ lean-lsp-mcp
Lean 4 เองเปิดตัวเวอร์ชันเสถียรในเดือนกันยายน 2023 และได้เห็นการนำไปใช้อย่างรวดเร็วสำหรับการทำให้คณิตศาสตร์เป็นทางการ ไลบรารี Mathlib ซึ่งเป็นคอลเล็กชันขนาดใหญ่ของการพิสูจน์ทางคณิตศาสตร์ได้ถูกโอนไปยัง Lean 4 สำเร็จในปีเดียวกัน โครงการเช่นการพิสูจน์อย่างเป็นทางการของทฤษฎีบทสุดท้ายของแฟร์มาต์แสดงให้เห็นความสามารถของแพลตฟอร์มสำหรับงานคณิตศาสตร์ระดับจริงจัง
การประยุกต์ใช้ในโลกจริง
Mistral แสดง Leanstral จัดการกับคำถามการดีบักจริงใน Stack Exchange เกี่ยวกับการเปลี่ยนแปลงที่ทำลายใน Lean 4.29.0-rc6 เอเจนต์วินิจฉัยปัญหาความเท่าเทียมเชิงนิยามกับ type aliases และระบุอย่างถูกต้องว่าการสลับ def เป็น abbrev จะคืนค่าการจับคู่กลยุทธ์
โมเดลยังแสดงการแปลข้ามภาษา โดยแปลงนิยาม Rocq (เดิมคือ Coq) เป็น Lean 4 พร้อมทั้งรักษาความหมายของการพิสูจน์และการใช้สัญลักษณ์กำหนดเอง
ตัวเลือกการเข้าถึง
มีเส้นทางการปรับใช้สามทาง: การผสานรวมโดยตรงใน Mistral Vibe (ใช้ /leanstall เพื่อเริ่มต้น), API endpoint ฟรีที่ labs-leanstral-2603 สำหรับการรวบรวมคำติชมเป็นเวลาจำกัด หรือการปรับใช้ที่โฮสต์เองด้วยน้ำหนัก Apache 2.0
สำหรับโครงการบล็อกเชน การคำนวณตรงไปตรงมา การตรวจสอบความถูกต้องอย่างเป็นทางการโดยทั่วไปต้องการบริษัทตรวจสอบที่มีราคาแพงหรือความเชี่ยวชาญภายในที่ลึกซึ้ง เอเจนต์โอเพนซอร์สที่สามารถพิสูจน์ความถูกต้องของโค้ดในราคา $36-290 ต่องานอาจเปลี่ยนแปลงวิธีที่โปรโตคอลเข้าหาความปลอดภัย สมมติว่าการพิสูจน์อยู่ได้ภายใต้สภาวะการผลิต
แหล่งที่มาของภาพ: Shutterstock- mistral ai
- leanstral
- lean 4
- การตรวจสอบความถูกต้องอย่างเป็นทางการ
- โอเพนซอร์ส


