Mistral AI lanceert Leanstral Open-Source Bewijsagent voor Lean 4
Zach Anderson 16 mrt 2026 19:13
Mistral brengt Leanstral uit, een AI-agent met 6B parameters voor Lean 4 formele verificatie, die grotere modellen verslaat tegen 1/15e van de kosten onder Apache 2.0-licentie.
Mistral AI heeft Leanstral uitgebracht op 16 maart 2026—de eerste open-source AI-agent die speciaal is gebouwd voor Lean 4 formele verificatie. Het model met 120B parameters draait op slechts 6B actieve parameters en wordt geleverd onder Apache 2.0-licentie, waardoor theorembewijzen van productiekwaliteit toegankelijk worden zonder bedrijfsbudgetten.
Waarom is dit belangrijk voor crypto? Formele verificatie—wiskundig bewijs dat code precies doet wat het beweert—is de gouden standaard geworden voor het beveiligen van smart contracts en blockchain-protocollen. Bugs in DeFi-code hebben miljarden gekost. Leanstral zou de drempel voor projecten die geverifieerde beveiliging zoeken dramatisch kunnen verlagen.
Prestaties versus Kosten-Afwegingen
Mistral heeft Leanstral getest tegen zowel propriëtaire als open-source concurrenten met behulp van FLTEval, een nieuwe evaluatiesuite die echte bewijstechnische taken test uit het Fermats Laatste Stelling formalisatieproject.
De cijfers zijn opvallend. Leanstral bij pass@2 scoorde 26,3 punten voor $36 aan rekenkosten. Claude Sonnet 4.6 behaalde 23,7 punten maar kostte $549—meer dan 15x de kosten voor slechtere prestaties. Zelfs bij pass@16, waar Leanstral 31,9 punten haalt voor $290, kost het nog steeds minder dan een vijfde van Claude Opus 4.6's prijskaartje van $1.650 (hoewel Opus de kwaliteit leidt met 39,6).
Tegen open-source alternatieven wordt de efficiëntiekloof nog groter. GLM5-744B-A40B en Kimi-K2.5-1T-A32B stagneren rond 16-20 punten ondanks 6-8x meer actieve parameters. Qwen3.5-397B-A17B heeft vier pogingen nodig om 25,4 punten te bereiken—Leanstral verslaat dat met twee.
Technische Architectuur
Leanstral gebruikt een schaarse mixture-of-experts-architectuur geoptimaliseerd voor bewijstechnische workflows. Het model integreert met Lean's taalserverprotocol via MCP (Model Context Protocol), specifiek getraind voor maximale prestaties met lean-lsp-mcp-tooling.
Lean 4 zelf werd stabiel gelanceerd in september 2023 en heeft snelle adoptie gezien voor het formaliseren van wiskunde. De Mathlib-bibliotheek—een enorme verzameling wiskundige bewijzen—werd succesvol geporteerd naar Lean 4 datzelfde jaar. Projecten zoals het formele bewijs van Fermats Laatste Stelling tonen het vermogen van het platform voor serieus wiskundig werk.
Toepassingen in de Echte Wereld
Mistral demonstreerde Leanstral bij het behandelen van een echte Stack Exchange-debuggingvraag over breaking changes in Lean 4.29.0-rc6. De agent diagnosticeerde een definitionele gelijkheidskwestie met type-aliassen en identificeerde correct dat het verwisselen van def voor abbrev de tactiekmatching zou herstellen.
Het model demonstreerde ook meertalige vertaling, waarbij Rocq (voorheen Coq) definities werden geconverteerd naar Lean 4 met behoud van bewijssemantiek en implementatie van aangepaste notatie.
Toegangsopties
Er zijn drie implementatiepaden: directe integratie in Mistral Vibe (gebruik /leanstall om te beginnen), een gratis API-eindpunt op labs-leanstral-2603 voor tijdelijke feedbackverzameling, of zelf-gehoste implementatie met de Apache 2.0-gewichten.
Voor blockchain-projecten is de afweging eenvoudig. Formele verificatie vereiste traditioneel dure auditkantoren of diepgaande interne expertise. Een open-source agent die codejuistheid kan bewijzen voor $36-290 per taak zou kunnen hervormen hoe protocollen beveiliging benaderen—ervan uitgaande dat de bewijzen standhouden onder productieomstandigheden.
Afbeeldingsbron: Shutterstock- mistral ai
- leanstral
- lean 4
- formele verificatie
- open source


