BitcoinWorld
Patronus AI ระดมทุน 50 ล้านดอลลาร์เพื่อสร้าง 'โลกดิจิทัล' สำหรับทดสอบความเครียดของ AI Agent
AI Agent กำลังพัฒนาอย่างรวดเร็ว โดยเปลี่ยนจากการตอบคำถามง่ายๆ ไปสู่การดำเนินงานที่ซับซ้อนหลายขั้นตอนอย่างอิสระ เช่น การจองการเดินทางหรือการวิเคราะห์ข้อมูลทางการเงิน แต่ก่อนที่จะไว้วางใจ Agent เหล่านี้ในแอปพลิเคชันในโลกจริง นักพัฒนาต้องการการรับประกันที่เข้มงวดว่าพวกมันทำงานได้อย่างน่าเชื่อถือในสถานการณ์นับไม่ถ้วน Patronus AI สตาร์ทอัพที่ตั้งอยู่ในซานฟรานซิสโก ก่อตั้งในปี 2023 โดยอดีตนักวิจัย Meta AI อย่าง Anand Kannappan และ Rebecca Qian ได้ระดมทุน 50 ล้านดอลลาร์ในรอบ Series B เพื่อขยายโซลูชันของตน ได้แก่ สภาพแวดล้อมดิจิทัลจำลองที่ทดสอบความเครียดของ AI Agent หลังการฝึกอบรม
Patronus AI สร้างสิ่งที่เรียกว่า "digital world models" — แบบจำลองของเว็บไซต์และระบบภายในที่ Agent ได้รับการทดสอบโดยใช้การเรียนรู้เสริมแรง กระบวนการนี้จะให้รางวัลซ้ำๆ สำหรับการทำงานสำเร็จและลงโทษข้อผิดพลาด ทำให้ AI เรียนรู้จากความผิดพลาดในสภาพแวดล้อมที่ปลอดภัยและควบคุมได้ บริษัทเปรียบวิธีการของตนกับวิธีที่ Waymo ฝึกยานพาหนะอัตโนมัติโดยใช้โลกสังเคราะห์เพื่อจำลองอันตรายที่หาได้ยาก เช่น สภาพอากาศรุนแรงหรือเด็กวิ่งไล่ลูกบอล สำหรับ AI Agent ความท้าทายนั้นแตกต่างออกไป: พวกมันมักใช้ทางลัดที่ทำให้ล้มเหลวในงานอย่างละเอียด
รอบ Series B นำโดย Greenfield Partners โดยมีการเข้าร่วมจาก Notable Capital, Lightspeed, Datadog และ Samsung ทำให้เงินทุนรวมของ Patronus อยู่ที่ 70 ล้านดอลลาร์ ตามที่ Glenn Solomon ผู้อำนวยการบริหารของ Notable Capital กล่าว ความต้องการสภาพแวดล้อมจำลองของ Patronus นั้น "แทบจะไม่อิ่มตัว" รายได้ของสตาร์ทอัพเติบโตขึ้น 15 เท่าในช่วงปีที่ผ่านมา สะท้อนถึงความสนใจอย่างแรงกล้าจากทั้ง AI lab ชั้นนำและสตาร์ทอัพที่กำลังเติบโต "Patronus เก่งมากในการจับช่องโหว่และทำให้แน่ใจว่าโมเดลต้องรับผิดชอบ" Solomon กล่าว
เกณฑ์มาตรฐานแบบดั้งเดิมมักไม่สามารถจับภาพได้ว่า AI Agent จะทำงานอย่างไรในงานที่ซับซ้อนในโลกจริง Patronus มุ่งหมายที่จะเติมเต็มช่องว่างนั้นด้วยการจัดเตรียมสภาพแวดล้อมที่ Agent สามารถทดสอบได้ในระยะเวลานาน — ชั่วโมง วัน หรือแม้แต่สัปดาห์ ปัจจุบันมุ่งเน้นไปที่วิศวกรรมซอฟต์แวร์และการเงิน บริษัทวางแผนที่จะขยายไปสู่พื้นที่ที่ยากต่อการตรวจสอบมากขึ้น เช่น งานสร้างสรรค์หรือการตัดสินใจแบบเปิด "วันนี้เรามุ่งเน้นมากกับปัญหาที่ตรวจสอบได้" Kannappan กล่าว "แต่ยังมีพื้นที่อีกมากมายที่ตรวจสอบไม่ได้"
Patronus มองว่าคู่แข่งหลักของตนคือทีมประเมินภายในของ AI lab ขนาดใหญ่ ในขณะที่บริษัทข้อมูลมนุษย์อย่าง Mercor และ Surge ช่วยเหลือการเรียนรู้เสริมแรงผ่านข้อเสนอแนะจากมนุษย์ Patronus ดำเนินการโดยไม่มีการมีส่วนร่วมของมนุษย์ในกระบวนการประเมินเลย วิธีการอัตโนมัติอย่างสมบูรณ์นี้ช่วยให้การทดสอบมีความยืดหยุ่นและสม่ำเสมอ ซึ่งสามารถเปิดเผยกรณีขอบและพฤติกรรมที่ไม่คาดคิด
รอบการระดมทุนล่าสุดของ Patronus AI เป็นสัญญาณถึงความเชื่อมั่นที่เพิ่มขึ้นของนักลงทุนในความจำเป็นของการประเมิน AI Agent แบบอัตโนมัติที่เข้มงวด เมื่อ Agent มีความเป็นอิสระมากขึ้นและฝังตัวอยู่ในงานสำคัญ เครื่องมือที่รับประกันความน่าเชื่อถือของพวกมันจะเป็นสิ่งจำเป็น digital world models ของบริษัทนำเสนอเส้นทางที่มีแนวโน้มดีสู่การนำ AI ไปใช้งานที่ปลอดภัยและน่าเชื่อถือมากขึ้นในทุกอุตสาหกรรม
Q1: ผลิตภัณฑ์หลักของ Patronus AI คืออะไร?
Patronus AI สร้างสภาพแวดล้อมดิจิทัลจำลอง — เรียกว่า "digital world models" — ที่ทดสอบ AI Agent หลังการฝึกอบรม แบบจำลองของเว็บไซต์และระบบภายในเหล่านี้ช่วยให้ Agent ฝึกทำงานที่ซับซ้อนและได้รับการประเมินความน่าเชื่อถือ
Q2: Patronus AI แตกต่างจากเกณฑ์มาตรฐาน AI แบบดั้งเดิมอย่างไร?
เกณฑ์มาตรฐานแบบดั้งเดิมวัดประสิทธิภาพในงานเฉพาะเจาะจง แต่ไม่สามารถจับภาพได้ว่า Agent รับมือกับความซับซ้อนในโลกจริงอย่างไร รวมถึงสถานการณ์ที่ไม่คาดคิดหรือทางลัด Patronus ใช้การเรียนรู้เสริมแรงในสภาพแวดล้อมจำลองเพื่อทดสอบความเครียดของ Agent อย่างละเอียดถี่ถ้วนยิ่งขึ้น
Q3: ลูกค้าของ Patronus AI คือใคร?
ลูกค้าของสตาร์ทอัพรวมถึง AI lab ชั้นนำและสตาร์ทอัพที่กำลังเติบโต โดยเฉพาะผู้ที่สร้าง Agent สำหรับวิศวกรรมซอฟต์แวร์และการเงิน บริษัทวางแผนที่จะขยายไปสู่ภาคส่วนอื่นๆ ในอนาคต
บทความนี้ Patronus AI lands $50M to build 'digital worlds' that stress-test AI agents ปรากฏครั้งแรกบน BitcoinWorld

