BitcoinWorld
การลดขนาด AI ครั้งใหญ่: ทำไมโมเดลที่ถูกกว่าถึงกลายเป็นตัวเลือกที่ฉลาดที่สุดอย่างกะทันหัน
อุตสาหกรรมปัญญาประดิษฐ์ดำเนินมาอย่างยาวนานบนสมมติฐานที่เรียบง่ายแต่ทรงพลัง: โมเดลที่ใหญ่กว่าดีกว่า และโมเดลที่ดีที่สุดคือผู้ชนะ สมมติฐานนี้ได้จุดประกายการแข่งขันด้านขนาด โดยบริษัทอย่าง OpenAI และ Anthropic ทุ่มเงินหลายพันล้านไปกับการฝึกโมเดลขั้นแนวหน้าที่ใหญ่ขึ้นเรื่อยๆ แต่การเปลี่ยนแปลงอย่างเงียบๆ ที่อาจสั่นสะเทือนวงการกำลังเกิดขึ้น ต้นทุนที่พุ่งสูงกำลังบีบบังคับให้องค์กรต่างๆ ทบทวนการพึ่งพา AI ที่แพงที่สุด และยุคใหม่ของการเลือกซื้อโมเดลอย่างคำนึงถึงต้นทุนกำลังเริ่มต้นขึ้น คำถามไม่ใช่แค่เรื่องความสามารถดิบอีกต่อไป แต่เป็นเรื่องของประสิทธิภาพ และคำตอบอาจปรับเปลี่ยนเศรษฐกิจ AI ทั้งหมด
มาหลายปี วิถีทางของอุตสาหกรรม AI ถูกกำหนดโดย 'บทเรียนอันขมขื่น': การใช้ประโยชน์จากการคำนวณขนาดมหึมาเป็นเส้นทางที่แน่นอนที่สุดสู่ประสิทธิภาพที่ดีขึ้น แล็บต่างๆ แข่งขันกันด้านคุณภาพ ซึ่งหมายถึงการเลือกใช้โมเดลที่ล้ำหน้าที่สุดที่มีอยู่เป็นตัวเลือกหลัก นักลงทุนอุดหนุนต้นทุนการอินเฟอเรนซ์ที่สูง ทำให้ผู้ใช้มีแรงจูงใจน้อยมากในการประหยัด ตอนนี้ พลวัตนั้นกำลังเปลี่ยนแปลง ราคา token กำลังสูงขึ้น เงินอุดหนุนกำลังชะลอตัว และองค์กรต่างๆ กำลังรู้สึกถึงแรงกดดันด้านต้นทุนที่แท้จริงเป็นครั้งแรก การตอบสนองตามธรรมชาติคือการเริ่มมองหาทางเลือกที่ถูกกว่า
Brian Armstrong ผู้ร่วมก่อตั้ง Coinbase ได้ให้การคาดการณ์ที่ชัดเจน: ภายใน 12 ถึง 18 เดือน 80% ของเวิร์กโหลด AI จะรันบนโมเดลที่ถูกกว่าระบบขั้นแนวหน้าในปัจจุบันถึง 99% มีเพียง 20% ของงานที่เหลือเท่านั้น ซึ่งต้องการความฉลาดสูงสุด ที่จะยังคงใช้โมเดลรุ่นล่าสุด หากการคาดการณ์นี้เป็นจริง มันแสดงถึงการเปลี่ยนแปลงขั้นพื้นฐานในเศรษฐศาสตร์ของ AI เงินออมส่วนใหญ่จะมาจากกระแสรายได้ของแล็บชั้นนำอย่าง OpenAI และ Anthropic โดยตรง ซึ่งอาจส่งผลกระทบทางการเงินอย่างมีนัยสำคัญในขณะที่พวกเขากำลังจะเข้า IPO
หลักฐานเบื้องต้นชี้ให้เห็นว่าการคาดการณ์ของ Armstrong ไม่ได้เกินจริง การทดสอบล่าสุดโดยเครื่องมือ AI ทางกฎหมาย Harvey ซึ่งดำเนินการร่วมกับแพลตฟอร์มอินเฟอเรนซ์ Fireworks AI แสดงให้เห็นว่าสามารถลดต้นทุนได้สามเท่าโดยไม่สูญเสียคุณภาพ ระบบดังกล่าวกำหนดเส้นทางงานที่ง่ายกว่าอย่างชาญฉลาดไปยังโมเดลที่เล็กและถูกกว่า (GLM 5.1 ของ Fireworks) และสงวน Claude Opus ที่ทรงพลังกว่าไว้สำหรับงานทางกฎหมายที่ต้องการมากที่สุด Gabe Pereyra ผู้ร่วมก่อตั้ง Harvey ตั้งข้อสังเกตว่านิยามของคุณภาพกำลังพัฒนาจากการใช้โมเดลที่ทรงพลังที่สุดสำหรับทุกอย่าง ไปสู่การใช้โมเดลที่ดีที่สุดที่ได้คำตอบที่ถูกต้องอย่างมีประสิทธิภาพสูงสุด
สงครามต้นทุนที่กำลังเกิดขึ้นมักถูกมองว่าเป็นการต่อสู้ระหว่างโมเดลที่เป็นกรรมสิทธิ์จากแล็บในสหรัฐฯ และโมเดล open-weight จากบริษัทจีนอย่าง DeepSeek อย่างไรก็ตาม การมองแบบนี้พลาดประเด็นสำคัญ ความแตกต่างที่สำคัญคือระหว่างโมเดลขนาดใหญ่และโมเดลขนาดเล็ก บริษัทสามารถประหยัดเงินได้ด้วยการเปลี่ยนจากโมเดลขั้นแนวหน้าไปเป็นทางเลือก open-weight ที่ถูกกว่า แต่ก็สามารถประหยัดได้ในระดับเดียวกันด้วยการเปลี่ยนไปใช้เวอร์ชันที่เล็กและถูกกว่าจากแล็บเดียวกัน สงครามราคาอยู่ระหว่างการอินเฟอเรนซ์ขนาดใหญ่และการอินเฟอเรนซ์ขนาดเล็ก และสำหรับการเปลี่ยนแปลงในอุตสาหกรรมในวงกว้าง ไม่สำคัญว่าโมเดลเล็กประเภทใดจะชนะ
หากการใช้งานขององค์กรส่วนใหญ่สามารถรันได้อย่างมีประสิทธิภาพเท่ากันบนโมเดลที่เล็กและถูกกว่า มันจะยับยั้งความต้องการอินเฟอเรนซ์ที่กำลังเติบโตอย่างจริงจัง ซึ่งจะก่อให้เกิดคำถามยากๆ เกี่ยวกับวิธีการพิสูจน์ต้นทุนมหาศาลของการฝึกโมเดลขั้นแนวหน้า อุตสาหกรรมกำลังอยู่ที่ทางแยก ไม่ว่าจะยอมรับประสิทธิภาพและเสี่ยงต่อการชะลอการเติบโตของผลิตภัณฑ์ที่แพงที่สุด หรือหาวิธีใหม่ในการแสดงให้เห็นว่าต้นทุนพิเศษของโมเดลขั้นแนวหน้านั้นคุ้มค่า คำตอบจะเป็นตัวกำหนดผู้ชนะและผู้แพ้ในช่วงต่อไปของการปฏิวัติ AI
สมมติฐานพื้นฐานของอุตสาหกรรม AI กำลังถูกทดสอบ เมื่อองค์กรต่างๆ เผชิญกับแรงกดดันด้านต้นทุนที่แท้จริง การเปลี่ยนไปใช้โมเดลที่เล็กและถูกกว่าไม่ใช่แค่ความเป็นไปได้ทางทฤษฎีอีกต่อไป แต่เป็นความจำเป็นทางปฏิบัติ ผลกระทบอาจลึกซึ้ง อาจชะลอการเติบโตของรายได้ของแล็บชั้นนำและบังคับให้มีการประเมินกระบวนทัศน์การขยายขนาดทั้งหมดใหม่ เดือนข้างหน้าจะเผยให้เห็นว่าอุตสาหกรรมสามารถเรียนรู้ที่จะรักโมเดล AI ที่ถูกกว่าได้หรือไม่ หรือความต้องการปัญญาขั้นแนวหน้ายังคงไม่รู้จักพอ
Q1: ทำไมโมเดล AI ที่ถูกกว่าถึงน่าดึงดูดมากขึ้นในตอนนี้?
ราคา token ที่สูงขึ้นและการชะลอตัวของเงินอุดหนุนจากนักลงทุนกำลังสร้างแรงกดดันด้านต้นทุนที่แท้จริงให้กับองค์กรที่ใช้ AI ซึ่งบีบบังคับให้พวกเขามองหาตัวเลือกที่มีประสิทธิภาพมากขึ้นแทนที่จะเลือกโมเดลที่ทรงพลังที่สุดเป็นตัวเลือกหลัก
Q2: การใช้โมเดลที่ถูกกว่าจะหมายถึงผลลัพธ์ที่มีคุณภาพต่ำกว่าหรือไม่?
ไม่จำเป็น การทดสอบในระยะแรก เช่น การทดสอบที่ดำเนินการโดย Harvey แสดงให้เห็นว่าด้วยการกำหนดเส้นทางงานอย่างชาญฉลาด บริษัทต่างๆ สามารถบรรลุคุณภาพเดียวกันในขณะที่ลดต้นทุนได้อย่างมีนัยสำคัญ กุญแจสำคัญคือการใช้โมเดลที่เหมาะสมสำหรับงานที่เหมาะสม
Q3: การเปลี่ยนแปลงนี้จะส่งผลต่อบริษัทอย่าง OpenAI และ Anthropic อย่างไร?
การเปลี่ยนไปใช้โมเดลที่ถูกกว่าอย่างแพร่หลายอาจลดความต้องการบริการอินเฟอเรนซ์ที่แพงที่สุดของพวกเขา ซึ่งอาจส่งผลต่อรายได้ขณะที่พวกเขากำลังเตรียมตัวเข้าตลาดหลักทรัพย์ มันจะท้าทายรูปแบบธุรกิจของพวกเขา ซึ่งสร้างขึ้นบนสมมติฐานว่าลูกค้าจะจ่ายราคาพรีเมียมสำหรับปัญญาที่ดีที่สุดเท่าที่เป็นไปได้
This post The great AI downsizing: Why cheaper models are suddenly the smartest bet first appeared on BitcoinWorld.


