OpenAI ไม่พอใจกับชิป AI ของ Nvidia อีกต่อไป โดยเฉพาะอย่างยิ่งเมื่อพูดถึงความเร็วในการตอบสนองผู้ใช้ บริษัทเริ่มมองหาทางเลือกอื่นเมื่อปีที่แล้ว และตอนนี้กำลังเจรจากับ AMD, Cerebras และเคยเจรจากับ Groq ก่อนที่จะถูกยกเลิก
ความตึงเครียดนี้เริ่มชัดเจนขึ้นเมื่อ OpenAI ตระหนักว่าชิปของ Nvidia ไม่เร็วพอสำหรับงานเฉพาะ เช่น การเขียนโค้ดและการจัดการงานระหว่างซอฟต์แวร์
แหล่งข่าวภายในกล่าวว่า OpenAI ต้องการชิปใหม่เพื่อจัดการอย่างน้อย 10% ของความต้องการด้าน inference ในอนาคต นั่นคือส่วนที่ AI ตอบกลับผู้ใช้ ไม่ใช่ส่วนที่เรียนรู้
งานส่วนใหญ่ของ OpenAI ยังคงทำงานบน Nvidia แต่เบื้องหลังกำลังทดสอบชิปที่สามารถทำให้ทุกอย่างเร็วขึ้น
ซึ่งรวมถึงชิปที่มี SRAM ซึ่งช่วยเพิ่มความเร็วโดยการวางหน่วยความจำไว้ติดกับโปรเซสเซอร์ Nvidia และ AMD ยังคงใช้หน่วยความจำที่อยู่นอกชิป ซึ่งทำให้ช้าลง
บุคลากรภายใน OpenAI ชี้ไปที่ Codex เครื่องมือที่เขียนโค้ด ว่าเป็นจุดที่ความช้าเป็นปัญหาใหญ่ที่สุด พนักงานบางคนยังโทษประสิทธิภาพที่อ่อนแอกับฮาร์ดแวร์ของ Nvidia ในการแถลงข่าวเมื่อวันที่ 30 มกราคม Sam Altman ซีอีโอของ OpenAI กล่าวว่า "ลูกค้าที่ใช้โมเดลการเขียนโค้ดของเราจะให้ความสำคัญกับความเร็วในการทำงานด้านโค้ดเป็นอย่างมาก"
Sam เสริมว่าผู้ใช้ ChatGPT ทั่วไปไม่ได้ใส่ใจเรื่องความเร็วมากนัก แต่สำหรับนักพัฒนาและบริษัท ทุกวินาทีมีความสำคัญ เขากล่าวว่า OpenAI เพิ่งลงนามข้อตกลงกับ Cerebras เพื่อช่วยเพิ่มความเร็ว
ในขณะเดียวกัน บริษัทอย่าง Anthropic และ Google กำลังได้ผลลัพธ์ที่ดีขึ้นโดยใช้ชิปของตัวเอง TPU ของ Google ถูกสร้างขึ้นโดยเฉพาะสำหรับงานที่ inference ต้องการ ทำให้ตอบสนองได้เร็วขึ้น โดยเฉพาะสำหรับโมเดลอย่าง Claude และ Gemini
OpenAI ยังเจรจากับ Groq สตาร์ทอัพอีกแห่งที่สร้างชิปความเร็วสูง แต่การสนทนานั้นไม่ได้ไปไกล Nvidia เข้ามาและลงนามข้อตกลงใบอนุญาตมูลค่า 20 พันล้านดอลลาร์กับ Groq ทำให้ Nvidia เข้าถึงการออกแบบของ Groq และทำลายแผนการทำงานร่วมกันของ OpenAI
แหล่งข่าวที่ใกล้ชิดกับสถานการณ์กล่าวว่าชิปของ Groq ถูกสร้างขึ้นมาตรงกับสิ่งที่ OpenAI ต้องการ แต่เมื่อ Nvidia ล็อกข้อตกลงไว้ ประตูก็ปิด แม้ว่าใบอนุญาตจะไม่เป็นเอกสิทธิ์ Groq ตอนนี้มุ่งเน้นไปที่ซอฟต์แวร์บนคลาวด์ และ Nvidia รับนักออกแบบชิปบางคนของ Groq ไปเอง
ในทางกลับกัน Cerebras ปฏิเสธเมื่อ Nvidia พยายามซื้อพวกเขา แต่พวกเขาก็ไปทำข้อตกลงกับ OpenAI เอง Groq ยังได้รับข้อเสนอการลงทุนที่ประเมินมูลค่าประมาณ 14 พันล้านดอลลาร์ แต่ตอนนี้สถานการณ์เปลี่ยนไปเพราะผูกพันกับ Nvidia
OpenAI ยังไม่ได้เลิกใช้ Nvidia โดยสิ้นเชิง ในแถลงการณ์สาธารณะ โฆษกกล่าวว่า "เราพึ่งพา Nvidia ในการขับเคลื่อนกลุ่ม inference ส่วนใหญ่ของเรา" และเรียกประสิทธิภาพต่อดอลลาร์ของพวกเขาว่าดีที่สุดในตลาด Nvidia ยังกล่าวว่า "ลูกค้ายังคงเลือก Nvidia สำหรับ inference เพราะเรามอบประสิทธิภาพและต้นทุนการเป็นเจ้าของโดยรวมที่ดีที่สุดในระดับขนาดใหญ่"
เมื่อปีที่แล้ว Nvidia กล่าวว่าวางแผนลงทุนสูงสุด 100 พันล้านดอลลาร์ใน OpenAI เงินทุนนั้นมีไว้เพื่อช่วย OpenAI ซื้อชิปที่ทันสมัยกว่า และเพื่อเป็นการตอบแทน Nvidia จะได้หุ้นในบริษัท Reuters กล่าวว่าข้อตกลงควรปิดภายในไม่กี่สัปดาห์ แต่ยังไม่เกิดขึ้น
ในขณะที่ข้อตกลงนั้นหยุดชะงัก OpenAI ก็ไปลงนามข้อตกลงกับ AMD และบริษัทอื่นๆ เพื่อทดสอบชิปที่สามารถแข่งขันกับ Nvidia ได้โดยตรง แต่เมื่อ OpenAI เปลี่ยนแผนผลิตภัณฑ์ ประเภทของฮาร์ดแวร์ที่ต้องการก็เปลี่ยนไปด้วย ทำให้การเจรจาช้าลงอีก ตามคำกล่าวของผู้รู้เห็นสถานการณ์
ในวันเสาร์ Jensen Huang ซีอีโอของ Nvidia ถูกถามเกี่ยวกับความขัดแย้ง เขากล่าวว่า "นั่นเป็นเรื่องไร้สาระ" และยืนยันว่า Nvidia ยังคงวางแผนลงทุนใหญ่ใน OpenAI แต่เบื้องหลังชัดเจนว่าทั้งสองฝ่ายกำลังสำรวจตัวเลือก
ในขณะเดียวกัน Nvidia กำลังมองหาไอเดียชิปใหม่ เข้าติดต่อทั้ง Cerebras และ Groq เพื่อดูว่าพวกเขาเปิดกว้างต่อการถูกซื้อหรือไม่ Cerebras ปฏิเสธและเพิ่มความมุ่งมั่นในข้อตกลงกับ OpenAI
ตอนนี้ OpenAI ใช้ GPT4o ขับเคลื่อนบริการส่วนใหญ่ แต่จากแนวโน้ม อย่างน้อยบางส่วนของงานนั้นจะทำงานบนชิปจาก AMD หรือ Cerebras ในอนาคตอันใกล้ บริษัทไม่ได้พยายามละทิ้ง Nvidia โดยสิ้นเชิง แต่ชัดเจนว่าต้องการควบคุมความเร็วการทำงานของระบบมากขึ้น
เพิ่มพูนกลยุทธ์ของคุณด้วยการให้คำปรึกษา + ไอเดียรายวัน - เข้าถึงโปรแกรมเทรดของเราฟรี 30 วัน

