แผนก Google ของ Alphabet เปิดตัวโปรเซสเซอร์ปัญญาประดิษฐ์เฉพาะทางสองตัวในวันพุธ นับเป็นครั้งแรกที่สถาปัตยกรรมหน่วยประมวลผลเทนเซอร์ถูกแยกออกเป็นชิปแยกต่างหากสำหรับการฝึกสอนและการ Inference
TPU 8t ได้รับการออกแบบมาโดยเฉพาะสำหรับการฝึกสอนโมเดล AI ในขณะที่คู่แฝด TPU 8i มุ่งเน้นเฉพาะการ Inference ซึ่งเป็นกระบวนการนำโมเดลที่ฝึกสอนแล้วไปใช้งานจริง Broadcom ทำหน้าที่เป็นพาร์ทเนอร์ร่วมพัฒนา ต่อยอดความร่วมมือที่ดำเนินมากว่าสิบปี
Alphabet Inc., GOOGL
นี่ถือเป็นการเปลี่ยนแปลงเชิงกลยุทธ์จากแนวทางก่อนหน้า TPU รุ่นก่อนๆ รวมความสามารถทั้งการฝึกสอนและการ Inference ไว้ในโปรเซสเซอร์เดียว Google อธิบายว่าการเปลี่ยนแปลงนี้เกิดจากการเติบโตของระบบ Agentic AI ซึ่งเป็นโมเดลอัตโนมัติที่ทำงานในลูปป้อนกลับต่อเนื่องโดยมีการดูแลจากมนุษย์น้อยที่สุด ซึ่งต้องการซิลิคอนที่ออกแบบมาเพื่อวัตถุประสงค์เฉพาะมากขึ้น
TPU 8i ที่มุ่งเน้นการ Inference บรรจุ SRAM ขนาด 384 เมกะไบต์ต่อโปรเซสเซอร์ ซึ่งมากกว่า Ironwood ถึงสามเท่า ตามที่ Google ระบุ การปรับปรุงสถาปัตยกรรมนี้ช่วยขจัดคอขวด "ห้องรอ" ลดการพุ่งสูงของเวลาแฝงที่เกิดขึ้นเมื่อผู้ใช้หลายคนสืบค้นโมเดลพร้อมกัน
เมื่อเทียบกับ Ironwood TPU 8i บรรลุประสิทธิภาพด้านต้นทุนที่ดีขึ้น 80% ในแง่การดำเนินงาน องค์กรสามารถรองรับความต้องการของผู้ใช้ได้เกือบสองเท่าโดยไม่ต้องเพิ่มงบประมาณ
ชิปยังแสดงให้เห็นถึงประสิทธิภาพพลังงานต่อวัตต์ที่ดีขึ้นสูงสุดถึง 2 เท่า โดยใช้เทคโนโลยีการจัดการพลังงานแบบไดนามิกที่ปรับการใช้พลังงานตามความต้องการของงานแบบเรียลไทม์
เป็นครั้งแรกที่โปรเซสเซอร์ทั้งสองใช้ Axion CPU ของ Google เป็นโฮสต์โปรเซสเซอร์ ช่วยให้สามารถปรับแต่งระดับสถาปัตยกรรมระบบ แทนที่จะจำกัดการปรับปรุงไว้เพียงประสิทธิภาพของชิปแต่ละตัว
ในด้านความสามารถการฝึกสอน การกำหนดค่า Superpod ของ TPU 8t รองรับคลัสเตอร์ได้ถึง 9,600 โปรเซสเซอร์พร้อมหน่วยความจำแบนด์วิดท์สูง 2 เพตาไบต์ ซึ่งเป็นแบนด์วิดท์การสื่อสารระหว่างชิปเป็นสองเท่าของ Ironwood และ Google อ้างว่าสามารถย่นระยะเวลาการพัฒนาโมเดล Frontier จากเดือนเหลือเพียงไม่กี่สัปดาห์
โปรเซสเซอร์ฝึกสอนมอบประสิทธิภาพการคำนวณ 2.8 เท่าของสถาปัตยกรรม Ironwood รุ่นที่เจ็ดในราคาเทียบเท่า
การนำไปใช้งานในยุคแรกกำลังได้รับแรงผลักดัน Citadel Securities พัฒนาแพลตฟอร์มวิจัยเชิงปริมาณโดยใช้โครงสร้างพื้นฐาน TPU ของ Google ห้องปฏิบัติการแห่งชาติของกระทรวงพลังงานสหรัฐอเมริกาทั้งสิบเจ็ดแห่งดำเนินแอปพลิเคชัน AI co-scientist บนโปรเซสเซอร์เหล่านี้ Anthropic ให้คำมั่นที่จะใช้ความสามารถการคำนวณ Google TPU หลายกิกะวัตต์
นักวิเคราะห์ของ DA Davidson คาดการณ์ในเดือนกันยายนว่าแผนก TPU ของ Google เมื่อรวมกับ Google DeepMind อาจมีมูลค่าเข้าใกล้ 9 แสนล้านดอลลาร์
Google ใช้โมเดลการจัดจำหน่ายแบบเอกสิทธิ์สำหรับ TPU โดยไม่สามารถซื้อได้โดยตรงและเข้าถึงได้เฉพาะผ่านบริการ Google Cloud เท่านั้น Nvidia ยังคงจัดหาฮาร์ดแวร์ GPU ให้กับ Google และบริษัทยืนยันว่าจะเป็นหนึ่งในผู้ให้บริการคลาวด์รายแรกที่นำเสนอแพลตฟอร์ม Vera Rubin ที่กำลังจะมาถึงของ Nvidia เมื่อเปิดตัวในช่วงปลายปีนี้
โปรเซสเซอร์เหล่านี้ออกแบบด้วยความร่วมมืออย่างใกล้ชิดกับ Google DeepMind ซึ่งนำไปใช้ฝึกสอนโมเดลภาษา Gemini และปรับแต่งอัลกอริทึมที่ขับเคลื่อนแพลตฟอร์ม Search และ YouTube
Google ประกาศว่าทั้ง TPU 8t และ TPU 8i จะพร้อมให้บริการทั่วไปสำหรับลูกค้าแพลตฟอร์มคลาวด์ในช่วงปลายปี 2025
The post Alphabet (GOOGL) Unveils Dual-Purpose 8th-Gen TPU Chips Developed With Broadcom appeared first on Blockonomi.


