โพสต์ Character.ai เปิดเผยเทคนิคที่มีประสิทธิภาพสำหรับการเทรนขนาดใหญ่เบื้องต้น ปรากฏบน BitcoinEthereumNews.com. Tony Kim 23 ธ.ค. 2568 21:56 Character.aiโพสต์ Character.ai เปิดเผยเทคนิคที่มีประสิทธิภาพสำหรับการเทรนขนาดใหญ่เบื้องต้น ปรากฏบน BitcoinEthereumNews.com. Tony Kim 23 ธ.ค. 2568 21:56 Character.ai

Character.ai เปิดเผยเทคนิคที่มีประสิทธิภาพสำหรับการฝึกอบรมล่วงหน้าขนาดใหญ่

2025/12/24 14:41
1 นาทีในการอ่าน
หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ crypto.news@mexc.com


Tony Kim
23 ธ.ค. 2568 21:56

Character.ai เปิดเผยวิธีการใหม่ในการเพิ่มประสิทธิภาพการฝึกอบรมขนาดใหญ่ โดยเน้นเทคนิคอย่าง Squinch, dynamic clamping และ Gumbel Softmax เพื่อเพิ่มประสิทธิภาพในการฝึกอบรมโมเดล AI

Character.ai ซึ่งเป็นผู้เล่นที่มีชื่อเสียงในพื้นที่ AI เพิ่งแบ่งปันข้อมูลเชิงลึกเกี่ยวกับความพยายามในช่วงแรกในการเพิ่มประสิทธิภาพการฝึกอบรม transformer ขนาดใหญ่ บริษัทซึ่งได้เปลี่ยนโฟกัสไปที่โมเดลโอเพนซอร์สในเวลาต่อมา เดิมได้สำรวจเทคนิคต่างๆ เพื่อเพิ่มประสิทธิภาพและความเร็วในการฝึกอบรม ตามที่ระบุไว้ใน Character.AI Blog

การบีบอัดแกรเดียนต์: Squinch

หนึ่งในนวัตกรรมหลักที่เน้นในความพยายามของ Character.ai คืออัลกอริทึมการบีบอัดแกรเดียนต์ที่เรียกว่า Squinch พัฒนาโดยผู้ร่วมก่อตั้ง Noam Shazeer เทคนิคการบีบอัด 6 บิตนี้ได้รับการออกแบบมาเพื่อลดแบนด์วิธการสื่อสารอย่างมากระหว่างการฝึกอบรมแบบกระจาย ในขณะเดียวกันก็รักษาความแม่นยำของโมเดล อัลกอริทึมบีบอัดแกรเดียนต์อย่างมีประสิทธิภาพเป็น 6 บิตต่อองค์ประกอบ เพิ่มประสิทธิภาพการใช้แบนด์วิธของคลัสเตอร์การฝึกอบรม

การปรับค่าความแม่นยำ: Attention Z-Reg

Character.ai ยังได้พัฒนา Attention Z-Reg ซึ่งเป็นวิธีการปรับค่าที่ใช้กับ attention logits เพื่อให้แน่ใจว่ามีเสถียรภาพเชิงตัวเลข เทคนิคนี้ช่วยรักษาความแม่นยำของการแสดง bfloat16 ซึ่งมีความสำคัญต่อการเพิ่มประสิทธิภาพการฝึกอบรมโมเดลขนาดใหญ่

เสถียรภาพการควอนไทซ์: Dynamic Clamping

Dynamic Clamping เป็นอีกหนึ่งเทคนิคที่ใช้เพื่อเพิ่มเสถียรภาพของการควอนไทซ์ มันป้องกันไม่ให้ค่าการกระตุ้นขนาดเล็กยุบลงเป็นศูนย์โดยการคำนวณช่วง clamping แบบไดนามิกตามค่ารากที่สองของค่าเฉลี่ยกำลังสองของน้ำหนักอินพุต วิธีนี้ปรับปรุงเสถียรภาพการฝึกอบรมโดยการลดข้อผิดพลาดในการควอนไทซ์

Attention API ที่มีประสิทธิภาพ: Visibility Mask

การแนะนำ Visibility Mask ซึ่งเป็นเครื่องมือสำหรับแสดงความสัมพันธ์ระหว่างโทเค็นระหว่างการฝึกอบรมและการอนุมาน ได้ปรับปรุงประสิทธิภาพของระบบการฝึกอบรม API นี้ช่วยจัดการช่วง attention ภายในแบตช์ รองรับความสัมพันธ์เอกสารแบบโครงสร้างต้นไม้และ bidirectional attention

การเพิ่มประสิทธิภาพการกลั่น: Gumbel Softmax

ในด้านการกลั่นโมเดล Character.ai ได้ใช้ประโยชน์จากเทคนิค Gumbel Softmax เพื่อลดต้นทุนการจัดเก็บและแบนด์วิธในขณะที่รักษาความถูกต้องของโมเดลครู แนวทางนี้เกี่ยวข้องกับการสุ่มตัวอย่างชุดย่อยของผลลัพธ์โมเดลครู โดยรักษาค่าเป้าหมายแบบนิ่มไว้เพื่อการฝึกอบรมโมเดลนักเรียนที่มีประสิทธิภาพมากขึ้น

ความพยายามของ Character.ai ในการเพิ่มประสิทธิภาพการฝึกอบรมล่วงหน้าได้ปูทางไปสู่การฝึกอบรมโมเดล AI ที่มีประสิทธิภาพมากขึ้น แม้ว่าบริษัทจะเปลี่ยนไปใช้การเรียนรู้เสริมแรงหลังการฝึกอบรมสำหรับโมเดลโอเพนซอร์ส เทคนิคเหล่านี้รวมถึง Squinch และ Gumbel Softmax เน้นย้ำถึงความมุ่งมั่นของบริษัทในการพัฒนาประสิทธิภาพและความสามารถในการขยายขนาดของ AI

แหล่งที่มาของภาพ: Shutterstock

แหล่งที่มา: https://blockchain.news/news/character-ai-unveils-efficient-techniques-for-large-scale-pretraining

โอกาสทางการตลาด
Sleepless AI โลโก้
ราคา Sleepless AI(SLEEPLESSAI)
$0.01799
$0.01799$0.01799
+1.29%
USD
Sleepless AI (SLEEPLESSAI) กราฟราคาสด
ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ crypto.news@mexc.com เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC

คุณอาจชอบเช่นกัน

XAG/USD ดิ่งต่ำกว่า $72 ท่ามกลางความสนใจที่มุ่งไปยังสงครามของอิหร่าน

XAG/USD ดิ่งต่ำกว่า $72 ท่ามกลางความสนใจที่มุ่งไปยังสงครามของอิหร่าน

โพสต์ XAG/USD ลดลงต่ำกว่า $72 โดยทุกสายตาจับจ้องสงครามของอิหร่าน ปรากฏบน BitcoinEthereumNews.com เงิน (XAG/USD) กำลังแสดงโมเมนตัมขาลงเล็กน้อยในวันอังคาร
แชร์
BitcoinEthereumNews2026/04/07 20:32
ความตึงเครียดในตลาดพลังงานเป็นสาเหตุที่น่ากังวลต่อเสถียรภาพทางการเงิน

ความตึงเครียดในตลาดพลังงานเป็นสาเหตุที่น่ากังวลต่อเสถียรภาพทางการเงิน

โพสต์เรื่อง ความตึงเครียดในตลาดพลังงานเป็นสาเหตุที่น่ากังวลต่อเสถียรภาพทางการเงิน ปรากฏบน BitcoinEthereumNews.com คณะกรรมการบริหารธนาคารกลางยุโรป (ECB)
แชร์
BitcoinEthereumNews2026/04/02 17:46
เหรียญคริปโตชั้นนำที่ควรจับตามองในปี 2026 หลังจากพลาด Dogecoin

เหรียญคริปโตชั้นนำที่ควรจับตามองในปี 2026 หลังจากพลาด Dogecoin

ลืมการเลื่อนดูกราฟที่ไม่มีความเคลื่อนไหวไปได้เลย นักลงทุนที่ประสบความสำเร็จมากที่สุดในปัจจุบันกำลังหันมาสนใจโครงการที่ผสมผสานความน่าสนใจที่แพร่ระบาดกับประสิทธิภาพสูง
แชร์
Techbullion2026/04/07 21:30

ข่าวสดตลอด 24/7

มากกว่า

PRL $30,000 + 15,000 USDT

PRL $30,000 + 15,000 USDTPRL $30,000 + 15,000 USDT

ฝาก & เทรด PRL เพื่อเพิ่มรางวัลของคุณ!