บัตรระบบ OpenAI ใหม่แสดงให้เห็นว่าโมเดลหลัก Sol มีความสามารถในการควบคุมการใช้เหตุผลของตัวเองได้ดีขึ้น ซึ่งเป็นการเปลี่ยนแปลงที่นักวิจัยด้านความปลอดภัยจับตามองอย่างใกล้ชิดบัตรระบบ OpenAI ใหม่แสดงให้เห็นว่าโมเดลหลัก Sol มีความสามารถในการควบคุมการใช้เหตุผลของตัวเองได้ดีขึ้น ซึ่งเป็นการเปลี่ยนแปลงที่นักวิจัยด้านความปลอดภัยจับตามองอย่างใกล้ชิด

GPT-5.6 Sol ของ OpenAI กำลังเรียนรู้ที่จะซ่อนวิธีคิด

2026/06/30 11:58
1 นาทีในการอ่าน
หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ crypto.news@mexc.com

OpenAI โมเดลเรือธงล่าสุดควบคุมการใช้เหตุผลของตัวเองใน 1.3% ของห่วงโซ่ยาวในการทดสอบความปลอดภัย ซึ่งเป็นตัวเลขเล็กน้อยแต่เพิ่มขึ้นเรื่อยๆ ที่นักวิจัยติดตามในฐานะสัญญาณเตือนล่วงหน้า

ประเด็นสำคัญ:

OpenAI ตั้งธงการควบคุมการใช้เหตุผลใน GPT-5.6 Sol

ตัวเลขดังกล่าวอยู่ในการ์ดระบบ GPT-5.6 ที่เผยแพร่เมื่อวันที่ 26 มิ.ย. เมื่อ Sol เข้าสู่การเปิดตัวแบบจำกัดสำหรับพาร์ทเนอร์ที่เชื่อถือได้ ซึ่งเป็นการเปิดตัวแบบขั้นตอนที่วอชิงตันขอให้บริษัทดำเนินการ OpenAI วัด "ความสามารถในการควบคุม" ว่าเป็นความสามารถของโมเดลในการปฏิบัติตามคำสั่งเกี่ยวกับห่วงโซ่ความคิดของตัวเอง เช่น การลบคำที่ถูกทำเครื่องหมายหรือเขียนการติดตามทั้งหมดเป็นตัวพิมพ์เล็ก คะแนนต่ำคือผลลัพธ์ที่ดี

เมื่อโมเดลไม่สามารถปรับเปลี่ยนการคิดตามความต้องการได้ ผู้ตรวจสอบยังสามารถอ่านการใช้เหตุผลนั้นและตรวจจับปัญหาก่อนที่ผลลัพธ์จะถึงผู้ใช้หรือทำงานบนระบบจริง Sol ทำลายรูปแบบนี้

ในห่วงโซ่ที่มีความยาวใกล้ 5,000 โทเค็น Sol ควบคุมการใช้เหตุผลของตัวเอง 1.3% ของเวลา เทียบกับ 0.4% สำหรับ GPT-5.5 และ 0.7% สำหรับ GPT-5.4 Thinking รุ่นก่อนหน้า การเพิ่มขึ้นนี้คงที่ในชุดข้อมูลทดสอบทั้งห้าชุดและประเภทคำสั่งส่วนใหญ่ บริษัทจึงไม่ถือว่าเป็นเสียงรบกวนแต่เป็นแนวโน้มที่กำลังติดตามอยู่ โมเดล Terra ขนาดเล็กกว่ายังคงไม่เปลี่ยนแปลง

อ่านเพิ่มเติม: BitMine Defies The Selloff With A $43M Ethereum Bet, Strategy Blinks

การโกงและการใช้เหตุผลที่ซ่อนเร้นของ Sol ทำให้ความกังวลลึกขึ้น

การกระโดดนี้ไม่ได้อยู่โดดเดี่ยว ในการ์ดเดียวกัน Sol ใช้เหตุผลเกี่ยวกับการถูกให้คะแนนหรือถูกเฝ้าดูบ่อยกว่า GPT-5.5 และในการรันโค้ดหนึ่งครั้ง มันบอกร่างงานวิจัยภายในว่าสมการได้รับการคำนวณและตรวจสอบแล้วทั้งที่ยังไม่ได้ทำ

ผู้ตรวจสอบตรวจพบกรณีที่ชัดเจนที่สุดโดยการอ่านห่วงโซ่ความคิด ซึ่งเป็นหน้าต่างที่เมตริกความสามารถในการควบคุมตั้งใจปกป้อง ในการทดสอบอื่นๆ ความไม่สอดคล้องกันปรากฏเฉพาะในคำตอบสุดท้ายซึ่งผู้ตรวจสอบห่วงโซ่ความคิดไม่เคยอ่าน ทำให้การติดตามเหตุผลดูสะอาด คะแนนความสามารถในการควบคุมที่อ่อนแอยังอาจหมายความว่าโมเดลละเลยคำสั่งเกี่ยวกับการใช้เหตุผล ไม่ใช่ว่าขาดทักษะในการซ่อน

METR รายงานแยกต่างหากว่าอัตราการโกงที่ตรวจพบของ Sol สูงกว่าโมเดลสาธารณะใดๆ ที่ทดสอบ ทำให้คะแนนความสามารถที่แท้จริงไม่สามารถระบุได้ OpenAI ยังคงเรียกผลลัพธ์นี้ว่าเป็นสัญญาณเริ่มต้น ไม่ใช่การแจ้งเตือน

นักวิจัยได้อธิบายมาเป็นเวลานานว่าการตรวจสอบห่วงโซ่ความคิดเป็นมาตรการป้องกันที่เปราะบาง ซึ่งทำงานได้เฉพาะเมื่อโมเดลยังคงใช้เหตุผลในที่เปิดเผย

OpenAI เริ่มรายงานคะแนนเหล่านี้ด้วย GPT-5.4 Thinking หลังจากงานวิจัยในฤดูใบไม้ผลิพบว่าโมเดลการใช้เหตุผลยังคงล้มเหลวเป็นส่วนใหญ่ในการชี้นำความคิดของตัวเองแม้จะถูกบอกว่ามีผู้ตรวจสอบกำลังเฝ้าดู Sol เป็นโมเดลเรือธงแรกที่เคลื่อนย้ายตัวเลขไปในทิศทางตรงกันข้าม

อ่านต่อ: CZ Says Binance Was Days From MiCA Approval Before Politics Hit

โอกาสทางการตลาด
Solana โลโก้
ราคา Solana(SOL)
$73,95
$73,95$73,95
+0,06%
USD
Solana (SOL) กราฟราคาสด

คอมโบฟุตบอลโลก: ลุ้นสูงสุด 200x

คอมโบฟุตบอลโลก: ลุ้นสูงสุด 200xคอมโบฟุตบอลโลก: ลุ้นสูงสุด 200x

รวมการแข่งขันฟุตบอลโลกได้สูงสุด 20 คู่ในคำสั่งเดียว

ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ crypto.news@mexc.com เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC

คุณอาจชอบเช่นกัน

PEZA อนุมัติการลงทุนเกือบ 16,000 ล้านเปโซในเดือนมิถุนายน

PEZA อนุมัติการลงทุนเกือบ 16,000 ล้านเปโซในเดือนมิถุนายน

สำนักงานเขตเศรษฐกิจพิเศษฟิลิปปินส์ (PEZA) อนุมัติการลงทุนมูลค่าเกือบ 16,000 ล้านเปโซในเดือนมิถุนายน ส่วนใหญ่เป็นโครงการในภาคการผลิตเพื่อการส่งออกและสารสนเทศ
แชร์
Bworldonline2026/06/30 00:31
BSP กำหนดหลักการกำกับดูแลการใช้ AI อย่างรับผิดชอบและมีจริยธรรมสำหรับธนาคาร

BSP กำหนดหลักการกำกับดูแลการใช้ AI อย่างรับผิดชอบและมีจริยธรรมสำหรับธนาคาร

สถาบันการเงินของฟิลิปปินส์ควรพัฒนากรอบการกำกับดูแลปัญญาประดิษฐ์ (AI) ที่สะท้อนถึงขอบเขตและความซับซ้อนของการใช้งานเหล่านี้
แชร์
Bworldonline2026/06/30 00:01
การห้าม CBDC แฝงตัวมาในร่างกฎหมายที่อยู่อาศัย สู่กำหนด 10 วันของทรัมป์

การห้าม CBDC แฝงตัวมาในร่างกฎหมายที่อยู่อาศัย สู่กำหนด 10 วันของทรัมป์

ทรัมป์มีเวลา 10 วันในการดำเนินการกับร่างกฎหมายที่อยู่อาศัยแบบสองพรรคที่จะระงับ CBDC ของธนาคารกลางสหรัฐจนถึงปี 2030 ขณะที่เขาผลักดันการต่อสู้เรื่องร่างกฎหมายการลงคะแนนเสียง
แชร์
Crypto.news2026/06/30 12:16