ซื้อคริปโต ตลาด สปอต ฟิวเจอร์สINTC Earn ศูนย์กิจกรรม

เพิ่มเติม

การศึกษาใหม่จากผู้สร้าง ChatGPT ชี้ว่าการฝึกโมเดลด้วยคุณลักษณะต่างๆ เช่น ความซื่อสัตย์ สามารถเพิ่มความปลอดภัยโดยรวมและต้านทานแรงกดดันจากฝ่ายตรงข้ามได้การศึกษาใหม่จากผู้สร้าง ChatGPT ชี้ว่าการฝึกโมเดลด้วยคุณลักษณะต่างๆ เช่น ความซื่อสัตย์ สามารถเพิ่มความปลอดภัยโดยรวมและต้านทานแรงกดดันจากฝ่ายตรงข้ามได้

OpenAI ฝึก AI ให้ซื่อสัตย์ และผลกระทบแพร่กระจายไปทุกที่

แหล่งที่มา: Yellow

2026/06/20 12:50

1 นาทีในการอ่าน

แชร์

EFFECT$0.002551+1.55%

AI$0.02605+7.15%

STAY$0.00002958+5.22%

หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ crypto.news@mexc.com

นักวิจัยที่ OpenAI กล่าวว่าการเรียนรู้แบบเสริมแรงที่มุ่งเป้าไปที่คุณลักษณะที่เป็นประโยชน์สามารถปรับปรุงพฤติกรรมของ AI ได้อย่างกว้างขวาง โดยผลลัพธ์ที่ได้แพร่กระจายไปยังโดเมนใหม่และคงความมั่นคงภายใต้แรงกดดันจากการโจมตี

การฝึกอบรมคุณลักษณะของ OpenAI

ผลการวิจัยปรากฏในบทความที่เผยแพร่เมื่อวันที่ 18 มิ.ย. โดยผู้เขียนฝ่ายติดต่อ ได้แก่ Akshay V. Jagadeesh และ Karan Singhal ซึ่งสร้างชุดข้อมูลสังเคราะห์จากบทสนทนาที่สมจริงเพื่อฝึกและวัดคุณลักษณะต่างๆ เช่น ความซื่อสัตย์ ความอ่อนน้อมถ่อมตนทางญาณวิทยา และความเปิดกว้างต่อการแก้ไข โดยสถานการณ์ต่างๆ ครอบคลุมด้านสุขภาพ การศึกษา วิทยาศาสตร์ กฎหมาย และวิศวกรรม

ทีมงานได้นำข้อมูลส่วนหนึ่งจากชุดข้อมูลดังกล่าวผสมเข้าไปในการฝึกอบรมที่กว้างขึ้น จากนั้นเปรียบเทียบผลลัพธ์กับโมเดลที่สร้างด้วยการประมวลผลที่เท่ากัน โมเดลที่ผ่านการฝึกอบรมมีประสิทธิภาพดีขึ้นใน 44 จาก 53 เกณฑ์มาตรฐานทั้งภายในและภายนอกที่วัดการหลอกลวง การแฮ็กรางวัล และคำแนะนำที่เป็นอันตราย

อ่านเพิ่มเติม: Elon Musk's SpaceX Wipes Out $600B As Record IPO Mania Cools

การปรับแนวทางที่สามารถนำไปใช้ได้กว้างขวาง

ผู้เขียนกล่าวว่าผลลัพธ์ที่สำคัญกว่าคือการสรุปความรู้ การฝึกโมเดลให้มีพฤติกรรมที่ดีในโดเมนเดียวอย่างด้านสุขภาพ ช่วยปรับปรุงคะแนนในงานที่ไม่เกี่ยวข้อง รวมถึงการหลอกลวงและการแฮ็กรางวัล นอกจากนี้ยังต้านทานพรอมต์ที่เป็นอันตรายและการปรับแต่งละเอียดที่เป็นอันตรายได้ดีกว่าโมเดลพื้นฐาน ในขณะที่ยังคงตอบสนองต่อคำขอที่ถูกต้องตามกฎหมาย

งานวิจัยนี้ต่อยอดจากผลการวิจัยก่อนหน้าที่ทีมงานเรียกว่า emergent misalignment ในงานวิจัยนั้น โมเดลที่ถูกสอนให้มีนิสัยที่ไม่ดีเพียงอย่างเดียว เช่น การเขียนโค้ดที่ไม่ปลอดภัย เริ่มแสดงพฤติกรรมที่ไม่ดีในสถานการณ์ที่ไม่เกี่ยวข้อง ซึ่งเป็นรูปแบบที่การศึกษานี้มุ่งหมายที่จะพลิกกลับ

อ่านต่อ: OpenAI Snags Gemini Co-Lead And Trump's AI Aide Pre-IPO

โอกาสทางการตลาด

ราคา Effect AI(EFFECT)

$0.002551

$0.002551$0.002551

+0.03%

USD

Effect AI (EFFECT) กราฟราคาสด

คอมโบฟุตบอลโลก: ลุ้นสูงสุด 200x

รวมการแข่งขันฟุตบอลโลกได้สูงสุด 20 คู่ในคำสั่งเดียว

ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ crypto.news@mexc.com เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC