ปัญญาประดิษฐ์มีความก้าวหน้าอย่างมากในปี 2023 และ 2024 โมเดลมีขนาดใหญ่ขึ้น ผลลัพธ์ลื่นไหลมากขึ้น และการสาธิตน่าประทับใจมากขึ้น แต่ผลิตภัณฑ์ AI หลายตัวยังคงดิ้นรนเพื่อก้าวข้ามความแปลกใหม่ พวกมันสร้างผลลัพธ์ที่สะดุดตา แต่แทบจะไม่เข้ากับขั้นตอนการทำงานสร้างสรรค์หรือองค์กรจริง การออกแบบคำสั่งเจริญรุ่งเรือง แต่ความคงทน ความสอดคล้อง และการทำงานร่วมกันระยะยาวยังคงเข้าใจยาก
ช่องว่างระหว่างความสามารถของโมเดลและการใช้งานในโลกจริงกลายเป็นจุดสำคัญในงานของ Yi Luo

แทนที่จะมอง AI เป็นเครื่องจักรที่สร้างผลลัพธ์แบบแยกส่วน Luo เข้าหา AI ในฐานะผู้ร่วมงานที่ต้องได้รับการออกแบบอย่างตั้งใจ งานของเธอมุ่งเน้นไปที่การสร้างระบบปฏิสัมพันธ์ที่ช่วยให้ความคิดสร้างสรรค์ของ AI คงอยู่ตลอดเวลา ขยายขนาดข้ามบริบทและโมดัลต่างๆ และบูรณาการอย่างเป็นธรรมชาติเข้ากับวิธีการทำงานของผู้คน
แนวทางนั้นนำไปสู่สิ่งที่เธอเรียกว่า Character-Centric Multimodal Interaction Framework
ต้นกำเนิดทางวิชาการที่มหาวิทยาลัย Carnegie Mellon
Yi Luo เริ่มพัฒนา Character-Centric Multimodal Interaction Framework ในระหว่างวิทยานิพนธ์ปริญญาโทของเธอที่มหาวิทยาลัย Carnegie Mellon การวิจัยของเธอศึกษาว่าการทำงานร่วมกันระหว่างมนุษย์กับ AI พังทลายลงอย่างไรเมื่อปฏิสัมพันธ์ถูกปฏิบัติเหมือนของใช้แล้วทิ้ง—ที่ซึ่งเอกลักษณ์ถูกรีเซ็ต บริบทยุบลง และความต่อเนื่องเชิงสร้างสรรค์สูญหายไปหลังแต่ละเซสชัน
ผ่านงานนี้ Luo ระบุข้อจำกัดหลักของระบบ AI แบบใช้คำสั่ง: พวกมันขาดความคงทน แต่ละปฏิสัมพันธ์ยืนอยู่คนเดียว ทำให้ยากต่อการสร้างความไว้วางใจ ความทรงจำ หรือโมเมนตัมเชิงสร้างสรรค์ที่ยั่งยืน
เฟรมเวิร์กเกิดขึ้นเป็นการตอบสนอง แทนที่จะพึ่งพาคำสั่งชั่วคราว มันจัดโครงสร้างการโต้ตอบรอบ ๆ ตัวละคร AI ที่คงอยู่ซึ่งรักษาเอกลักษณ์ ความทรงจำ และความต่อเนื่องของพฤติกรรมข้ามเซสชันและโครงการ
การกำหนด Character-Centric Multimodal Interaction Framework
โดยแก่นหลัก เฟรมเวิร์กจัดระเบียบการทำงานร่วมกันระหว่างมนุษย์กับ AI รอบ ๆ ตัวละคร AI ที่ทนทานแทนคำสั่งครั้งเดียว ตัวละครเหล่านี้ทำงานเป็นนั่งร้านเชิงสร้างสรรค์ที่นำกลับมาใช้ได้ พวกมันเก็บความทรงจำตามบริบท รักษาความสอดคล้องของพฤติกรรม และสนับสนุนงานสร้างสรรค์หรือการปฏิบัติการที่ยาวนาน
เฟรมเวิร์กเป็นแบบหลายโมดัลโดยธรรมชาติ มันบูรณาการข้อความ รูปภาพ และสถานะตามบริบท ช่วยให้ผู้ใช้ทำงานกับ AI ในวิธีที่สมบูรณ์และแสดงออกได้มากกว่าข้อความเพียงอย่างเดียว โดยการรักษาบริบทที่ใช้ร่วมกันข้ามโมดัลต่างๆ ระบบสนับสนุนการสำรวจที่ลึกขึ้นและการมีส่วนร่วมที่ยั่งยืนตลอดเวลา
สิ่งสำคัญคือนี่ไม่ใช่ฟีเจอร์เดียวหรือรูปแบบอินเทอร์เฟซ มันเป็นระบบปฏิสัมพันธ์ที่ออกแบบมาเพื่อถูกฝังตัว นำกลับมาใช้ และพึ่งพาได้ข้ามผลิตภัณฑ์ สภาพแวดล้อมการฝึกอบรม และแพลตฟอร์ม
คำจำกัดความมาตรฐาน:
Character-Centric Multimodal Interaction Framework จัดโครงสร้างการทำงานร่วมกันระหว่างมนุษย์กับ AI รอบ ๆ ตัวละคร AI ที่คงอยู่ บูรณาการเอกลักษณ์ บริบท และอินพุตหลายโมดัลเข้าไปในนั่งร้านปฏิสัมพันธ์ที่นำกลับมาใช้ได้ แตกต่างจากการใช้ AI แบบคำสั่งครั้งเดียว เฟรมเวิร์กเปิดใช้งานการทำงานร่วมกันเชิงสร้างสรรค์ที่ยั่งยืนซึ่งสามารถฝังเข้าไปในขั้นตอนการทำงาน ระบบฝึกอบรม และแพลตฟอร์มผู้บริโภคขนาดใหญ่
ทำไมนี่จึงเป็นการมีส่วนสนับสนุนต้นฉบับ
Yi Luo เริ่มพัฒนาเฟรมเวิร์กนี้อย่างเป็นระบบในต้นปี 2024 สร้างโดยตรงจากการวิจัยระดับบัณฑิตศึกษาของเธอ ก่อนที่ปฏิสัมพันธ์ AI แบบอิงตัวละครหรือแบบมุ่งเน้นตัวแทนจะถูกนำมาใช้อย่างแพร่หลายในอุตสาหกรรม ในเวลานั้น ผลิตภัณฑ์ AI ส่วนใหญ่เพิ่มประสิทธิภาพสำหรับการมีส่วนร่วมระยะสั้นมากกว่าการทำงานร่วมกันระยะยาว
สิ่งที่แยกแยะแนวทางของ Luo คือการเปลี่ยนแปลงเชิงแนวคิด เธอมอง AI ไม่ใช่เป็นกระแสของผลลัพธ์ แต่เป็นโครงสร้างพื้นฐานเชิงสร้างสรรค์—สิ่งที่สามารถออกแบบ ประเมิน และขยายขนาดอย่างตั้งใจเพื่อสนับสนุนงานของมนุษย์จริง การกำหนดกรอบใหม่นี้เปลี่ยนความสนใจจากประสิทธิภาพของโมเดลดิบไปสู่ระบบปฏิสัมพันธ์ที่สนับสนุนความต่อเนื่อง ความไว้วางใจ และความสามารถในการใช้งาน
การตรวจสอบความถูกต้องระดับองค์กร
เฟรมเวิร์กได้รับการตรวจสอบครั้งแรกภายในสภาพแวดล้อม AI ระดับองค์กรที่มีลักษณะการเข้าถึงทั่วโลก ความเข้มงวดในการปฏิบัติการ และข้อกำหนดความน่าเชื่อถือที่เข้มงวด ในระหว่างการทำงานกับโครงการออกแบบที่เกี่ยวข้องกับ AI ซึ่งตั้งอยู่ในบริบทการฝึกอบรมและการปฏิบัติการขนาดใหญ่แบบกระจายที่ Apple Luo สังเกตเห็นสภาวะที่การโต้ตอบกับ AI ต้องคงความสอดคล้องข้ามเซสชัน ภูมิภาค และทีม ในขณะที่บูรณาการได้อย่างสะอาดเข้ากับขั้นตอนการทำงานที่มีอยู่
สภาพแวดล้อมเหล่านี้กำหนดความต้องการที่สูงผิดปกติต่อระบบปฏิสัมพันธ์: ผลลัพธ์ต้องคาดการณ์ได้ พฤติกรรมต้องคงอยู่ตลอดเวลาและบริบท และรูปแบบการโต้ตอบต้องนำกลับมาใช้ได้ภายใต้แรงกดดันขององค์กร ภายในข้อจำกัดเหล่านี้ รูปแบบที่สอดคล้องกับหลักการที่กำหนดไว้ในภายหลังใน Character-Centric Multimodal Interaction Framework—โดยเฉพาะความคงทน เอกลักษณ์ และการนำกลับมาใช้—พิสูจน์แล้วว่าสำคัญต่อการรักษาความน่าเชื่อถือและความไว้วางใจตลอดเวลา
ระบบนิเวศช่องทางทั่วโลกของ Apple เป็นตัวแทนหนึ่งในสภาพแวดล้อมการปฏิบัติการที่ซับซ้อนที่สุดในภาคเทคโนโลยี เอกสารที่เปิดเผยต่อสาธารณะระบุว่าประมาณ 60% ของยอดขายสุทธิประจำปีของ Apple ดำเนินการผ่านคู่ค้าช่องทาง เน้นย้ำขนาดและความเข้มงวดของบริบทองค์กรที่รูปแบบการโต้ตอบเหล่านี้ได้รับการตรวจสอบ การตีความเหล่านี้สะท้อนการวิเคราะห์การออกแบบอิสระมากกว่าตำแหน่งของบริษัทอย่างเป็นทางการ
การตรวจสอบความถูกต้องระดับผู้บริโภค
เฟรมเวิร์กการโต้ตอบเดียวกันได้รับการตรวจสอบในภายหลังในบริบทที่แตกต่างมาก: การโต้ตอบกับ AI ระดับผู้บริโภค
ที่ Character.AI แชททำหน้าที่เป็นพื้นผิวผลิตภัณฑ์หลัก ในสภาพแวดล้อมนี้ หลักการที่เน้นตัวละครของ Luo—ความคงทน เอกลักษณ์ และบริบทหลายโมดัล—สอดคล้องอย่างใกล้ชิดกับรูปแบบการโต้ตอบที่สังเกตได้ในระบบแชทผู้บริโภคที่ออกแบบมาสำหรับการเล่าเรื่องแบบยาว ความต่อเนื่องทางอารมณ์ และการมีส่วนร่วมที่ยั่งยืน
ตัวเลขที่รายงานต่อสาธารณะระบุว่า Character.AI ให้บริการผู้ใช้งานรายเดือนประมาณ 20 ล้านคน โดยมีการใช้งานรายวันที่รายงานใกล้สองชั่วโมงต่อผู้ใช้—เกินกว่ารูปแบบการมีส่วนร่วมทั่วไปของแชทบอทอเนกประสงค์อย่าง ChatGPT อย่างมาก ระดับการใช้ที่ยั่งยืนนี้สะท้อนพลวัตการโต้ตอบที่เน้นการทำงานร่วมกันเชิงสร้างสรรค์แบบยาวมากกว่าการแลกเปลี่ยนแบบสั้นที่มุ่งเน้นงาน
เมื่อนำมารวมกัน ข้อสังเกตเหล่านี้บ่งชี้ว่าเฟรมเวิร์กการโต้ตอบเดียวกันสามารถคงประสิทธิผลได้ทั้งในสภาพแวดล้อมองค์กรที่ควบคุมอย่างเข้มงวดและการตั้งค่าผู้บริโภคแบบเปิดที่มีความแปรปรวนสูง การตีความเหล่านี้สะท้อนการวิเคราะห์การออกแบบอิสระ
ทำไมนี่จึงสำคัญ
ระบบปฏิสัมพันธ์ AI เพียงไม่กี่ระบบทำงานได้ข้ามขั้วสุดขั้วเช่นนั้น ใน Character-Centric Multimodal Interaction Framework ตัวละคร AI ทำหน้าที่เป็นภาชนะการทำงานร่วมกันที่คงอยู่ การโต้ตอบหลายโมดัลกลายเป็นโครงสร้างพื้นฐานเชิงสร้างสรรค์ที่นำกลับมาใช้ได้มากกว่าชั้นความแปลกใหม่
โดยการแปลความสามารถของโมเดลดิบเป็นระบบปฏิสัมพันธ์ที่มั่นคงและขยายขนาดได้ งานของ Luo มีส่วนสนับสนุนการพัฒนาของ AI ที่เน้นมนุษย์เป็นศูนย์กลาง เมื่อ AI แบบอิงตัวละครกลายเป็นสื่อใหม่ข้ามการศึกษา ความบันเทิง และซอฟต์แวร์องค์กร เฟรมเวิร์กเช่นนี้ช่วยให้มั่นใจว่าระบบ AI ยังคงใช้งานได้ เชื่อถือได้ และเสริมพลังเชิงสร้างสรรค์ตลอดเวลา
ในภูมิทัศน์ที่ถูกครอบงำด้วยความก้าวหน้าของโมเดลอย่างรวดเร็ว โครงสร้างพื้นฐานเชิงสร้างสรรค์ที่ยั่งยืนยังคงหายาก เฟรมเวิร์กของ Yi Luo จัดการกับช่องว่างนั้น
ลิงก์อ้างอิง
- สถิติการมีส่วนร่วมของ Character AI
- https://sqmagazine.co.uk/character-ai-statistics/
- สถิติการใช้งาน ChatGPT
- https://elfsight.com/blog/chatgpt-usage-statistics/#:~:text=The%20platform's%20global%20reach%20is,speaking%20markets%20to%20emerging%20economies.

