كشفت شركة DeepSeek الناشئة في مجال الذكاء الاصطناعي ومقرها الصين عن أحدث نموذج لغة تجريبي لها، V3.2-exp، المصمم لخفض تكاليف الاستدلال للمهام ذات السياق الطويل إلى النصف تقريبًا.
يهدف النموذج، الذي تم الإعلان عنه يوم الاثنين، إلى معالجة أحد أكثر التحديات إلحاحًا في اعتماد الذكاء الاصطناعي على نطاق واسع: تكلفة التعامل مع المدخلات الممتدة.
يستفيد V3.2-exp من نظام جديد يسمى DeepSeek Sparse Attention، والذي يقرن "مفهرس البرق" بوحدة ثانوية لاختيار الرموز المميزة الدقيقة.
معًا، تسمح هذه الابتكارات للنموذج بالتركيز على المقتطفات الأكثر صلة مع إدارة تفاصيل مستوى الرموز المميزة بدقة. تشير الاختبارات الداخلية المبكرة إلى أن النظام يمكن أن يقلل بشكل كبير من أحمال الخادم، مع احتمال انخفاض تكاليف واجهة برمجة تطبيقات بنسبة 50٪ لعمليات السياق الطويل.
على عكس العديد من إصدارات الذكاء الاصطناعي التجارية التي تظل مغلقة، تم إطلاق V3.2-exp كنموذج مفتوح الوزن. وهو متاح الآن على Hugging Face، مما يمنح الباحثين والمطورين والشركات فرصة لإجراء تقييمات مستقلة.
يسلط هذا القرار الضوء على استمرار دفع DeepSeek نحو الشفافية والتعاون، خاصة مع تدقيق الشركات بشكل متزايد في المطالبات المتعلقة بالكفاءة والأداء.
يتماشى الإصدار المفتوح للنموذج أيضًا مع استراتيجية DeepSeek السابقة مع نموذج R1 في وقت سابق من هذا العام، حيث سمحت المقارنة المعيارية المفتوحة للمجتمع بالتحقق من قدراته على التفكير. من خلال اعتماد نفس النهج لـ V3.2-exp، تشير DeepSeek إلى ثقتها في اختراقات الكفاءة.
يأتي إطلاق V3.2-exp بعد سلسلة من التحديثات والتجارب من DeepSeek في الأشهر الأخيرة. في وقت سابق من شهر سبتمبر، قدمت الشركة DeepSeek-V3.1-Terminus، وهو تحسين يهدف إلى تحسين أداء وكيل الذكاء الاصطناعي ومعالجة المشكلات المبلغ عنها مثل الرموز غير المقروءة وتبديل اللغة غير المتسق.
في حين أن هذا التحديث قدم تحسينات صغيرة في المعايير مثل الامتحان الأخير للإنسانية ومهام البرمجة، إلا أن بعض التحديات ظلت قائمة، خاصة في أداء اللغة الصينية.
وفي الوقت نفسه، كشفت تقارير الصناعة أن DeepSeek تعمل على نموذج من الجيل التالي يركز على الوكيل، ومن المقرر الكشف عنه في الربع الرابع من عام 2025. يعكس المشروع تحولًا أوسع في الصناعة نحو أنظمة الذكاء الاصطناعي المستقلة، القادرة على تنفيذ مهام متعددة الخطوات مع الحد الأدنى من الإشراف البشري. يبدو أن إصدار V3.2-exp يكمل هذا المسار من خلال تعزيز الأساس التكنولوجي للشركة في الكفاءة قبل طرح ميزات وكيل الذكاء الاصطناعي الأكثر تقدمًا.
يأتي ابتكار DeepSeek في وقت تتزايد فيه المنافسة في قطاع الذكاء الاصطناعي الصيني. تقوم الشركات المنافسة مثل Alibaba و Tencent بزيادة استثماراتها في الذكاء الاصطناعي بشكل كبير، حيث تعهدت Alibaba بأكثر من 380 مليار رنمينبي (52.9 مليار دولار) في البنية التحتية للحوسبة السحابية والذكاء الاصطناعي.
في حين تم الإشادة بـ DeepSeek لتحقيق نتائج فعالة من حيث التكلفة بموارد متواضعة نسبيًا، يحذر المحللون من أن الشركة يجب أن تحافظ على الزخم لتجنب أن تطغى عليها منافسيها الأغنياء بالنقد.
ظهرت المقالة نموذج DeepSeek الجديد يخفض تكاليف API للسياقات الممتدة لأول مرة على CoinCentral.


