إدمونتون، كندا – 28 يناير: تمسك امرأة هاتفاً خلوياً أمام شاشة حاسوب تعرض شعار DeepSeek، في 28 يناير 2025، في إدمونتون، كندا. (تصوير: أرتور ويداك/NurPhoto عبر Getty Images)
NurPhoto via Getty Images
يصل DeepSeek V4، التحديث المرتقب من DeepSeek، في لحظة تنافسية شرسة، إذ أطلق كلٌّ من GPT 5.5 التابع لـ OpenAI وOpus 4.7 التابع لـ Anthropic واحداً تلو الآخر. يبدو أن سباق نماذج الذكاء الاصطناعي يصل إلى مستوى جديد. بوصفه مؤمناً فريداً بالأدوات مفتوحة المصدر، يُبهر DeepSeek المطورين بكفاءته التكلفية بدلاً من الحجم الخام.
يشتمل الإصدار التجريبي على نموذجَين من نوع Mixture-of-Experts بنافذة سياق مليون توكن: DeepSeek-V4-Pro، بإجمالي 1.6 تريليون معامل و49 مليار معامل نشط، وDeepSeek-V4-Flash، بإجمالي 284 مليار معامل و13 مليار معامل نشط.
تواجه وكلاء السياق الطويل ومساعدو البرمجة وأدوات البحث ومساعدو الشركات جميعهم نفس الاختناق: إذ قد يحتاج كل توكن يُولَّد حديثاً إلى الرجوع إلى سجل متنامٍ من المستندات والأكواد واستدعاءات الأدوات والاستنتاجات الوسيطة. يُثبت التقرير الفني لـ DeepSeek أن نماذج V4 تعالج هذه المشكلة من خلال الضغط المعماري بدلاً من مجرد مطالبة المستخدمين بدفع مقابل موارد حوسبة إضافية.
الابتكار الجوهري: ضغط الذاكرة دون فقدان القدرة الاستنتاجية
أهم تغيير معماري في DeepSeek V4 هو تصميم انتباه هجين يجمع بين Compressed Sparse Attention أو CSA، وHeavily Compressed Attention أو HCA. وهذا يعني أن النموذج لا يخزن كل توكن سابق ويمسحه بنفس الطريقة المكلفة. يضغط CSA مجموعات من إدخالات القيمة الرئيسية ثم يحدد الكتل المضغوطة الأكثر صلة. ويضغط HCA بشكل أكثر عدوانية، مما يتيح انتباهاً كثيفاً عبر تدفق ذاكرة أقصر بكثير.
يهم هذا الأمر لأن الانتباه أحد المحركات الرئيسية للتكلفة في الذكاء الاصطناعي ذي السياق الطويل. مع نمو طول السياق، يصبح الانتباه التقليدي مكلفاً بشكل متزايد من حيث الحوسبة والذاكرة. يعالج تصميم الانتباه الهجين لـ DeepSeek السياق الطويل باعتباره مشكلة هندسية لتدرج الذاكرة. يحتاج بعض المعلومات إلى انتباه محلي دقيق. ويمكن ضغط بعضها الآخر. من خلال الجمع بين هذين الوضعين، يحوّل V4 سياق مليون توكن إلى قدرة أكثر عملية. في وقت سابق من هذا العام، نشر باحثو DeepSeek ورقة بحثية تقترح Engram، وهو وحدة ذاكرة مشروطة تعزز كفاءة الاستنتاج من خلال الفصل البنيوي بين استرجاع المعرفة الثابتة والحساب الديناميكي.
لماذا قد يدفع هذا نحو مزيد من الابتكار في الذكاء الاصطناعي
تكلفة الاستدلال المنخفضة تغيّر من يمكنه التجريب. حين يصبح الاستنتاج ذو السياق الطويل أرخص، يستطيع المزيد من المطورين بناء وكلاء يقرؤون مستودعات كاملة، ويحللون سجلات قانونية طويلة، ويقارنون الإيداعات المالية متعددة المستندات، أو يعملون عبر جلسات استخدام أدوات ممتدة. هذا يوسّع مساحة التصميم إلى ما هو أبعد من نصوص المحادثة.
بالنسبة للشركات الناشئة، يخفّض DeepSeek V4 تكلفة تجربة التطبيقات الطموحة. وبالنسبة للمؤسسات، يجعل سير العمل ذات السياق الكبير أكثر واقعية. وبالنسبة لمطوري المصادر المفتوحة، يوفر وصفة تقنية: الجمع بين تناثر MoE وضغط السياق الطويل والاستدلال منخفض الدقة والنوى المخصصة والتدريب اللاحق للمهام الوكيلية.
الرسالة المتعلقة بالأجهزة: نماذج الذكاء الاصطناعي تخبر الرقائق الآن بما يجب أن تصبح عليه
يستحق DeepSeek V4 الاهتمام أيضاً لأن التقرير الفني يقدم اقتراحات صريحة بشأن تصميم الأجهزة. يرى الفريق أن الأجهزة المستقبلية ينبغي أن تُحسَّن لصالح النسبة بين الحوسبة والاتصال، بدلاً من زيادة عرض النطاق الترددي بشكل أعمى.
كما أفادت رويترز بأن DeepSeek V4 تم تكييفه للعمل على رقائق Ascend من هواوي، وأن هواوي أعلنت أن مجموعات العقد الفائقة المستندة إلى Ascend 950 تدعم بالكامل سلسلة V4. وهذا يجعل V4 جزءاً من قصة أجهزة أكبر. ينتقل سباق الذكاء الاصطناعي من أوزان النماذج إلى التصميم المشترك للمكدس الكامل، حيث تتطور النماذج والنوى وأنظمة الذاكرة والوصلات البينية والرقائق معاً.
الذكاء الأرخص يوسّع السوق
قد تكون أهم نتيجة لـ DeepSeek V4 اقتصادية. حين تنخفض تكلفة الاستنتاج ذي السياق الطويل، تصبح حالات استخدام الذكاء الاصطناعي التي بدت مكلفة للغاية في السابق أكثر قابلية للتطبيق. تستفيد جميعها من الذاكرة والاستدلال الأرخص: وكلاء قاعدة الأكواد الكاملة، ومساعدو البحث بعيد المدى، وسير العمل القانوني الكثيف بالمستندات، وأدوات العناية الواجبة المالية، وأنظمة مراجعة الأدبيات العلمية، ووكلاء المعرفة المؤسسية.
وهذا يعني أن DeepSeek V4 يُعيد تأطير سباق الذكاء الاصطناعي. إذا تمكن DeepSeek من تقديم نماذج مفتوحة قوية بمتطلبات ذاكرة وحوسبة أقل، فسيواجه القادة مغلقو المصدر ضغطاً أكبر لتبرير التسعير المرتفع. وسيواجه المنافسون مفتوحو المصدر ضغطاً لمجاراة تقنيات كفاءة V4.
Source: https://www.forbes.com/sites/geruiwang/2026/04/26/deepseek-v4-shows-that-the-next-ai-race-is-about-efficiency/








