चीनी AI स्टार्टअप DeepSeek ने अपनी V4 मॉडल सीरीज़ का प्रीव्यू जारी किया, जो इसकी लार्ज लैंग्वेज मॉडल लाइनअप का नवीनतम संस्करण है। इस घोषणा में सीरीज़ के भीतर दो वेरिएंट पेश किए गए हैं, जिन्हें V4-Pro और V4-Flash कहा गया है, दोनों को तैनाती की जरूरतों के आधार पर प्रदर्शन, दक्षता और लागत को संतुलित करने के लिए डिज़ाइन किया गया है।
कंपनी के तकनीकी प्रकटीकरण के अनुसार, V4-Pro मॉडल अधिक सक्षम कॉन्फ़िगरेशन है, जो लगभग 1.6 ट्रिलियन कुल पैरामीटर और 49 बिलियन सक्रिय पैरामीटर के साथ बनाया गया है। इसे अग्रणी क्लोज्ड-सोर्स सिस्टम के करीब प्रदर्शन देने वाला बताया गया है, विशेष रूप से विश्व ज्ञान पुनर्प्राप्ति, तर्क, गणित, कोडिंग और STEM से संबंधित कार्यों जैसे क्षेत्रों में।
डेवलपर द्वारा संदर्भित तुलनात्मक मूल्यांकनों में, V4-Pro को कई बेंचमार्क पर वर्तमान ओपन-सोर्स मॉडलों में अग्रणी बताया गया है, जो ज्ञान-संबंधित आकलनों में केवल Google के Gemini 3.1 Pro से पीछे है।
दूसरा वेरिएंट, V4-Flash, एक अधिक हल्के और लागत-कुशल विकल्प के रूप में प्रस्तुत किया गया है, जिसमें लगभग 284 बिलियन कुल पैरामीटर और 13 बिलियन सक्रिय पैरामीटर हैं। आकार में छोटा होने के बावजूद, यह सरल एजेंट-आधारित कार्यों पर Pro संस्करण के लगभग बराबर प्रदर्शन बनाए रखते हुए तेज़ प्रतिक्रिया समय और कम परिचालन लागत प्रदान करता है। यह कॉन्फ़िगरेशन उच्च-थ्रूपुट एप्लिकेशन के लिए तैयार किया गया है जहाँ अधिकतम मॉडल क्षमता की तुलना में दक्षता को प्राथमिकता दी जाती है।
DeepSeek ने V4 सीरीज़ में पेश किए गए संरचनात्मक और आर्किटेक्चरल बदलावों पर भी जोर दिया है, जिसमें टोकन-स्तरीय संपीड़न को स्पार्स अटेंशन तकनीकों के साथ जोड़ने वाले नए अटेंशन मैकेनिज्म शामिल हैं। इन समायोजनों का उद्देश्य लंबे-संदर्भ प्रसंस्करण दक्षता में सुधार करना है, साथ ही कम्प्यूटेशनल और मेमोरी आवश्यकताओं को कम करना है। कंपनी ने नोट किया है कि एक-मिलियन-टोकन कॉन्टेक्स्ट विंडो अब इसकी सेवाओं में मानक बन गई है, जो बड़े पैमाने के मॉडलों में विस्तारित संदर्भ हैंडलिंग की ओर व्यापक प्रयास को दर्शाती है।
रिलीज़ का एक और फोकस एजेंट-उन्मुख कार्यक्षमता है। V4 सिस्टम को बाहरी AI टूलिंग इकोसिस्टम के साथ संगतता के लिए ऑप्टिमाइज़ किया गया है, जिसमें Claude Code और OpenClaw जैसे फ्रेमवर्क, साथ ही अन्य एजेंट-आधारित विकास वातावरण शामिल हैं। मॉडल को आंतरिक एजेंटिक कोडिंग वर्कफ़्लो में सक्रिय रूप से उपयोग किए जाने के रूप में भी वर्णित किया गया है।
V4-Pro और V4-Flash दोनों API एक्सेस के माध्यम से उपलब्ध कराए गए हैं, जो कई एकीकरण मानकों और दोहरे परिचालन मोड का समर्थन करते हैं। कंपनी ने संकेत दिया है कि लेगेसी मॉडलों को आने वाले चक्र में नई आर्किटेक्चर के पक्ष में चरणबद्ध तरीके से हटाया जाएगा, जिसमें 2026 के मध्य तक पूर्ण माइग्रेशन की उम्मीद है।
यह पोस्ट DeepSeek Unveils V4 Model Series: High-Parameter AI Push Targets Efficiency And Frontier Performance सबसे पहले Metaverse Post पर दिखाई दी।


