Google Gemma 4 के साथ ओपन सोर्स AI रेस में वापस कूदता है

संक्षेप में

Google ने Gemma 4 जारी किया, जो Apache 2.0 लाइसेंस के तहत ओपन मॉडल का एक परिवार है।
चार-मॉडल लाइनअप फोन से लेकर डेटा सेंटर तक फैला है, जिसमें 31B मॉडल पहले से ही वैश्विक स्तर पर #3 रैंक पर है।
U.S. ओपन-सोर्स AI को आवश्यक बढ़ावा मिला है, क्योंकि Gemma 4—DeepMind द्वारा समर्थित—DeepSeek, Qwen और अन्य चीनी लीडर्स के खिलाफ सबसे मजबूत अमेरिकी प्रतिस्पर्धी के रूप में स्थापित हो रहा है।

Google की ओपन AI महत्वाकांक्षाएं आज बहुत अधिक गंभीर हो गईं। कंपनी ने Gemma 4 जारी किया, जो चार ओपन-वेट मॉडल का एक परिवार है जो Gemini 3 के समान शोध पर निर्मित है, और Apache 2.0 के तहत लाइसेंस प्राप्त है—जो पिछले Gemma संस्करणों की अधिक प्रतिबंधात्मक शर्तों से एक महत्वपूर्ण विचलन है।

डेवलपर्स ने पिछली Gemma पीढ़ियों को 400 मिलियन से अधिक बार डाउनलोड किया है, जिससे 100,000 से अधिक सामुदायिक वेरिएंट उत्पन्न हुए हैं। यह रिलीज अब तक की सबसे महत्वाकांक्षी है।

पिछले एक साल से, ओपन-सोर्स AI लीडरबोर्ड मुख्य रूप से एक चीनी मामला रहा है। DeepSeek, Minimax, GLM और Qwen ने शीर्ष स्थानों पर प्रभुत्व जमाया है, जिससे अमेरिकी विकल्प प्रासंगिकता के लिए संघर्ष कर रहे हैं। जैसा कि Decrypt ने पिछले साल रिपोर्ट किया, चीनी ओपन मॉडल 2024 के अंत में वैश्विक ओपन-मॉडल उपयोग के मुश्किल से 1.2% से बढ़कर 2025 के अंत तक लगभग 30% हो गए, Alibaba का Qwen यहां तक कि Meta के Llama को दुनिया भर में सबसे अधिक उपयोग किए जाने वाले सेल्फ-होस्टेड मॉडल के रूप में पीछे छोड़ रहा है।

Meta का Llama डेवलपर्स के लिए डिफॉल्ट विकल्प हुआ करता था जो एक सक्षम, स्थानीय रूप से चलने योग्य मॉडल चाहते थे। वह प्रतिष्ठा कम हो गई है—Llama के Meta-नियंत्रित लाइसेंस ने इसकी सच्ची ओपन-सोर्स स्थिति के बारे में सवाल उठाए, और इसका प्रदर्शन चीनी प्रतिस्पर्धा से पीछे रह गया। Allen Institute के OLMo परिवार ने अंतर को भरने की कोशिश की लेकिन सार्थक आकर्षण हासिल करने में विफल रहा। OpenAI ने अगस्त 2025 में अपने gpt-oss मॉडल जारी किए, जिससे पारिस्थितिकी तंत्र को ताजी हवा मिली, लेकिन उन्हें कभी भी सीमांत प्रतिस्पर्धी बनने के लिए डिज़ाइन नहीं किया गया था।

और कल, Arcee AI नामक 30-व्यक्ति की एक U.S. स्टार्टअप ने Trinity जारी किया, एक 400 बिलियन पैरामीटर ओपन मॉडल जिसने एक सम्मोहक मामला बनाया कि अमेरिकी दृश्य पूरी तरह से मृत नहीं था। Gemma 4 उस गति का अनुसरण करता है, इस बार Google DeepMind के पूर्ण समर्थन के साथ, इसे ओपन-सोर्स AI दृश्य में यकीनन सर्वश्रेष्ठ अमेरिकी मॉडल में बदल देता है।

मॉडल "Gemini 3 के समान विश्व स्तरीय शोध और प्रौद्योगिकी से निर्मित है," Google ने अपनी घोषणा में कहा। Gemma 4 चार आकारों में आता है: फोन और एज डिवाइस के लिए Effective 2B और 4B, गति पर केंद्रित एक 26B Mixture of Experts मॉडल, और कच्ची गुणवत्ता के लिए अनुकूलित एक 31B Dense मॉडल।

31B Dense वर्तमान में Arena AI के टेक्स्ट लीडरबोर्ड पर सभी ओपन मॉडल में तीसरे स्थान पर है। 26B MoE छठे स्थान पर है। Google का दावा है कि दोनों अपने आकार से 20 गुना बड़े मॉडल को पछाड़ते हैं—एक दावा जो कम से कम Arena AI संख्याओं के खिलाफ सही साबित होता है, जहां चीनी मॉडल अभी भी शीर्ष दो स्थानों पर बने हुए हैं।

हमने Gemma 4 का परीक्षण किया। यह सक्षम है, कुछ चेतावनियों के साथ। मॉडल उन कार्यों में भी तर्क लागू करता है जिनकी आवश्यकता नहीं है, जो सरल प्रॉम्प्ट के लिए प्रतिक्रियाओं को अत्यधिक इंजीनियर महसूस करा सकता है। रचनात्मक लेखन सभ्य है—सेवा योग्य, प्रेरित नहीं—और संभवतः अधिक विशिष्ट मार्गदर्शन और प्रॉम्प्ट इंजीनियरिंग के साथ सुधरता है।

जहां इसने सबसे स्पष्ट रूप से प्रदर्शन किया वह कोड था। एक गेम उत्पन्न करने के लिए कहा गया, आउटपुट विशेष रूप से चमकदार या विस्तृत नहीं था, लेकिन यह पहली कोशिश में बिना त्रुटियों के चला। 41 बिलियन पैरामीटर मॉडल के लिए बुरा नहीं। वह जीरो-शॉट विश्वसनीयता यकीनन एक सुंदर परिणाम से अधिक मूल्यवान है जिसे डिबगिंग की आवश्यकता है।

आप (बुनियादी, फिर भी कार्यात्मक) गेम को यहां आज़मा सकते हैं।

चार वेरिएंट पूर्ण हार्डवेयर स्पेक्ट्रम को कवर करते हैं। E2B और E4B मॉडल Android फोन, Raspberry Pi, और एज डिवाइस के लिए बनाए गए हैं, जो पूरी तरह से ऑफलाइन चलते हैं, लगभग शून्य विलंबता, नेटिव ऑडियो इनपुट, और 128K संदर्भ विंडो के साथ। 26B और 31B मॉडल वर्कस्टेशन और क्लाउड परिनियोजन को लक्षित करते हैं, संदर्भ को 256K तक विस्तारित करते हैं और स्वायत्त एजेंट बनाने के लिए नेटिव फ़ंक्शन-कॉलिंग और संरचित JSON आउटपुट जोड़ते हैं। सभी चार मॉडल इमेज और वीडियो को नेटिव रूप से प्रोसेस करते हैं। बड़े मॉडल के पूर्ण-सटीकता वज़न एकल 80GB NVIDIA H100 GPU पर फिट होते हैं; क्वांटाइज़्ड संस्करण उपभोक्ता हार्डवेयर पर चलते हैं।

Apache 2.0 लाइसेंस दूसरी सुर्खी है। Google के पिछले Gemma रिलीज़ ने एक कस्टम लाइसेंस का उपयोग किया जिसने वाणिज्यिक उत्पादों के लिए कानूनी अस्पष्टता पैदा की। Apache 2.0 उस घर्षण को पूरी तरह से हटा देता है—डेवलपर्स संशोधित, पुनर्वितरित और व्यावसायीकरण कर सकते हैं बिना इस चिंता के कि Google बाद में शर्तें बदल देगा। Hugging Face के सह-संस्थापक Clement Delangue ने इसकी प्रशंसा करते हुए कहा कि "Local AI का समय आ गया है," और यह AI उद्योग का भविष्य है। Google DeepMind के CEO Demis Hassabis ने आगे बढ़ते हुए Gemma 4 को "अपने संबंधित आकार के लिए दुनिया में सर्वश्रेष्ठ ओपन मॉडल" कहा।

यह एक मजबूत दावा है। Anthropic, OpenAI, और Google के अपने Gemini से प्रोप्राइटरी सिस्टम अभी भी सबसे कठिन बेंचमार्क पर अग्रणी हैं। लेकिन ओपन-वेट मॉडल के लिए जिन्हें आप स्थानीय रूप से चला सकते हैं, स्वतंत्र रूप से संशोधित कर सकते हैं, और अपने स्वयं के बुनियादी ढांचे पर तैनात कर सकते हैं? प्रतिस्पर्धा अब काफी पतली हो गई है। आप अब Google AI Studio (31B और 26B) या Google AI Edge Gallery (E2B और E4B) में Gemma 4 आज़मा सकते हैं। मॉडल वज़न Hugging Face, Kaggle, और Ollama पर भी उपलब्ध हैं।