DeepSeek V4 দীর্ঘ-প্রসঙ্গ কোডিংয়ে ChatGPT এবং Claude-কে ছাড়িয়ে যাবে বলে গুজব রয়েছে, যা এলিট-স্তরের কোডিং কাজগুলিকে লক্ষ্য করছে। অভ্যন্তরীণ ব্যক্তিরা দাবি করেছেন যে সিলিকন ভ্যালির AI ল্যান্ডস্কেপ উদ্বিগ্ন হওয়া উচিত যদি ফেব্রুয়ারি মাসের মাঝামাঝি রোলআউটের পরে অভ্যন্তরীণ পরীক্ষাগুলি এর প্রত্যাশিত কর্মক্ষমতার ইঙ্গিত দেয়।
চীনা-ভিত্তিক AI স্টার্ট-আপ DeepSeek তার সর্বশেষ বৃহৎ ভাষা মডেল DeepSeek V4 ১৭ ফেব্রুয়ারি প্রকাশ করার পরিকল্পনা করছে বলে জানা গেছে। বিষয়টি সম্পর্কে জানা ব্যক্তিরা দাবি করেছেন যে দীর্ঘ-প্রসঙ্গ কোড প্রম্পট এবং কাজগুলি পরিচালনা করার সময় মডেলটি OpenAI-এর ChatGPT এবং Anthropic-এর Claude-এর মতো বিদ্যমান বৃহৎ ভাষা মডেলগুলির উপর ছায়া ফেলতে প্রস্তুত।
ডেভেলপাররা DeepSeek V4 রিলিজের জন্য গভীর প্রত্যাশা প্রকাশ করেছেন
চীনা কোম্পানিটি লেখার সময় পর্যন্ত আসন্ন রিলিজ সম্পর্কে কোনো তথ্য প্রকাশ্যে প্রকাশ করেনি বা গুজবগুলি নিশ্চিত করেনি। বিভিন্ন সোশ্যাল নেটওয়ার্ক জুড়ে ডেভেলপাররা রিলিজের জন্য গভীর প্রত্যাশা প্রকাশ করেছেন। Hyperbolic Labs-এর AI ডেভেলপার এবং সহ-প্রতিষ্ঠাতা Yuchen Jin, X-এ লিখেছেন যে "DeepSeek V4 শীঘ্রই আসবে বলে গুজব রয়েছে, Claude এবং GPT-এর চেয়ে শক্তিশালী কোডিং সহ।"
সাবরেডিট r/DeepSeek-ও উত্তপ্ত হয়ে উঠেছে, একজন ব্যবহারকারী ব্যাখ্যা করেছেন যে DeepSeek-এর আসন্ন V4 মডেলের প্রতি তাদের আবেশ স্বাভাবিক ছিল না। ব্যবহারকারী বলেছেন যে তারা প্রায়শই "খবর, সম্ভাব্য গুজব চেক করেন এবং আমি এমনকি DS ওয়েবসাইটে ডক্স পড়তে যাই যেকোনো পরিবর্তন বা আপডেটের ইঙ্গিতের লক্ষণ খুঁজতে।"
DeepSeek-এর পূর্ববর্তী রিলিজগুলি বৈশ্বিক বাজারে উল্লেখযোগ্য প্রভাব ফেলেছে। চীনা AI স্টার্ট-আপটি জানুয়ারি ২০২৫-এ তার R1 রিজনিং মডেল প্রকাশ করেছে, যা এক ট্রিলিয়ন ডলার বিক্রয়ের দিকে পরিচালিত করেছে। রিলিজটি গণিত এবং রিজনিং বেঞ্চমার্কে OpenAI-এর 01 মডেলের সাথে মিলেছে, যদিও মার্কিন AI স্টার্ট-আপ তার 01 মডেলে যা ব্যয় করেছে তার চেয়ে উল্লেখযোগ্যভাবে কম খরচ হয়েছে।
চীনা কোম্পানিটি মডেল রিলিজে মাত্র $6 মিলিয়ন ব্যয় করেছে বলে জানা গেছে। এদিকে, বৈশ্বিক প্রতিযোগীরা একই আউটপুটের জন্য প্রায় ৭০ গুণ বেশি ব্যয় করে। এর V3 মডেলও MATH-500 বেঞ্চমার্কে ৯০.২% স্কোর অর্জন করেছে, Claude-এর ৭৮.৩%-এর তুলনায়। DeepSeek-এর আরও সাম্প্রতিক V3 আপগ্রেড (V3.2 Speciale) তার উৎপাদনশীলতা আরও উন্নত করেছে।
এর V4 মডেলের বিক্রয় পয়েন্ট V3-এর বিশুদ্ধ রিজনিং, আনুষ্ঠানিক প্রমাণ এবং যৌক্তিক গণিতের উপর জোর থেকে বিবর্তিত হয়েছে। নতুন রিলিজ একটি হাইব্রিড মডেল হবে বলে আশা করা হচ্ছে যা রিজনিং এবং নন-রিজনিং উভয় কাজ একত্রিত করে। মডেলটি উচ্চ নির্ভুলতা এবং দীর্ঘ-প্রসঙ্গ কোড জেনারেশন চাওয়া একটি বিদ্যমান শূন্যতা পূরণ করে ডেভেলপার বাজার দখল করার লক্ষ্য রাখে।
Claude Opus 4.5 বর্তমানে SWE বেঞ্চমার্কে আধিপত্য দাবি করে, ৮০.৯% নির্ভুলতা অর্জন করে। Claude Opus 4.5-কে উৎখাত করতে V4-কে এটি হারাতে হবে। পূর্ববর্তী সাফল্যের উপর ভিত্তি করে, আগত মডেলটি এই থ্রেশহোল্ড অতিক্রম করতে এবং বেঞ্চমার্কে আধিপত্য দাবি করতে পারে।
DeepSeek LLM প্রশিক্ষণের জন্য mHC-এর পথপ্রদর্শক
DeepSeek-এর সাফল্য অনেকেকে গভীর পেশাগত অবিশ্বাসে ফেলেছে। এত ছোট একটি কোম্পানি কীভাবে এই ধরনের মাইলফলক অর্জন করতে পারে? রহস্যটি ১ জানুয়ারি প্রকাশিত এর গবেষণা পত্রে গভীরভাবে নিহিত থাকতে পারে। কোম্পানিটি একটি নতুন প্রশিক্ষণ পদ্ধতি চিহ্নিত করেছে যা ডেভেলপারদের সহজেই বৃহৎ ভাষা মডেল স্কেল করতে দেয়। DeepSeek-এর প্রতিষ্ঠাতা এবং CEO Liang Wenfeng, গবেষণায় লিখেছেন যে কোম্পানিটি তার AI মডেল প্রশিক্ষণের জন্য Manifold-Constrained Hyper-Connections (mHC) ব্যবহার করছে।
নির্বাহী প্রস্তাব করেছিলেন যে ডেভেলপাররা বৃহৎ ভাষা মডেল প্রশিক্ষণ দেওয়ার সময় যে সমস্যার সম্মুখীন হন তা সমাধান করতে mHC ব্যবহার করা। Wenfeng-এর মতে, mHC হল Hyper-Connections (HC)-এর একটি আপগ্রেড, একটি ফ্রেমওয়ার্ক যা অন্যান্য AI ডেভেলপাররা তাদের বৃহৎ ভাষা মডেল প্রশিক্ষণ দিতে ব্যবহার করেন। তিনি ব্যাখ্যা করেছেন যে HC এবং অন্যান্য ঐতিহ্যগত AI আর্কিটেকচার সমস্ত ডেটা একটি একক, সংকীর্ণ চ্যানেলের মাধ্যমে জোরপূর্বক পাস করায়। একই সময়ে, mHC সেই পথটিকে একাধিক চ্যানেলে প্রশস্ত করে, প্রশিক্ষণ পতন না ঘটিয়ে ডেটা এবং তথ্য স্থানান্তর সহজতর করে।
Omdia-এর প্রধান বিশ্লেষক Lian Jye Su, CEO Wenfeng-কে তাদের গবেষণা প্রকাশ করার জন্য প্রশংসা করেছেন। Su জোর দিয়েছিলেন যে DeepSeek-এর প্রশিক্ষণ পদ্ধতি প্রকাশের সিদ্ধান্ত চীনা AI সেক্টরে নতুন আত্মবিশ্বাস নির্দেশ করে। DeepSeek উন্নয়নশীল বিশ্বে আধিপত্য বিস্তার করেছে। Microsoft বৃহস্পতিবার একটি প্রতিবেদন প্রকাশ করেছে, যা দেখায় যে DeepSeek চীনের AI বাজারের ৮৯% নিয়ন্ত্রণ করে এবং উন্নয়নশীল দেশগুলিতে গতি অর্জন করছে।
ক্রিপ্টোর শীর্ষ মস্তিষ্কের সামনে আপনার প্রকল্প চান? আমাদের পরবর্তী শিল্প প্রতিবেদনে এটি বৈশিষ্ট্যযুক্ত করুন, যেখানে ডেটা প্রভাবের সাথে মিলিত হয়।
সূত্র: https://www.cryptopolitan.com/deepseek-v4-chatgpt-and-claude/



