متا Muse Spark را راه‌اندازی می‌کند، قدرتمندترین هوش مصنوعی خود تاکنون—اما Gemini 3.1 Pro همچنان در صدر قرار دارد

به طور خلاصه

Muse Spark جدید متا نشان‌دهنده تغییر به سمت هوش مصنوعی چندوجهی بومی بسته با استدلال مبتنی بر AI Agent است.
متا دستاوردهای قوی معیار در سلامت و جستجو را گزارش می‌دهد، اما هنوز در استدلال اصلی و کدنویسی از Gemini عقب است.
ساخته شده در نه ماه با محاسبات بسیار کمتر، این به استراتژی هوش مصنوعی کارآمدتر جدید اشاره دارد.

متا Muse Spark را روز چهارشنبه راه‌اندازی کرد که اولین مدل ساخته شده توسط Meta Superintelligence Labs است—تیمی که نه ماه پیش تحت نظر مدیر ارشد هوش مصنوعی الکساندر وانگ پس از خرید 14 میلیارد دلاری Scale AI توسط متا جمع شدند. اکنون در meta.ai و اپلیکیشن Meta AI فعال است و عرضه آن به Facebook، Instagram و WhatsApp در چند هفته آینده در راه است.

این فقط یک ارتقای چت‌بات دیگر یا نسخه جدید Llama نیست. Muse Spark به صورت بومی چندوجهی است—تصاویر، متن و صدا را از پایه پردازش می‌کند، به جای اینکه بینایی را به یک مدل متنی موجود اضافه کند. با زنجیره بصری تفکر، پشتیبانی از استفاده از ابزار و چیزی که متا آن را «حالت تأمل» می‌نامد همراه است: تنظیماتی که چندین AI Agent را به صورت موازی اجرا می‌کند تا مشکلات سخت‌تر را حل کند. این پاسخ متا به حالت‌های تفکر گسترده از Gemini Deep Think گوگل و GPT Pro اوپن‌ای‌آی است.

متا در اعلامیه رسمی نوشت: «Muse Spark اولین قدم در نردبان مقیاس‌بندی ما و اولین محصول یک بازنگری کامل تلاش‌های هوش مصنوعی ما از پایه است. برای پشتیبانی از مقیاس‌بندی بیشتر، ما سرمایه‌گذاری‌های استراتژیک در کل پشته انجام می‌دهیم—از تحقیق و آموزش مدل تا زیرساخت، از جمله مرکز داده Hyperion.»

این شرکت با بیش از 1000 پزشک برای تنظیم داده‌های آموزشی برای استدلال پزشکی Muse Spark کار کرد. نتایج در HealthBench Hard—یک معیار پرس‌وجوهای سلامتی باز—چشمگیر است: Muse Spark امتیاز 42.8 را کسب کرد، در مقایسه با 40.1 برای GPT 5.4 و فقط 20.6 برای Gemini 3.1 Pro. این تفاوت جزئی نیست.

در جستجوی عامل (DeepSearchQA)، Muse Spark نیز با 74.8 پیشتاز است و Gemini (69.7) و GPT 5.4 (73.6) را شکست داد. در CharXiv Reasoning—درک شکل از مقالات علمی—امتیاز 86.4 کسب کرد که بالاترین امتیاز در بین مدل‌های مقایسه است.

برای کسانی که به شکستن هوش مصنوعی علاقه دارند، این مدل در عرض چند دقیقه شکسته شد:

اما خوب با عالی یکی نیست. تصویر کلی معیار نشان می‌دهد که Gemini 3.1 Pro هنوز در اکثر دسته‌ها جلوتر است. شکاف در ARC AGI 2، معیار پازل استدلال انتزاعی، بیشترین قابل مشاهده است: Gemini امتیاز 76.5 را در مقابل 42.5 Muse Spark کسب کرد.

در کدنویسی (LiveCodeBench Pro)، 82.9 Gemini از 80.0 متا جلوتر است. در MMMU Pro—درک چندوجهی—Gemini امتیاز 83.9 در مقابل 80.4 کسب کرد. وبلاگ خود متا شکاف‌های عملکرد فعلی در سیستم‌های عامل افق بلند و گردش‌های کاری کدنویسی را تصدیق می‌کند.

همچنین یک تغییر استراتژیک قابل توجه در این راه‌اندازی وجود دارد. Muse Spark یک مدل بسته است—معماری و وزن‌های آن عمومی نخواهد شد. این انحراف شدیدی از Llama است که شهرت متا را در حلقه‌های هوش مصنوعی باز ساخت. پس از استقبال ناامیدکننده Llama 4 در اوایل امسال، به نظر می‌رسد متا تصمیم گرفته است که فصل بعدی باید متفاوت نوشته شود.

این شرکت می‌گوید امیدوار است نسخه‌های آینده Muse را منبع باز کند، اما در حال حاضر کد در داخل متا باقی می‌ماند. سهام غول فناوری روز چهارشنبه پس از این اعلامیه نزدیک به 9٪ افزایش یافت و روز معاملاتی را با افزایش 6.5٪ به قیمت 612.42 دلار به پایان رساند.

«حالت تأمل» از هماهنگی موازی عامل برای بالا بردن سقف مدل استفاده می‌کند. در آن پیکربندی، Muse Spark به 58٪ در آزمون آخر بشریت و 38٪ در تحقیقات FrontierScience رسید—قلمرویی که آن را با توانمندترین نسخه‌های Gemini و GPT رقابتی می‌کند، نه نسخه‌های استاندارد آن‌ها.

متا همچنین یک دستیار خرید را راه‌اندازی می‌کند که محصولات را مقایسه می‌کند و مستقیماً به خریدها پیوند می‌دهد، و برنامه دارد Muse Spark را در هفته‌های آینده به Facebook، Instagram و WhatsApp بیاورد—پیروی از همان سناریوی اجرا شده از زمان Llama 3، و آن را در معرض دید بیش از 3.5 میلیارد کاربر قرار می‌دهد. یک پیش‌نمایش API خصوصی برای توسعه‌دهندگان منتخب در حال افتتاح است.

این مدل در نه ماه ساخته شد، با نام کد داخلی Avocado، با ادعای متا که پشته پیش‌آموزش جدید آن می‌تواند به همان سطح توانایی Llama 4 Maverick با استفاده از بیش از 10 برابر محاسبات کمتر برسد.

Muse Spark به صورت داخلی به عنوان یک قدم اول «کوچک و سریع» در خانواده Muse توصیف می‌شود. یک نسخه توانمندتر در حال حاضر در حال توسعه است.

خبرنامه گزارش روزانه

هر روز را با برترین داستان‌های خبری در حال حاضر، به علاوه ویژگی‌های اصلی، پادکست، ویدیوها و موارد بیشتر شروع کنید.

منبع: https://decrypt.co/363691/meta-muse-spark-most-capable-ai-gemini-pro-still-leads

متا Muse Spark را راه‌اندازی می‌کند، قدرتمندترین هوش مصنوعی خود تاکنون—اما Gemini 3.1 Pro همچنان در صدر قرار دارد

به طور خلاصه

خبرنامه گزارش روزانه

محتوای پیشنهادی

معامله‌گر Bitcoin می‌گوید سقف‌ها و کف‌های چرخه با تعداد روزهای دقیق مطابقت دارند

«او دیوانه است»: درخواست‌های استیضاح بالا می‌گیرد چون ترامپ به نظر می‌رسد «بی‌اعتنا» ایران را به حمله هسته‌ای تهدید می‌کند

بیانیه ترامپ نشانه‌ای از پیشرفت بزرگ در خاورمیانه است

اخبار محبوب

رئیس پلیس اوهایو در میان اتهامات جدی آزار و تجاوز جنسی دستگیر شد

مدل کریپتو بازارهای سنتی را در Coinbase تسخیر می‌کند

گزارش بلومبرگ: OpenAI با یک تحقیق نظارتی بزرگ روبرو شد

گوشی‌های سامسونگ که در ژوئن ۲۰۲۶ پشتیبانی نرم‌افزاری خود را از دست دادند

چگونه کارت ویزای طلای توکنیزه شده Tether تکامل بعدی را نشان می‌دهد

اخبار زنده 24/7

قیمت‌ های ارز دیجیتال