به طور خلاصه
- Muse Spark جدید متا نشاندهنده تغییر به سمت هوش مصنوعی چندوجهی بومی بسته با استدلال مبتنی بر AI Agent است.
- متا دستاوردهای قوی معیار در سلامت و جستجو را گزارش میدهد، اما هنوز در استدلال اصلی و کدنویسی از Gemini عقب است.
- ساخته شده در نه ماه با محاسبات بسیار کمتر، این به استراتژی هوش مصنوعی کارآمدتر جدید اشاره دارد.
متا Muse Spark را روز چهارشنبه راهاندازی کرد که اولین مدل ساخته شده توسط Meta Superintelligence Labs است—تیمی که نه ماه پیش تحت نظر مدیر ارشد هوش مصنوعی الکساندر وانگ پس از خرید 14 میلیارد دلاری Scale AI توسط متا جمع شدند. اکنون در meta.ai و اپلیکیشن Meta AI فعال است و عرضه آن به Facebook، Instagram و WhatsApp در چند هفته آینده در راه است.
این فقط یک ارتقای چتبات دیگر یا نسخه جدید Llama نیست. Muse Spark به صورت بومی چندوجهی است—تصاویر، متن و صدا را از پایه پردازش میکند، به جای اینکه بینایی را به یک مدل متنی موجود اضافه کند. با زنجیره بصری تفکر، پشتیبانی از استفاده از ابزار و چیزی که متا آن را «حالت تأمل» مینامد همراه است: تنظیماتی که چندین AI Agent را به صورت موازی اجرا میکند تا مشکلات سختتر را حل کند. این پاسخ متا به حالتهای تفکر گسترده از Gemini Deep Think گوگل و GPT Pro اوپنایآی است.
متا در اعلامیه رسمی نوشت: «Muse Spark اولین قدم در نردبان مقیاسبندی ما و اولین محصول یک بازنگری کامل تلاشهای هوش مصنوعی ما از پایه است. برای پشتیبانی از مقیاسبندی بیشتر، ما سرمایهگذاریهای استراتژیک در کل پشته انجام میدهیم—از تحقیق و آموزش مدل تا زیرساخت، از جمله مرکز داده Hyperion.»
این شرکت با بیش از 1000 پزشک برای تنظیم دادههای آموزشی برای استدلال پزشکی Muse Spark کار کرد. نتایج در HealthBench Hard—یک معیار پرسوجوهای سلامتی باز—چشمگیر است: Muse Spark امتیاز 42.8 را کسب کرد، در مقایسه با 40.1 برای GPT 5.4 و فقط 20.6 برای Gemini 3.1 Pro. این تفاوت جزئی نیست.
در جستجوی عامل (DeepSearchQA)، Muse Spark نیز با 74.8 پیشتاز است و Gemini (69.7) و GPT 5.4 (73.6) را شکست داد. در CharXiv Reasoning—درک شکل از مقالات علمی—امتیاز 86.4 کسب کرد که بالاترین امتیاز در بین مدلهای مقایسه است.
برای کسانی که به شکستن هوش مصنوعی علاقه دارند، این مدل در عرض چند دقیقه شکسته شد:
اما خوب با عالی یکی نیست. تصویر کلی معیار نشان میدهد که Gemini 3.1 Pro هنوز در اکثر دستهها جلوتر است. شکاف در ARC AGI 2، معیار پازل استدلال انتزاعی، بیشترین قابل مشاهده است: Gemini امتیاز 76.5 را در مقابل 42.5 Muse Spark کسب کرد.
در کدنویسی (LiveCodeBench Pro)، 82.9 Gemini از 80.0 متا جلوتر است. در MMMU Pro—درک چندوجهی—Gemini امتیاز 83.9 در مقابل 80.4 کسب کرد. وبلاگ خود متا شکافهای عملکرد فعلی در سیستمهای عامل افق بلند و گردشهای کاری کدنویسی را تصدیق میکند.
همچنین یک تغییر استراتژیک قابل توجه در این راهاندازی وجود دارد. Muse Spark یک مدل بسته است—معماری و وزنهای آن عمومی نخواهد شد. این انحراف شدیدی از Llama است که شهرت متا را در حلقههای هوش مصنوعی باز ساخت. پس از استقبال ناامیدکننده Llama 4 در اوایل امسال، به نظر میرسد متا تصمیم گرفته است که فصل بعدی باید متفاوت نوشته شود.
این شرکت میگوید امیدوار است نسخههای آینده Muse را منبع باز کند، اما در حال حاضر کد در داخل متا باقی میماند. سهام غول فناوری روز چهارشنبه پس از این اعلامیه نزدیک به 9٪ افزایش یافت و روز معاملاتی را با افزایش 6.5٪ به قیمت 612.42 دلار به پایان رساند.
«حالت تأمل» از هماهنگی موازی عامل برای بالا بردن سقف مدل استفاده میکند. در آن پیکربندی، Muse Spark به 58٪ در آزمون آخر بشریت و 38٪ در تحقیقات FrontierScience رسید—قلمرویی که آن را با توانمندترین نسخههای Gemini و GPT رقابتی میکند، نه نسخههای استاندارد آنها.
متا همچنین یک دستیار خرید را راهاندازی میکند که محصولات را مقایسه میکند و مستقیماً به خریدها پیوند میدهد، و برنامه دارد Muse Spark را در هفتههای آینده به Facebook، Instagram و WhatsApp بیاورد—پیروی از همان سناریوی اجرا شده از زمان Llama 3، و آن را در معرض دید بیش از 3.5 میلیارد کاربر قرار میدهد. یک پیشنمایش API خصوصی برای توسعهدهندگان منتخب در حال افتتاح است.
این مدل در نه ماه ساخته شد، با نام کد داخلی Avocado، با ادعای متا که پشته پیشآموزش جدید آن میتواند به همان سطح توانایی Llama 4 Maverick با استفاده از بیش از 10 برابر محاسبات کمتر برسد.
Muse Spark به صورت داخلی به عنوان یک قدم اول «کوچک و سریع» در خانواده Muse توصیف میشود. یک نسخه توانمندتر در حال حاضر در حال توسعه است.
خبرنامه گزارش روزانه
هر روز را با برترین داستانهای خبری در حال حاضر، به علاوه ویژگیهای اصلی، پادکست، ویدیوها و موارد بیشتر شروع کنید.
منبع: https://decrypt.co/363691/meta-muse-spark-most-capable-ai-gemini-pro-still-leads







