Привет, с наступающим! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.
Неделя выдалась насыщенной: OpenAI выкатили GPT-5.2 и новую версию генератора изображений, Xiaomi неожиданно показали сильную опенсорс-MoE для кода, свежие FLUX.2 [max] и Wan 2.6. Amazon собираются инвестировать в OpenAI, а VPN-расширения крадут данные юзеров.
Всё самое важное — в одном месте. Поехали!
📋 В этом выпуске:
🧠 Модели и LLM
GPT-5.2 — обновление флагмана OpenAI
Xiaomi MiMo-V2-Flash — опенсорс-MoE для кода и агентных задач
🎨 Генеративные нейросети
ChatGPT Images — новый генератор картинок от OpenAI
FLUX.2 [max] — самая мощная версия FLUX.2
Wan 2.6 — видеогенератор от Alibaba с мультишот-историями
Trellis.2 — генерация 3D-моделей по картинкам
🔧 AI-инструменты и платформы
Bulka — лайвкодинг музыки в браузере
Google Disco — ИИ-браузер, который собирает мини-приложения под запрос
🧩 AI в обществе и исследованиях
Amazon может инвестировать в OpenAI $10 млрд
Расширения с VPN тайно собирали переписки с чат-ботами
Пользователи проиграли $6 млн на ставках про «ИИ — Человек года»
Андроид-регулировщик заработал на перекрёстке в Китае
OpenAI выпустили GPT-5.2 — флагманскую модель, в которой сделали большой упор на надёжность и работу с документами.
Модель вплотную подобралась к человеческому уровню мышления:
ARC-AGI-2: адский тест для ИИ, GPT-5.2 совершила скачок с 17.6% до 52.9%. Средний результат человека — 60%
Математика: Thinking-версия впервые идеально прошла один из самых сложных экзаменов — AIME 2025 на 100%
Реальная работа: на тесте GDPval на профессиональные задачи из 44 профессий GPT-5.2 набрала 70-74%. Это сравнимо с сильным специалистом
Также прокачали:
Кодинг: новый рекорд на SWE-Bench Pro — 55.6%.
Надёжность: галлюцинаций на 30% меньше, почти 100% точность на длинном контексте в 256K токенов
GPT-5.2 уже доступен в API и для платных подписчиков.
🔗 Блогпост 🔗 Prompting Guide 🔗 Prompt Optimizer
Xiaomi представили MiMo-V2-Flash — открытую языковую модель, которая по бенчмаркам не уступает топовым решениям Google и OpenAI.
И это один из самых сильных релизов за неделю в опенсорсе — модель набирает 94,1% на AIME 2025 и 73,4% на SWE-Bench Verified.
Это MoE-модель с 309B параметров и 15B активных, заточенная под быстрые рассуждения и агентные сценарии. Контекст — до 256K токенов. MiMo-V2-Flash использует гибридное внимание и предсказание нескольких токенов в секунду, что снижает стоимость вывода.
MiMo-V2-Flash уверенно справляется и с кодингом, и с креативными текстами, что делает её универсальным рабочим инструментом.
Модель полностью доступна бесплатно в открытом доступе, но Xiaomi отмечают, что в будущем формат распространения может измениться.
🔗 Hugging Face
OpenAI обновили генератор картинок. ChatGPT Images — новый генератор изображений на базе GPT Image 1.5.
По первым тестам это прямой и уверенный ответ Nano Banana Pro: в слепых сравнениях LMArena модель уже заняла 1-е место.
Что улучшили:
Скорость. Работает в 4 раза быстрее прошлой модели, генерация занимает +- 10 секунд
Редактирование. Модель отлично переносит лица и детали персонажа при правках. Можно создавать длинные серии изменений, не коверкая внешность
Умная генерация. Лучше понимает физику: сложные позы, взаимодействия людей. Отлично рендерит текст и точнее следует промпту
Стиль. Знаменитого «желтого фильтра» OpenAI стало меньше, картинки выглядят реалистичнее
Доступ уже открывают всем пользователям ChatGPT, включая бесплатный тариф и API.
🔗 ChatGPT Images 🔗 Официальный анонс 🔗 Гайд по промптингу
BFL выпустили свою самую мощную модель — FLUX.2 [max].
Она сразу залетела в топы рейтингов, заняв #2 место на Artificial Analysis и #3 на Lmarena, уступив только Nano Banana Pro.
Веса закрыты, пока доступна только по API на fal.ai и без тренировки LoRA.
Главные фишки:
Grounded Generation. Киллер-фича — поиск в интернете в реальном времени. Добавьте в промпт «Search the internet», и модель найдет актуальную погоду, результаты вчерашних матчей или исторические факты, чтобы добавить их на картинку.
Консистентность. Поддерживает до 10 референсных изображений.Персонажи, продукты и стиль остаются неизменными в разных генерациях.
Inpainting. Значительно улучшено редактирование изображений, например, смена времени суток или освещения.
🔗 fal.ai 🔗 Блогпост
Внезапно, Wan 2.6 — мощная модель от Alibaba, и, похоже, новый конкурент Sora. Уже доступна на официальном сайте, fal.ai и Replicate
Главная фишка — полноценные мульти-шот истории с автоматическим планированием сцен, умными переходами и сохранением консистентности вместо коротких роликов.
Главное:
Качество и длина. Видео до 15 секунд в разрешении 1080p и 24 fps. Вертикальные, горизонтальные, квадратные разрешения.
Звук и Липсинк. Нативная синхронизация картинки и аудио. Модель поддерживает диалоги, музыку, звуковые эффекты и мультиязычный липсинк. Можно загружать своё аудио
Режим Reference-to-Video. Принимает на вход до трёх видео для обеспечения максимальной похожести персонажей и объектов между сценами
Генерация картинок. Wan 2.6 умеет в картинки кинематографического качества с текстом. Круто редактирует, например, точно перекрашивает объекты, сохраняя отражения.
На официальном сайте дают 150 приветственных кредитов, хватит на ~75 секунд видео.
По ценам, 720p — ~7 руб. за секунду видео, 1080p — ~11 руб. за секунду видео.
🔗 Попробовать Wan 2.6 🔗 Документация API 🔗 Блогпост с примерами
Microsoft выпустили Trellis.2 — новую открытую модель для генерации текстурированных 3D-моделей по одному изображению.
Модель компактная по меркам 3D: 4 млрд параметров, запускается на GPU с 24 GB видеопамяти.
Trellis.2 хорошо воспроизводит геометрию, детали и текстуры референса. На выходе — полноценный 3D-mesh с PBR-материалами.
По скорости тоже всё прилично: генерация 1024³ занимает 17 секунд, 1536³ — минута на H100. Полученную сетку можно дальше редактировать, что делает модель полезной для геймдева, визуализации и прототипирования.
Веса открыты, лицензия MIT, есть демо, код и подробная документация.
🔗 Hugging Face 🔗 GitHub 🔗 Официальная страница проекта
Bulka — новый инструмент для лайвкодинга музыки в браузере, который объединяет программирование, нейросети и звук.
Проект вырос из Strudel, серьёзно развился и стал доступнее для широкой аудитории.
По сути, можно полностью контролировать процесс создания трека, задавать тональность, темп, использовать свои сэмплы. При этом не нужно глубоко разбираться в теории музыки или программировании: часть задач берёт на себя встроенный бесплатный AI-агент на базе gpt4free.
Главное — интерфейс и документация полностью на русском, запись треков прямо из браузера в WAV, встроенная библиотека семплов и шеринг музыкальных скетчей.
Ещё можно собирать генеративные визуалы под бит, включая фото и видео-фоны.
Проект полностью бесплатный и с открытым исходным кодом. При использовании AI-провайдеров с ключами они хранятся локально, только в браузере пользователя.
🔗 Bulka.app 🔗 Интерактивные уроки 🔗 GitHub
Google показали Disco — экспериментальный ИИ-браузер, который превращает поисковые запросы и веб-страницы в интерактивные мини-приложения.
Это не очередной апдейт Chrome, а отдельный продукт с упором на агентный режим работы.
Вместо обычной выдачи Disco часто собирает интерфейс под задачу. Поиск событий для отпуска превращается в интерактивную карту, изучение языка — в персональный аналог Duolingo, а подбор курсов или материалов — в готовое рабочее приложение.
В основе — AI Mode с агентом Gemini, который умеет действовать поверх вкладок и контента.
Сейчас Disco находится в закрытом бета-тестировании. Запись для тестеров уже открыта.
🔗 Disco в Google Labs
Amazon ведёт переговоры об инвестициях в OpenAI на сумму около $10 млрд.
Обсуждение находится на ранней стадии, условия сделки ещё не финализированы. В случае соглашения оценка OpenAI может превысить $500 млрд.
Ключевой элемент сделки— использование AI-чипов Amazon Trainium. OpenAI может начать использовать их вместо части GPU Nvidia, а Amazon — получить прямой доступ к нагрузке одной из самых требовательных AI-платформ на рынке.
С октября партнёрство OpenAI и Microsoft перестало быть эксклюзивным. Microsoft инвестировала в OpenAI более $13 млрд, но также вложила $5 млрд в Anthropic, конкурента ChatGPT, которого поддерживает и Amazon.
По данным Reuters, OpenAI также рассматривает продажу корпоративной версии ChatGPT Amazon и готовится к IPO в 2027 году
🔗 CNBC 🔗 Reuters
Исследователи выяснили, что бесплатные VPN-расширения Urban и 1Click в фоновом режиме собирали переписки пользователей с чат-ботами ChatGPT, Claude, Grok, Copilot.
В коде расширений был найден скрытый скрипт, который перехватывал запросы, ответы и метаданные чатов.
По данным Koi Security, сбор мог затронуть около 8 млн пользователей. Использование данных было указано в пользовательском соглашении — переписки с ИИ передавались для маркетинговых целей, — но в описании расширений в Chrome Web Store это сформулировано неявно.
Скрипт присутствовал сразу в нескольких расширениях разработчика: Urban VPN Proxy, 1ClickVPN Proxy, Urban Browser Guard и Urban Ad Blocker. Отключить сбор данных невозможно — помогает только удаление расширения.
Будьте внимательны: несмотря на публикацию отчёта, Urban VPN всё ещё доступен в Chrome Web Store и сохраняет плашку «Рекомендованные».
🔗 Отчёт Koi Security
В этом году журнал Time выбирал «Человека года», и вокруг решения развернулась неожиданная история на рынках предсказаний.
Многие пользователи ставили деньги на то, что победителем станет «ИИ» как технология, а не конкретный человек или группа людей.
В итоге Time назвал «Человеком года» «Архитекторов ИИ» — руководителей индустрии, среди которых Дженсен Хуанг, Сэм Альтман и Илон Маск. Формально это люди, а не сама технология.
На платформе Polymarket такие ставки были признаны проигрышными. В сумме пользователи потеряли около $6 млн. В чатах начались споры и скандалы: часть трейдеров утверждала, что ставила по сути на то же самое, ведь речь идёт об ИИ, пусть и через его создателей.
Платформа ответила просто: награду получили люди, а не ИИ, значит ставка не сыграла.
При этом другая биржа, Kalshi, засчитала выигрыши тем, кто ставил на конкретные имена из списка «Архитекторов». В результате одно и то же событие привело к разным исходам и убыткам — в зависимости от платформы.
🔗 Time 🔗 404 Media
В китайском Ханчжоу на одном из оживлённых перекрёстков запустили робота-регулировщика Hangxing No.1. Он стоит на дороге, показывает сигналы руками, свистит и следит за движением.
Робот распознаёт нарушения с помощью камер и датчиков: мотоциклистов без шлемов, машины за стоп-линией и пешеходов на красный. Видео сохраняются в систему, но штрафы не выписываются — андроид только делает голосовые замечания вроде «наденьте шлем» или «дождитесь зелёного».
Hangxing подключён к городской системе трафика и получает данные о пробках и светофорах. При этом он работает под контролем живого полицейского, а алгоритмы продолжают обучаться.
По данным властей, за первые дни теста доля участников движения, соблюдающих правила на этом перекрёстке, выросла с 82% до 97% — даже без наказаний.
🔗 Hangxing No.1 🔗 Репортаж
В эти декабрьские дни 1993 года мир изменился навсегда: ID Software выпустила DOOM, превратив офисные компьютеры в порталы в ад.
Открытая архитектура позволила фанатам создавать тысячи модов, заложив основу современного геймдева. Это напоминает нам о важности оптимизации и чистого кода в эпоху ИИ.
Символично, что сегодня, когда нейросети учатся рендерить кадры игры на лету без движка, мы возвращаемся к тому же вопросу, что и 30 лет назад: «А потянет ли это DOOM?»
Неделя выдалась плотной: OpenAI и Xiaomi показали сильные модели, генерация изображений и видео стремительно развиваются.
Ну а рынок продолжает лихорадить — чипы дорожают, обсуждаются крупные инвестиции, всплывают вопросы приватности, а общество уже сталкивается с ИИ не в теории, а на ставках, в браузерах и даже на перекрёстках.
ИИ развивается не рывками, а сразу по нескольким фронтам — модели, интерфейсы, инфраструктура и повседневные сценарии начинают сходиться в одну систему.
До встречи в следующем выпуске!
Источник


