Я давно освещаю прорывы в ИИ. В большинстве случаев заголовок обещает больше, чем даёт статья.Этот случай — другой.Польский математик Бартош Наскрэцки потратил Я давно освещаю прорывы в ИИ. В большинстве случаев заголовок обещает больше, чем даёт статья.Этот случай — другой.Польский математик Бартош Наскрэцки потратил

[Перевод] Как математик 20 лет строил задачу, которую ИИ не сможет решить, а GPT-5.4 сломал ему картину мира

2026/03/19 12:25
7м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com
024e9481175632c0b60ca189469afdd1.png

Я давно освещаю прорывы в ИИ. В большинстве случаев заголовок обещает больше, чем даёт статья.

Этот случай — другой.

Польский математик Бартош Наскрэцки потратил 20 лет на создание одной из сложнейших задач, когда-либо включённых в ИИ-бенчмарк. Он вложил в неё всю свою исследовательскую карьеру. Задокументированное решение занимает 13 плотных страниц. Он был настолько уверен, что ни одна машина не справится, что ещё несколько месяцев назад публично называл ИИ «очень продвинутым калькулятором».

b49b45eb52fac1f8d601612d37828d5c.png

А потом GPT-5.4 решил его задачу.

И как отреагировал Наскрэцки? Он не стал упираться. Не стал оправдываться. Он назвал это своим «моментом Хода 37» и написал: «Моя сингулярность только что случилась… и по ту сторону есть жизнь — уходящая в бесконечность!»

Давайте разберёмся, почему это важно.


Задача была создана, чтобы быть нерешаемой

Контекст. Epoch AI ведёт бенчмарк под названием FrontierMath. Это не обычный математический тест. Он содержит 350 оригинальных задач, охватывающих теорию чисел, алгебраическую геометрию, топологию, комбинаторику и математический анализ. Самый сложный уровень, Tier 4, — это 48 задач исследовательского уровня, настолько трудных, что даже специалисту с PhD потребуется минимум месяц только на то, чтобы понять, как к одной из них подступиться.

Когда FrontierMath запустился в конце 2024 года, лучшие ИИ-модели решали менее 2% задач. Филдсовский лауреат Теренс Тао назвал их чрезвычайно сложными. Его коллега Игорь Пак предположил, что некоторые могут сопротивляться ИИ до 50 лет.

081cd20943fb4c2619c1e5ebe1a8c763.png

Наскрэцки был одним из всего пяти европейских математиков, приглашённых создавать задачи для FrontierMath. Он — заместитель декана факультета математики и информатики Познаньского университета имени Адама Мицкевича. Его исследования охватывают арифметическую геометрию, эллиптические кривые и гипергеометрические мотивы. Он даже писал статью в соавторстве с Кеном Оно — одним из ведущих мировых специалистов по теории чисел.

Это не случайный профессор. Это один из тех людей, которым создатели бенчмарка доверили построить задачи, достаточно сложные, чтобы ставить ИИ в тупик на годы вперёд.

Его задача опиралась на 15 лет накопленной экспертизы. Решение — 13 страниц плотной математики. Ответ — очень большое число, специально подобранное, чтобы исключить угадывание. Он был уверен, что задача простоит годы.

Не простояла.


От 2% до 50% за шестнадцать месяцев

Траектория ошеломляет.

  • Конец 2024: лучшие модели решают менее 2% FrontierMath.

  • Середина 2025: GPT-5 Pro набирает 13% на Tier 4 — на этом уровне до тех пор были решены всего три задачи.

  • Январь 2026: GPT-5.2 Pro подскакивает до 31% на Tier 4 и самостоятельно решает задачи Эрдёша — что подтвердил лично Теренс Тао.

  • Март 2026: GPT-5.4 Pro выходит на 50% по уровням 1–3 и 38% по Tier 4.

Двадцатикратное улучшение за шестнадцать месяцев.

И вот что делает это ещё интереснее: GPT-5.4 показал лучшие результаты на скрытых задачах, к которым у OpenAI не было доступа. Он решил 55% из них — против 25% из тех, на которых OpenAI теоретически мог тренироваться. Это важно, потому что подрывает аргумент «они просто натренировались на ответах».


И вам не нужна подписка за сотни долларов, чтобы попробовать возможности ведущих ИИ-моделей на своих задачах. Сервисы вроде BotHub дают доступ к GPT-5.4, Claude 4.6 и другим топовым нейросетям в одном интерфейсе. Тестируйте, сравнивайте, находите инструмент, который усилит именно вашу экспертизу — как GPT-5.4 усилил Наскрэцки.

a0fcd18c93b77cd5181f5a10897e08cb.png

Для доступа не требуется VPN, можно использовать российскую карту.


Решение было элегантным, а не грубым перебором

Наскрэцки убедило не только то, что модель получила правильный ответ. А то, как она это сделала.

GPT-5.4 не продрался силой через 13 страниц математики. Он заметил паттерн и экстраполировал из него, найдя обходной путь, который позволил избежать более тяжёлого математического аппарата, использованного Наскрэцки в собственном решении. Математик описал подход как «чистый и элегантный» и сказал, что он ощущается «почти по-человечески».

Вот в чём ключевое различие. Предыдущие заявления о том, что ИИ «решает» математические задачи, часто оказывались замаскированным поиском по литературе. В октябре 2025-го исследователи OpenAI заявили, что GPT-5 решил задачи Эрдёша. Выяснилось, что модель просто нашла существующие решения через веб-поиск. Томас Блум, который ведёт сайт задач Эрдёша, назвал это «серьёзным искажением действительности».

Но задача Наскрэцки была специально сконструирована так, чтобы у неё не было существующего решения в интернете. Задачи FrontierMath — оригинальные. Ответы не публикуются. Искать было нечего. GPT-5.4 должен был рассуждать самостоятельно.


Оговорка, которую стоит сделать

Хочу быть честным. Не каждое решение GPT-5.4 было столь же безупречным. В том же оценочном прогоне GPT-5.4 справился с ещё одной задачей Tier 4, которую до этого не решала ни одна модель. Но предварительный анализ Epoch AI показал: модель обнаружила препринт 2011 года, о существовании которого сам автор задачи не знал. Фактически она обошла предполагаемую математическую работу, всплыв забытое исследование.

Это повторяющаяся проблема. По мере того как модели получают доступ к веб-поиску, граница между «подлинным рассуждением» и «изощрённым поиском по литературе» размывается. Как точно сформулировал Максвелл Кутер из Computerworld: эти модели — в конечном счёте продвинутые поисковые системы, эффективность которых зависит от доступа к информации и скорости её усвоения.

Обе вещи могут быть верны одновременно. GPT-5.4 способен подлинно рассуждать над одними задачами — и находить решение через паттерн-матчинг для других. Вопрос: каково соотношение? И насколько быстро оно смещается в сторону подлинного рассуждения?


Почему «Ход 37» — точная метафора

Сравнение Наскрэцки с Ходом 37 AlphaGo точнее, чем может показаться. В марте 2016 года AlphaGo сделал ход против Ли Седоля, настолько творческий, что экспертные комментаторы поначалу решили — это ошибка. Оказалось — гениальный ход, изменивший представления о том, как играть на высшем уровне. Профессиональные игроки не отмахнулись — они начали изучать.

Наскрэцки утверждает то же самое о математическом подходе GPT-5.4. Модель не просто сравнялась с человеческой производительностью. Она продемонстрировала нечто, похожее на математическое прозрение: нашла подход, который сам создатель задачи считает обоснованным и интересным.

Менее года назад Наскрэцки говорил, что машины на это не способны. Его готовность публично пересмотреть эту позицию — в реальном времени и без оговорок — сама по себе является важным свидетельством.


Проблема независимости бенчмарка

Один момент, которому уделяется недостаточно внимания: FrontierMath финансируется OpenAI.

OpenAI имеет эксклюзивный доступ ко всем 290 задачам уровней 1–3 и решениям 237 из них. Также у компании есть доступ к 28 из 48 задач Tier 4 и их решениям. Epoch AI сохраняет остальные как скрытый набор.

То, что GPT-5.4 показал сопоставимые результаты на скрытых задачах, даёт определённую уверенность. Но сама конструкция по-прежнему поднимает вопросы о независимости бенчмарка, которые отрасли необходимо решать по мере роста ставок.

Это не теория заговора. Это структурный конфликт интересов. Когда компания, результаты которой оцениваются, финансирует оценку, — результаты заслуживают дополнительной проверки. Даже если цифры в этот раз сходятся.


Что это значит для науки

Как человек, потративший годы на докторскую в области медицинского ИИ, я воспринимаю эту историю по-особенному.

Моя работа включала построение моделей глубокого обучения для прогнозирования исходов комы по КТ-снимкам. Тот тип работы, где месяцами вглядываешься в архитектуры, функции потерь и метрики оценки. Где каждое инкрементальное улучшение даётся с трудом.

А теперь представьте ИИ-систему, которая может рассуждать через 13 страниц плотного математического доказательства, найдя обходной путь, который ни один человек не рассматривал. Не перебором. Через экстраполяцию паттернов.

Вывод для науки не в том, что учёные становятся ненужными. Сам Наскрэцки сформулировал лучше всех: он приобрёл инструмент, который понимает его идеи на экспертном уровне и позволяет ему работать «на совершенно новом уровне». Математик не заменён. Математик усилен.

Ту же картину я наблюдаю в медицинском ИИ, разработке лекарств, вычислительной биологии. Модели не замещают экспертов. Они сжимают пространство поиска. Выводят на поверхность связи, которые люди пропускают. Помогают не сдаваться в тот момент, когда обычно опускаются руки.

Эрнест Рю из UCLA сделал аналогичное наблюдение, когда GPT-5 помог ему решить 40-летнюю задачу оптимизации. Он сказал то, что запало мне в голову: после трёх дней упорных попыток он обычно бросил бы. Но с GPT-5, генерирующим постоянный поток новых идей, задача казалась в пределах досягаемости дольше, чем обычно.

Этот психологический сдвиг может значить больше, чем любой результат бенчмарка.


Итог

Математик потратил два десятилетия на создание задачи, которую, по его убеждению, ИИ не сможет решить.

GPT-5.4 решил её элегантно. Математик назвал это «сингулярностью» — и вернулся к работе. Теперь — с соавтором, способным взаимодействовать с его идеями на высшем уровне.

Это не хайп. Это не PR-трюк. Это фальсифицируемый эмпирический результат от эксперта предметной области, который ранее сомневался в способностях ИИ.

Сингулярность — по крайней мере для одного математика в Познани — это не метафизическое событие. Это профессиональная реальность.

И по ту сторону есть жизнь.

Источник

Возможности рынка
Логотип 4
4 Курс (4)
$0.007103
$0.007103$0.007103
+0.60%
USD
График цены 4 (4) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно