Купить крипто Рынки Спот ФьючерсыUNH Сбережения Центр событий

Еще

ChatGPT может доминировать на рынке ИИ-чатботов, но новый отчет предполагает, что популярность не равна надежности. А...ChatGPT может доминировать на рынке ИИ-чатботов, но новый отчет предполагает, что популярность не равна надежности. А...

ChatGPT назван наименее надежным рабочим чат-ботом в новом отчете о надежности ИИ

Источник: Technext

2025/12/11 02:38

3м. чтение

SLEEPLESSAI$0.02007-0.83%

Торговля

NOT$0.0003738-1.68%

Торговля

Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

ChatGPT может доминировать на рынке ИИ-чатботов, но новый отчет показывает, что популярность не равна надежности. Исследование декабря 2025 года, изучающее работу ведущих ИИ-чатботов в повседневных рабочих сценариях, признало ChatGPT наименее надежным вариантом для профессиональных задач. Эти выводы вызывают новые опасения у компаний, которые все больше зависят от инструментов ИИ в повседневной работе.

Исследование, проведенное компанией Relum, не просто изучало характеристики на бумаге; они провели стресс-тестирование десяти основных ИИ-чатботов в реальных профессиональных сценариях. Результаты? Огромный разрыв между шумихой и реальностью.

Исследование оценивало каждый чатбот по четырем ключевым критериям. Это были частота галлюцинаций, оценки продукта пользователями, согласованность ответов по задачам и частота простоев. Каждый фактор вносил вклад в комплексную оценку риска надежности, причем более высокие баллы указывали на большие потенциальные проблемы на рабочем месте.

Вот статистика, которая должна не давать спать руководителям бизнеса: несмотря на контроль над огромными 81% рынка и высокие оценки пользователей, ChatGPT зафиксировал частоту галлюцинаций в 35%.

Простыми словами, это означает, что более одного из каждых трех ответов содержит сфабрикованную или неверную информацию. Если вы используете его для написания фантастического романа, это нормально, но если вы используете его для отчетов о соответствии или принятия финансовых решений, это рецепт катастрофы. Следовательно, исследование присвоило ChatGPT оценку риска надежности 99 из 99, худшую в группе.

ChatGPT

Google не справился лучше. Хотя у Gemini было лучшее время безотказной работы, он фактически показал худшие результаты по чистой точности, зарегистрировав самую высокую частоту галлюцинаций во всей группе - 38%. Это подчеркивает странный парадокс на текущем рынке ИИ: инструменты, которые мы используем больше всего, часто являются теми, кто больше всего борется за сохранение точности своих фактов.

Claude и Meta AI занимают неопределенную среднюю позицию. Claude, несмотря на то, что является фаворитом за свой стиль письма, занял второе место по ненадежности из-за частых простоев и 17% частоты галлюцинаций. Meta AI был более точным (15% галлюцинаций), но пользователям, похоже, не нравится опыт работы с ним, давая ему самую низкую оценку удовлетворенности в группе (3,4 из 5).

"Аутсайдеры" – Grok и DeepSeek перехватывают инициативу у ChatGPT

Если крупные имена теряют позиции, кто же на самом деле выполняет работу? Удивительно, но исследование указывает на Grok и DeepSeek как на самые надежные инструменты для профессионального использования. У них нет огромных маркетинговых бюджетов или узнаваемости бренда OpenAI, но они просто работали лучше. DeepSeek не зафиксировал ни одного сбоя в обслуживании и свел галлюцинации к минимуму.

Kimi также показал хорошие результаты, найдя золотую середину между согласованностью и временем безотказной работы. Между тем, платные варианты, такие как Perplexity AI, были надежными, но вызвали вопросы о том, стоит ли подписка своих денег, когда более дешевые, менее известные альтернативы превосходят их по производительности.

Руководитель технологического отдела（CTO） Relum, Разван-Лучиан Хайдук, предупредил, что надежность должна быть центральным фактором при принятии решений о внедрении ИИ. Он отметил, что около 65% американских компаний теперь используют ИИ-чатботы в повседневных рабочих процессах. Почти 45% сотрудников признаются, что делятся конфиденциальной информацией компании с этими инструментами.

По мере того как ИИ все больше внедряется в повседневную работу, риски дезинформации множатся. Хайдук подчеркнул, что наиболее широко используемый чатбот не всегда является лучшим выбором для каждой отрасли. Точность, время безотказной работы и производительность для конкретных задач должны перевешивать узнаваемость бренда.

Отчет служит проверкой реальности для отрасли. Доверие не должно даваться только потому, что чатбот известен; оно должно быть заработано через последовательную, проверяемую правду. Прямо сейчас похоже, что лидерам рынка предстоит серьезно наверстывать упущенное.

Возможности рынка

Sleepless AI Курс (SLEEPLESSAI)

$0.02007

$0.02007$0.02007

-2.28%

USD

График цены Sleepless AI (SLEEPLESSAI) в реальном времени

Комбо Кубка мира: Цель на 200x

До 20 комбо в матчах Кубка мира за 1 ордер

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Новости 24/7 в прямом эфире

Еще

Квартальное сжигание BNB, выполненное 15 июля 2026 года, сократило предложение на 1,62 миллиона токенов

Автор: BNB Chain08:02

23-часовая торговля акциями США стартует 6 декабря, привлекая глобальные потоки капитала

Автор: DEG06:13

Три миллиона HYPE проданы за три часа на общую сумму двадцать миллионов долларов, что повлияло на рыночную динамику

Автор: Kripto Gelişim05:08

Morgan Stanley открывает спотовую торговлю биткоином для всех клиентов ETrade, расширяя институциональный доступ

Автор: BlockNews01:21

Спотовый биткоин-ETF от BlackRock хранит 47 миллиардов долларов, что свидетельствует о сохраняющемся интересе институциональных инвесторов

Автор: BlockNews2026/07/16 23:24

Быстрое чтение

Еще

Цены на криптовалюту

Биткоин

BTC

$63,806.06

$63,806.06$63,806.06

-1.36%

Эфириум

ETH

$1,864.68

$1,864.68$1,864.68

-0.91%

USDCoin

USDC

$1.00068

$1.00068$1.00068

0.00%

Солана

SOL

$75.33

$75.33$75.33

-1.69%

Рипл

XRP

$1.0871

$1.0871$1.0871

-2.46%

Активируйте для привилегий

0 комиссий, премиум-поддержка и покрытие убытков.

ChatGPT назван наименее надежным рабочим чат-ботом в новом отчете о надежности ИИ

"Аутсайдеры" – Grok и DeepSeek перехватывают инициативу у ChatGPT

Вам также может быть интересно

Меняющееся лицо ухода за пожилыми людьми в Малайзии — Сайед Мохаммад Реза Ямани Сайед Умар

Не лазейка: экспортный контроль Сингапура в сфере ИИ позволяет Китаю легально использовать американский ИИ

По ценным бумагам KZOSP проводится дискретный аукцион

Популярные новости

10.07.2026, 10-27 (мск) изменены значения верхней границы ценового коридора и диапазона оценки рыночных рисков ценной бумаги RU000A0JS4Z7 (ВЭБ.РФ 21).

Утреннее обновление NordFX — 10 июля 2026 г.

Торговый баланс Германии в мае вырос до 19,1 млрд евро, значительно превысив прогнозы

Arbitrum объявляет о десяти инновационных командах — и почему это не просто шумиха

ARK Invest Кэти Вуд покупает акции Circle на $13,7 млн, продавая акции Robinhood

Новости 24/7 в прямом эфире

Быстрое чтение

Биткойн восстанавливает 65 тысяч, но данные в цепочке расходятся с тем, из чего на самом деле сделано это ралли

Предварительный просмотр доходов Arm Q2 2026 может ли лицензирование чипов AI и доходы от роялти продолжать побеждать

Meta Q2 2026 Earnings Preview Рекордный доход от рекламы соответствует ставке AI в размере 145 миллиардов долларов

Почему рынки пересматривают снижение ставок ФРС после CPI

Эффект первой недели MiCA после полной реализации меняет европейский крипторынок

Цены на криптовалюту