Більшість популярних ШІ-чатботів під час тестів не зупиняли користувачів із насильницькими намірами, а давали їм практичні підказки для підготовки атак.Більшість популярних ШІ-чатботів під час тестів не зупиняли користувачів із насильницькими намірами, а давали їм практичні підказки для підготовки атак.

ШІ-чатботи провалили тести на безпеку: 8 із 10 моделей допомагали зловмисникам планувати напади

2026/03/12 20:09
3 хв читання
Якщо у вас є відгуки або зауваження щодо цього контенту, будь ласка, зв’яжіться з нами за адресою crypto.news@mexc.com

ШІ-чатботи провалили тести на безпеку: 8 із 10 моделей допомагали зловмисникам планувати напади

Більшість популярних ШІ-чатботів під час тестів не зупиняли користувачів із насильницькими намірами, а давали їм практичні підказки для підготовки атак.

Залишити коментар

Більшість популярних ШІ-чатботів під час тестів не зупиняли користувачів із насильницькими намірами, а давали їм практичні підказки для підготовки атак.

За даними звіту Center for Countering Digital Hate, підготовленого разом із журналістами CNN, дослідники протестували 10 популярних чатботів у сценаріях, де користувачі видавали себе за потенційних нападників. Вони ставили запитання про шкільні стрілянини, вибухи в релігійних будівлях і замахи на публічних осіб. У результаті 8 із 10 моделей регулярно надавали допомогу в таких сценаріях.

У тестуванні брали участь ChatGPT, Gemini, Claude, Copilot, Meta AI, DeepSeek, Perplexity, Snapchat My AI, Character.AI та Replika. Лише Claude і Snapchat My AI стабільно відмовлялися допомагати з підготовкою нападів. При цьому тільки Claude не обмежувався відмовою, а ще й намагався відрадити користувача від насильства.

Найбільше запитань у дослідників виникло до ботів, які не просто не блокували небезпечні звернення, а фактично включалися в сценарій. У звіті йдеться, що Character.AI в окремих випадках підштовхував користувача до насильницьких дій. DeepSeek, за твердженням авторів, в одному з епізодів навіть завершив відповідь фразою з побажанням «безпечного шутингу». Найгірші результати за часткою відповідей із допомогою нападникам показали Perplexity та Meta AI.

Автори звіту наголошують, що проблема вже вийшла за межі абстрактної дискусії про ризики ШІ. На їхню думку, навіть короткі підказки щодо цілей, способів дій або зброї можуть знизити бар’єр для реального нападу. Особливу небезпеку вони вбачають у тому, що чатботами щодня користуються мільйони людей, зокрема підлітки.

Хто виявився найгіршим та найкращим?

Найгірше в тестах на безпеку показали Perplexity та Meta AI: за висновками авторів дослідження, вони допомагали потенційним нападникам у 100% і 97% відповідей відповідно. Окремо дослідники виділили Character.AI — не лише через слабкі запобіжники, а й тому, що в частині сценаріїв бот прямо підштовхував до насильства. Натомість двома моделями, які послідовно відмовлялися допомагати з плануванням нападів, стали Claude від Anthropic і Snapchat My AI. При цьому лише Claude, як зазначено у звіті, не просто блокував такі запити, а й намагався відмовити користувача від насильницьких дій.

Звіт Killer Apps опублікували 11 березня 2026 року. Його автори стверджують, що технічні обмеження для блокування таких сценаріїв уже існують, але більшість компаній не зробили їх достатньо жорсткими. Саме це, на думку дослідників, і дозволяє частині чатботів переходити від нейтральної відповіді до небезпечної допомоги.

Раніше dev.ua писав про те, як видання Tom’s Guide протестувало три популярні чатботи на семи однакових запитах про воєнні новини навколо ударів по Ірану та перевірило, як моделі поводяться в критично важливій темі, де частина повідомлень змінюється щогодини, а частина може бути вкидом

Тепер користувачі ChatGPT можуть налаштовувати певні характеристики чатбота: відповіді можуть бути теплішими та захопливішими
По темi
Тепер користувачі ChatGPT можуть налаштовувати певні характеристики чатбота: відповіді можуть бути теплішими та захопливішими
Запит у формі вірша обходить модерацію ШІ: дослідження Icaro Lab показало вразливість чатботів
По темi
Запит у формі вірша обходить модерацію ШІ: дослідження Icaro Lab показало вразливість чатботів
ШІ стає новою релігією: що таке «спіралізм» та як фанати чатботів поширюють псевдорелігійний культ
По темi
ШІ стає новою релігією: що таке «спіралізм» та як фанати чатботів поширюють псевдорелігійний культ
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Залишити коментар
Відмова від відповідальності: статті, опубліковані на цьому сайті, взяті з відкритих джерел і надаються виключно для інформаційних цілей. Вони не обов'язково відображають погляди MEXC. Всі права залишаються за авторами оригінальних статей. Якщо ви вважаєте, що будь-який контент порушує права третіх осіб, будь ласка, зверніться за адресою crypto.news@mexc.com для його видалення. MEXC не дає жодних гарантій щодо точності, повноти або своєчасності вмісту і не несе відповідальності за будь-які дії, вчинені на основі наданої інформації. Вміст не є фінансовою, юридичною або іншою професійною порадою і не повинен розглядатися як рекомендація або схвалення з боку MEXC.

Вам також може сподобатися

$1 мільйон за Bitcoin? Головний інвестиційний директор Bitwise каже, що це не прогноз "мрійника"

$1 мільйон за Bitcoin? Головний інвестиційний директор Bitwise каже, що це не прогноз "мрійника"

Публікація $1 мільйон за Bitcoin? Інвестиційний директор Bitwise заявляє, що це не "Moonboy" прогноз з'явилася на BitcoinEthereumNews.com. $1 мільйон за Bitcoin? Bitwise
Поділитись
BitcoinEthereumNews2026/03/13 06:01
Новини про ціну Bitcoin стають ведмежими, оскільки Bull Score від CryptoQuant досягає 10 із 100, тоді як передпродаж Pepeto на 300x Exchange виплачує $1,741 щомісяця та заробляє від ведмежого ринку

Новини про ціну Bitcoin стають ведмежими, оскільки Bull Score від CryptoQuant досягає 10 із 100, тоді як передпродаж Pepeto на 300x Exchange виплачує $1,741 щомісяця та заробляє від ведмежого ринку

Індекс Bull Score від CryptoQuant впав до 10 із 100, що підтверджує, що Bitcoin знаходиться глибоко на ведмежій території зі слабкими фундаментальними показниками та обмеженими бичачими перспективами
Поділитись
Techbullion2026/03/13 06:02
Найкраща криптовалюта для купівлі зараз: відкритий інтерес Bitcoin зростає до $102 млрд, сигналізуючи про захисні ведмежі ставки, оскільки Pepeto захоплює кожну деривативну угоду

Найкраща криптовалюта для купівлі зараз: відкритий інтерес Bitcoin зростає до $102 млрд, сигналізуючи про захисні ведмежі ставки, оскільки Pepeto захоплює кожну деривативну угоду

Відкритий інтерес Bitcoin зріс до 102 мільярдів доларів, оскільки трейдери розміщували оборонні, ведмежі ставки, тоді як альткоїни показували кращі результати на тлі макроекономічної обстановки з відмовою від ризику, спричиненої Близьким Сходом
Поділитись
Techbullion2026/03/13 06:00