Олександр Кузьменко ШІ 23 грудня 2025, 17:55 2025-12-23
Розробники Lapa LLM створили лідерборд, який порівнює вправність роботи ШІ-моделей з українською мовою
Юрій Панів, один з розробників української національної ШІ-моделі Lapa LLM, повідомив про створення лідерборду, що містить заміри як добре працюють великі мовні моделі з українською мовою.
Залишити коментар
Юрій Панів, один з розробників української національної ШІ-моделі Lapa LLM, повідомив про створення лідерборду, що містить заміри як добре працюють великі мовні моделі з українською мовою.
Його створили разом командою розробників LLM для української мови MamayLM. «Ми заміряли всі практичні відкриті мовні моделі, які користувач може запустити в себе на комп’ютері. До того ж проєкт замірів повністю відкритий, інші дослідники можуть відтворити заміри самостійно для прозорості», — розповів Панів.
Лідерборд відображає показники ефективності мовних моделей на тестах української мови, які використовувалися під час розробки Lapa LLM. Він оцінює моделі за різними критеріями та завданнями з NLP (обробки природної мови) українською мовою. Оцінюються такі вміння:
- Машинний переклад: FLORES-200 (en-uk, uk-en), LongFLORES (en-uk, uk-en), WMT-22 (en-uk, uk-en).
- Підсумовування: XLSUM (uk).
- Відповіді на питання в контексті: Belebele (uk), SQuAD (uk).
- Міркування та знання: ZNO-Eval, Winogrande Challenge, Hellaswag, ARC Easy/Challenge, TriviaQA, MMLU.
- Розв’язування математичних задач: GSM-8K.
Виконання інструкцій: IFEval.
Наразі в лідерборді представлені такі LLM як Lapa LLM, MamayLM, Qwen, Llama та Gemma. В трійку кращих за середнім показником увійшли українські моделі Lapa LLM та MamayLM, а також Gemma від Google.
Найближчим часом розробники лідерборду планують додати заміри комерційних мовних моделей від OpenAI, Anthropic, Google, DeepSeek, порівняти як працюють моделі з обробкою зображень, що містять український текст, та додати заміри етичності моделей. Вони також хочуть завантажити повні логи бенчмарків (по 2 Гб на кожну модель), додати порівняння ефективності токенізаторів і збільшити кількість параметрів.
Лідерборд можна переглянути на Hugging Face, а його код доступний на GitHub.
Залишити коментар
Текст: Олександр Кузьменко Теги: lapa llm, штучний інтелект, українська мова
Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».
Відмова від відповідальності: статті, опубліковані на цьому сайті, взяті з відкритих джерел і надаються виключно для інформаційних цілей. Вони не обов'язково відображають погляди MEXC. Всі права залишаються за авторами оригінальних статей. Якщо ви вважаєте, що будь-який контент порушує права третіх осіб, будь ласка, зверніться за адресою service@support.mexc.com для його видалення. MEXC не дає жодних гарантій щодо точності, повноти або своєчасності вмісту і не несе відповідальності за будь-які дії, вчинені на основі наданої інформації. Вміст не є фінансовою, юридичною або іншою професійною порадою і не повинен розглядатися як рекомендація або схвалення з боку MEXC.