Юрій Панів, один з розробників української національної ШІ-моделі Lapa LLM, повідомив про створення лідерборду, що містить заміри як добре працюють великі мовніЮрій Панів, один з розробників української національної ШІ-моделі Lapa LLM, повідомив про створення лідерборду, що містить заміри як добре працюють великі мовні

Розробники Lapa LLM створили лідерборд, який порівнює вправність роботи ШІ-моделей з українською мовою

2025/12/23 23:55

Розробники Lapa LLM створили лідерборд, який порівнює вправність роботи ШІ-моделей з українською мовою

Юрій Панів, один з розробників української національної ШІ-моделі Lapa LLM, повідомив про створення лідерборду, що містить заміри як добре працюють великі мовні моделі з українською мовою.

Залишити коментар

Юрій Панів, один з розробників української національної ШІ-моделі Lapa LLM, повідомив про створення лідерборду, що містить заміри як добре працюють великі мовні моделі з українською мовою.

Його створили разом командою розробників LLM для української мови MamayLM. «Ми заміряли всі практичні відкриті мовні моделі, які користувач може запустити в себе на комп’ютері.  До того ж проєкт замірів повністю відкритий, інші дослідники можуть відтворити заміри самостійно для прозорості», — розповів Панів.

Лідерборд відображає показники ефективності мовних моделей на тестах української мови, які використовувалися під час розробки Lapa LLM. Він оцінює моделі за різними критеріями та завданнями з NLP (обробки природної мови) українською мовою. Оцінюються такі вміння:

  • Машинний переклад: FLORES-200 (en-uk, uk-en), LongFLORES (en-uk, uk-en), WMT-22 (en-uk, uk-en).
  • Підсумовування: XLSUM (uk).
  • Відповіді на питання в контексті: Belebele (uk), SQuAD (uk).
  • Міркування та знання: ZNO-Eval, Winogrande Challenge, Hellaswag, ARC Easy/Challenge, TriviaQA, MMLU.
  • Розв’язування математичних задач: GSM-8K.
    Виконання інструкцій: IFEval.

Наразі в лідерборді представлені такі LLM як Lapa LLM, MamayLM, Qwen, Llama та Gemma. В трійку кращих за середнім показником увійшли українські моделі Lapa LLM та MamayLM, а також Gemma від Google.

Найближчим часом розробники лідерборду планують додати заміри комерційних мовних моделей від OpenAI, Anthropic, Google, DeepSeek, порівняти як працюють моделі з обробкою зображень, що містять український текст, та додати заміри етичності моделей. Вони також хочуть завантажити повні логи бенчмарків (по 2 Гб на кожну модель), додати порівняння ефективності токенізаторів і збільшити кількість параметрів.

Лідерборд можна переглянути на Hugging Face, а його код доступний на GitHub.

Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
У півтора раза швидше, ніж Gemma 3. Інтерв’ю з лідером проєкту Lapa LLM — найефективнішою великою мовною моделлю для української мови 
По темi
У півтора раза швидше, ніж Gemma 3. Інтерв’ю з лідером проєкту Lapa LLM — найефективнішою великою мовною моделлю для української мови 
Українці створили мовну модель для української мови MamayLM. Чим вона особлива, кому корисна та як скористатися
По темi
Українці створили мовну модель для української мови MamayLM. Чим вона особлива, кому корисна та як скористатися
Тепер ШІ говоритиме українською ліпше. Дослідники з УКУ та КНУ значно покращили якість синтезу українського мовлення
По темi
Тепер ШІ говоритиме українською ліпше. Дослідники з УКУ та КНУ значно покращили якість синтезу українського мовлення
Залишити коментар
Ринкові можливості
Логотип Large Language Model
Курс Large Language Model (LLM)
$0.0003222
$0.0003222$0.0003222
-1.28%
USD
Графік ціни Large Language Model (LLM) в реальному часі
Відмова від відповідальності: статті, опубліковані на цьому сайті, взяті з відкритих джерел і надаються виключно для інформаційних цілей. Вони не обов'язково відображають погляди MEXC. Всі права залишаються за авторами оригінальних статей. Якщо ви вважаєте, що будь-який контент порушує права третіх осіб, будь ласка, зверніться за адресою service@support.mexc.com для його видалення. MEXC не дає жодних гарантій щодо точності, повноти або своєчасності вмісту і не несе відповідальності за будь-які дії, вчинені на основі наданої інформації. Вміст не є фінансовою, юридичною або іншою професійною порадою і не повинен розглядатися як рекомендація або схвалення з боку MEXC.