Національну велику мовну модель планують вивести для тестування навесні

В Україні триває збір даних для навчання Національної великої мовної моделі (LLM), бета-тестування якої заплановано на весну 2026 року.

Про це у Телеграмі повідомив перший віцепрем'єр-міністр - міністр цифрової трансформації Михайло Федоров, передає Укрінформ.

«Нині триває найважливіша частина роботи — збір даних для навчання LLM. Для високої якості інформації з інтернету недостатньо, тому працюємо з державними органами, медіа, університетами та іншими інституціями — це терабайти унікальних даних», - йдеться в повідомленні.

Також група експертів уже працює над створенням тестів для мовної моделі, які допоможуть оцінювати й покращувати її якість. Це дасть змогу тримати у фокусі ефективність та безпеку LLM.

Очікується, що вже протягом місяця буде напрацьована перша базу текстів для тренування моделі, покращено токенізатор — інструмент, який розділяє слова на елементи, щоб LLM обробляла мову швидше та продуктивніше, та з’являться тести.

Також у січні розпочнеться голосування у «Дії» щодо назви національної моделі.

Бета-тестування LLM заплановано на весну 2026 року.

Читайте також: Українську велику мовну модель тренуватимуть на Gemma від Google

Як повідомлялося, на початку літа 2025 року Міністерство цифрової трансформації України та компанія «Київстар» підписали меморандум про співпрацю, яка передбачає створення національної великої мовної моделі (LLM) – основи для інтеграції ШІ в державний сектор, оборону та бізнес.

 Фото: Brian Kostiuk on Unsplash