Національну велику мовну модель «Сяйво» тренуватимуть на текстах Укрдержархіву

Національну велику мовну модель «Сяйво» тренуватимуть на текстах Укрдержархіву

Укрінформ
Державна архівна служба України передала 10 терабайтів інформації для тренування національної мовної моделі (LLM) «Сяйво».

Про це повідомило Міністерство цифрової трансформації, передає Укрінформ.

«Уявіть масив інформації, що дорівнює 70 тисячам книжок. Саме стільки — 10 терабайтів унікальних історичних матеріалів, державних документів та наукових текстів — Державна архівна служба України вперше передає для тренування національної мовної моделі «Сяйво», - йдеться в повідомленні.

Наголошується, що це перший кейс, коли Укрдержархів ділиться даними для розвитку цифрових сервісів в Україні. До кінця року кількість цифрових копій держархівів збільшаться зі 150 млн до понад 200 млн — це один із найвищих у світі темпів оцифрування архівної спадщини.

Модель вивчатиме історичні джерела, рукописи, закони, судові рішення, медіаматеріали та словники.

Наразі для тренування LLM свої матеріали надають вже понад 50 партнерів Мінцифри, серед яких медіа, університети, бібліотеки тощо.

Читайте також: Українці обрали назву для національного ШІ

Як повідомлялося, на початку літа 2025 року Міністерство цифрової трансформації України та компанія «Київстар» підписали меморандум про співпрацю, яка передбачає створення національної великої мовної моделі (LLM) – основи для інтеграції ШІ в державний сектор, оборону та бізнес. Наразі триває збір даних для навчання LLM, бета-тестування якої заплановано на весну 2026 року.

Фото: Мінцифри

Приєднуйтесь до наших каналів Telegram, Instagram та YouTube.

Розширений пошукПриховати розширений пошук
За період:
-