Український національний ШІ «Сяйво» відклали: коли запустять першу велику мовну модель

Україна продовжує роботу над створенням національної великої мовної моделі «Сяйво».

Проєкт мав стати одним із ключових елементів державної політики у сфері штучного інтелекту, однак його запуск відбувається повільніше, ніж планувалося.

Що таке «Сяйво»

«Сяйво» — це українська національна велика мовна модель, яку створюють у межах співпраці Мінцифри та «Київстару».

Ідея проєкту полягає в тому, щоб Україна мала власну ШІ-модель, яка краще розумітиме українську мову, правовий контекст, історію, культуру та реалії війни.

У майбутньому така модель може використовуватися в державних сервісах, аналітичних інструментах, освітніх продуктах і цифрових помічниках.

Хто працює над проєктом

У червні 2025 року Мінцифри та «Київстар» підписали меморандум про співпрацю щодо створення української LLM.

«Київстар» відповідає за розробку моделі, фінансування та формування технічної команди.

Мінцифри координує роботу експертів, підготовку даних, етичну рамку проєкту та взаємодію з державними інституціями.

Чому запуск затримався

Спочатку очікувалося, що перші результати українці побачать наприкінці 2025 року.

Згодом запуск відкритого бета-тестування перенесли на кінець весни 2026 року, однак і в ці строки модель не стала доступною для публічного тестування.

Учасники проєкту пояснюють затримку кількома причинами: складністю збору даних, юридичними обмеженнями щодо авторських прав, потребою в оцифруванні матеріалів та формуванням команди спеціалістів із тренування мовних моделей.

На якому етапі перебуває розробка

Наразі команда завершує перший технічний етап — роботу над малою моделлю на 4 млрд параметрів.

Ця модель не буде доступною публічно. Її використовують як проміжний етап, щоб відпрацювати процеси тренування, тестування, налаштування якості відповідей і перевірки безпеки.

Після цього команда має перейти до створення більшої моделі, яку планують зробити доступною для ширшого використання.

Як модель працюватиме з українською мовою

Одним із важливих технічних завдань стало створення власного токенайзера.

Він має допомогти моделі краще працювати саме з українською мовою, не обробляючи українські тексти через англомовний контекст.

Це повинно покращити розуміння змісту, зменшити втрату нюансів і підвищити якість відповідей українською.

Які дані використовують

Для навчання національної LLM збирають великі масиви українських текстів.

Йдеться про дані від державних інституцій, медіа, університетів, видавництв, наукових установ та інших партнерів.

У навчальні набори можуть входити новини, аналітика, інтерв’ю, літературні твори, навчальні матеріали та історичні архіви.

У Мінцифри наголошують, що з даних вилучають персональну та іншу чутливу інформацію.

Якою буде велика модель

Початково планувалося створити три моделі: малу, середню та велику.

Однак після роботи з першою моделлю команда вирішила пропустити проміжний етап і перейти одразу до великої LLM.

Орієнтир для передачі великої моделі на тестування змістився на листопад 2026 року.

Для її створення планують використати новішу базову модель Gemma 4 на 31 млрд параметрів.

Де працюватиме український ШІ

Першу малу модель тренують у хмарній інфраструктурі Google, оскільки необхідні TPU-процесори доступні саме там.

Водночас у майбутньому модель планують перенести на інфраструктуру, розташовану в Україні.

Для цього Мінцифри розбудовує державну ШІ-інфраструктуру AI Factory, яка має забезпечувати роботу державних ШІ-сервісів і обробку чутливих даних.

Де можуть використовувати «Сяйво»

Перші інтеграції моделі планують реалізувати у форматі технічного інструменту для розробників.

Для ширшого кола користувачів вона може стати основою ШІ-помічників у державних сервісах.

Серед можливих напрямів — Дія.AI, ШІ-тьютор у «Мрії» та інші цифрові продукти.

Чому це важливо

Створення національної LLM є спробою сформувати власну українську ШІ-інфраструктуру.

Йдеться не лише про технологічний проєкт, а й про питання цифрового суверенітету, безпеки даних, підтримки української мови та розвитку державних сервісів.

Попри перенесення строків, робота над «Сяйвом» триває, а перша велика модель може стати доступною для тестування наприкінці 2026 року.

Дізнавайтесь новини юридичного світу першими у телеграм-каналі Окремої Думки

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *