23.12.2024
В Казахстане представлена большая языковая модель KazLLM, обучение которой завершено на массиве данных объемом 148 млрд токенов на казахском, русском, английском и турецком языках. Проект реализован Институтом умных систем и искусственного интеллекта (ISSAI) при Назарбаев Университете в сотрудничестве с МЦРИАП РК и МНВО РК.
KazLLM станет доступна для разработчиков, научного сообщества, стартапов и крупных компаний. Она выступит основой для TurkLLM — масштабного проекта, направленного на развитие технологий обработки естественного языка в тюркоязычных странах.
«Запуск модели Kaz LLM с открытым исходным кодом представляет собой важный шаг вперед в развитии экосистемы искусственного интеллекта Казахстана. Эта инициатива отражает нашу приверженность поддержке инноваций и продвижению научных достижений, которые способствуют технологическому прогрессу. Я уверен, что эта передовая модель поможет преодолеть цифровое неравенство, обеспечив доступные и инклюзивные цифровые услуги для каждого казахстанца», — отметил глава МЦРИАП Жаслан Мадиев.
Модель создана в двух версиях: с 8 миллиардами и 70 миллиардами параметров. Она превосходит по качеству многие существующие аналоги и позволяет запускать ее как на мощных серверах, так и на ноутбуках.
Ключевую роль в создании KazLLM сыграли Beeline Казахстан и QazCode, предоставившие вычислительные мощности на базе серверов DGX H100. Эти ресурсы позволили сократить процесс обучения до 50 дней, обеспечив высокую производительность модели.
«Наша команда активно участвовала в разработке и обучении модели Kaz-LLM. Сложный процесс, включающий создание модели, учитывающей особенности казахского языка, и 50 дней вычислений, позволил улучшить понимание контекста и обеспечить качественное взаимодействие с пользователями. Тестирование показало, что модель эффективно решает технические задачи, учитывая культурные особенности. Мы уверены, что Kaz-LLM станет важным инструментом для всего Казахстана, помогая преодолеть языковой цифровой барьер и улучшить качество цифровых сервисов в регионе», — прокомментировал СЕО QazCode Алексей Шаравар.
KazLLM открывает перспективы для автоматизации различных сфер. Компании смогут разрабатывать чат-боты, улучшать клиентские сервисы, анализировать большие объемы данных и создавать образовательные платформы для изучения казахского языка.
Инновация уже доступна в открытом доступе, что стимулирует разработку новых продуктов и сервисов. Уникальность KazLLM заключается в ее способности сочетать технологическую мощь с адаптацией под культурные особенности региона, создавая цифровые инструменты для улучшения жизни казахстанцев.
Языковая модель доступна для ознакомления и использования по ссылке.
Фото: пресс-служба Министерства цифрового развития Казахстана