Команда Института умных систем и искусственного интеллекта при Назарбаев Университете, известная казахстанцам по аббревиатуре ISSAI, удивила очередной разработкой. Недавно институт презентовал цифровой прототип человека — помощницу Umay (Ұмай), говорящую на казахском языке.
Umay представляет собой виртуального помощника, владеющего государственным казахским языком, созданного в цифровой форме в виде реалистичного человеческого аватара женского пола. Ее возможности охватывают широкий спектр областей, включая науку, образование, историю, технологии и медицину.
Почему Умай
Имя Умай — богини-матери из тюркской мифологии дано аватару неслучайно. Во-первых, это связь с казахской культурой, во-вторых, Umay — первый прототип цифрового человека, по задумке команды станет прародительницей будущих цифровых помощников.
Атакан Варол, директор ISSAI, заведующий кафедрой и профессор в Школе инженерных и цифровых наук Назарбаев Университета
Нашей главной целью было показать передовые возможности казахстанской интеллектуальной силы, а именно небольшой команды ISSAI, и заявить: «Мы можем делать это в Казахстане». Umay использует ряд ключевых технологий, разработанных нашим институтом. К ним относятся преобразование текста в речь, автоматическое распознавание речи, нейронный машинный перевод, быстрое проектирование и фотореалистичный аватар.
Как работает Умай
Основной технической задачей проекта была системная интеграция, то есть команде нужно было заставить работать множество ИИ-систем одновременно. Так, Умай в работе использует ChatGPT от OpenAI. Однако далеко не секрет, что этот чат-бот пока слабо работает на казахском языке. Чтобы преодолеть это ограничение, Umay использует усовершенствованную модель нейронного машинного перевода Tilmash, которая также разработана в ISSAIНазарбаев Университета. Эта модель помогает переводить запросы пользователей на английский язык и впоследствии преобразует ответы, данные ChatGPT, обратно на казахский язык.
Аскат Куздеуов, разработчик Umay, старший аналитик данных ISSAI
Наш институт ранее создал систему двустороннего машинного перевода на четыре языка под название Tilmash. Эта модель, собранная на основе больших текстов в разных стилях, может конкурировать с переводчиками Google и Yandex. Модель переводит озвученные на казахском запросы на английский, и затем ответы от ChatGPT переводит с английского на казахский язык.
Какое будущее у такого прототипа
Как объясняют разработчики, Umay обеспечивает высококачественную лицевую анимацию в реальном времени. Она объединяет передовые речевые технологии, разработанные в ISSAI, в том числе автоматическое распознавание речи (ASR) и преобразование текста в речь (TTS), для облегчения естественного и свободного общения на казахском языке.
При дальнейшем развитии, Umay может стать дополнением к рабочей силе для повышения эффективности и снижения затрат во многих областях. Пока она работает только в лаборатории ISSAI. Для дальнейшей настройки и применения Umay необходима собственная большая языковая модель, то есть казахский искусственный разум. Над этим с самого создания в 2019 году работает команда. Обучение большой языковой модели требует огромного хранилища данных и вычислительных ресурсов. Это только начало большого пути, требующего поддержки от государства и общества, отмечают аналитики Назарбаев Университета.