ruDALL-E — первая нейросеть, которая может генерировать картинки по запросу на русском языке.
Нейросеть обучается одновременно на картинках и текстах и может создавать неограниченное число новых изображений по заданному описанию.
ruDALL-E состоит из трех нейросетей, первая принимает текст и генерирует заданное число картинок, вторая выбирает более удачные, третья — увеличивает их в размере без потери качества.
Нейросеть DALL-E для генерации картинок по описаниям на английском языке представила OpenAI в январе 2021 года. Команды SberDevices, Sber AI и SberCloud воспроизвели ее код и запустили обучение модели на платформе ML Space на базе суперкомпьютера «Кристофари».
Обучение заняло 23 тысячи GPU-часов на массиве данных из 120 миллионов пар текст-изображение. Обучение ruDALL-E стало самым большим нейросетевым вычислительным проектом в России и СНГ.
Источник: vc.ru