В Сбере создали нейронную сеть. Она может преобразовывать текстовые сообщения в картинки. Разработку будут использовать для создания рекламы и дизайнерских решений. Об этом сообщили в пресс-службе банка. Непосредственно разработкой сети занимались подразделения Сбера SberDevices и Sber AI.
«Нейросеть ruDALL-E одновременно обучается на двух видах данных — изображениях и текстах, и позволяет создавать неограниченное число новых изображений по заданному описанию. Использовать ее можно для создания вариантов дизайна интерьера, стоковых изображений или векторных иллюстраций, материалов для рекламы, копирайтинга, архитектурного и промышленного дизайна», — говорится в сообщении.
Всего было представлено 2 версии нейронной сети. Бесплатная версия ruDALL-E XL, модель можно бесплатно скачать с сайта Github, также была представлена расширенная версия под названием ruDALL-E 12B. Сеть ruDALL-E работает следующим образом:
- Загрузка текста
- Создание заданного числа изображений
- Выбор наиболее удачного изображения
- Обработка и создание необходимого размера из выбранной картинки
Ранее американская компания OpenAI представила подобную нейросеть, однако код так и не был опубликован в открытых источниках. Сейчас нейросеть обучается с помощью платформы ML Space, в качестве вычислительных мощностей используется суперкомпьютер «Кристофари».
«В результате получилась самая большая модель такого рода в мире, работающая с русским языком: обучение заняло 23 тыс. GPU-часов на массиве данных из 120 млн пар «текст-изображение». Проект по обучению ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ», — отметили в пресс-службе Сбера.