В «Сбере» создали нейросеть ruDALL-E, она генерирует изображения по текстовым описаниям

схожие новости

В Сбере создали нейронную сеть. Она может преобразовывать текстовые сообщения в картинки. Разработку будут использовать для создания рекламы и дизайнерских решений. Об этом сообщили в пресс-службе банка. Непосредственно разработкой сети занимались подразделения Сбера SberDevices и Sber AI.

«Нейросеть ruDALL-E одновременно обучается на двух видах данных — изображениях и текстах, и позволяет создавать неограниченное число новых изображений по заданному описанию. Использовать ее можно для создания вариантов дизайна интерьера, стоковых изображений или векторных иллюстраций, материалов для рекламы, копирайтинга, архитектурного и промышленного дизайна», — говорится в сообщении.

Всего было представлено  2 версии нейронной сети. Бесплатная версия ruDALL-E XL, модель можно бесплатно скачать с сайта Github, также была представлена расширенная версия под названием ruDALL-E 12B. Сеть ruDALL-E работает следующим образом:

  • Загрузка текста
  • Создание заданного числа изображений
  • Выбор наиболее удачного изображения
  • Обработка и создание необходимого размера из выбранной картинки

Ранее американская компания OpenAI представила подобную нейросеть, однако код так и не был опубликован в открытых источниках. Сейчас нейросеть обучается с помощью платформы ML Space, в качестве вычислительных мощностей используется суперкомпьютер «Кристофари».

«В результате получилась самая большая модель такого рода в мире, работающая с русским языком: обучение заняло 23 тыс. GPU-часов на массиве данных из 120 млн пар «текст-изображение». Проект по обучению ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ», — отметили в пресс-службе Сбера.

Читать еще