«Сбер» разработал нейросеть ruDALL-E для создания изображений по словесному описанию
Федеральное агентство новостей

Для создания изображений нет лимита, компьютер обучается одновременно как на картинках, так и на текстах. Как утверждают представители «Сбера», на обучение нейросети потребовалось 23 000 GPU-часов. Этот процесс стал рекордсменом среди самых крупных нейросетевых вычислительных проектов на территории России и СНГ.

«Нейросеть ruDALL-E одновременно обучается на двух видах данных — изображениях и текстах — и позволяет создавать неограниченное число новых изображений по заданному описанию», — говорится в сообщении пресс-службы «Сбера».

Разработка включала в себя три нейросети. Задача первой — обрабатывать текстовую информацию и определять количество возможных изображений. Второй — выбирать лучшие изображения. Роль третьей — увеличивать картинки в размере, при этом сохраняя качество изображения.

Модель ruDALL-E XL с 1,3 миллиарда параметров находится в открытом доступе на GitHub. Важно, что имеется аналог — ruDALL-E 12B. Он обладает 12 миллиардами параметров. Две предложенные системы в скором времени будут доступны на площадке ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud.

Автор: