«Сбер» представил нейросеть Kandinsky. Её можно опробовать в приложении на смартфоне

Это самая большая модель генерации изображений по текстовому описанию на русском языке.

Это самая большая модель генерации изображений по текстовому описанию на русском языке.

«Сбер» официально представил нейросеть Kandinsky. Это улучшенная версия мультимодальной ruDALL-E, генерирующей картинки по описанию и представленной ещё в прошлом году.

Разработчики отметили, что смогли существенно улучшить качество работы этой модели, дообучив её на 179 млн изображений, снабжённых текстовыми описаниями. Kandinsky умеет генерировать картинки с произвольным соотношением сторон, а также может использовать новый способ повышения разрешения.

Создание изображений происходит в три этапа:

Сначала одна нейросеть (Kandinsky) генерирует заданное число изображений по описанию.
Затем вторая (ruCLIP Large) выбирает наиболее удачные и максимально соответствующие заданному текстовому описанию работы.
А после третья увеличивает картинки в размере.

Отличительным преимуществом модели Kandinsky по сравнению с предыдущими версиями является более высокая степень детализации создаваемых изображений.

Опробовать нейросеть Kandinsky может любой желающий. Она доступна в мобильном приложении «Салют» и на умных устройствах «Сбера» по запросу «Включи художника».

Kandinsky попросит произнести описание, а спустя несколько минут вернётся с девятью вариантами изображений. Останется лишь выбрать одно из них для увеличения размера.

Салют! Умные устройства Dialog Цена: Бесплатно

Загрузить

Цена: Бесплатно

Салют — Виртуальные ассистенты SberDevices LLC Цена: Бесплатно

Загрузить

Цена: Бесплатно