«Сбер» представил нейросеть Kandinsky. Её можно опробовать в приложении на смартфоне
Это самая большая модель генерации изображений по текстовому описанию на русском языке.
«Сбер» официально представил нейросеть Kandinsky. Это улучшенная версия мультимодальной ruDALL-E, генерирующей картинки по описанию и представленной ещё в прошлом году.
Разработчики отметили, что смогли существенно улучшить качество работы этой модели, дообучив её на 179 млн изображений, снабжённых текстовыми описаниями. Kandinsky умеет генерировать картинки с произвольным соотношением сторон, а также может использовать новый способ повышения разрешения.
Создание изображений происходит в три этапа:
- Сначала одна нейросеть (Kandinsky) генерирует заданное число изображений по описанию.
- Затем вторая (ruCLIP Large) выбирает наиболее удачные и максимально соответствующие заданному текстовому описанию работы.
- А после третья увеличивает картинки в размере.
Отличительным преимуществом модели Kandinsky по сравнению с предыдущими версиями является более высокая степень детализации создаваемых изображений.
Опробовать нейросеть Kandinsky может любой желающий. Она доступна в мобильном приложении «Салют» и на умных устройствах «Сбера» по запросу «Включи художника».
Kandinsky попросит произнести описание, а спустя несколько минут вернётся с девятью вариантами изображений. Останется лишь выбрать одно из них для увеличения размера.
Салют! Умные устройства Dialog Цена: БесплатноЗагрузить
Цена: Бесплатно
Салют — Виртуальные ассистенты SberDevices LLC Цена: БесплатноЗагрузить
Цена: Бесплатно
Читайте также 🧐- Google представила нейросеть Imagen. Она генерирует картинки по описанию