В начале апреля российский Сбербанк запустил в публичный доступ новую версию своей графической генеративной сети Kandinsky 2.1. Кандинский — это сервис, который рисует (или генерирует) любые изображения по описанию. Он может создать полотно в стиле известных художников или изображение, которое невозможно отличить от реальной фотографии, сообщает Total.kz.

Результат генерации по запросу «Песочные степи казахстана», стиль: 4k.

При этом Kandinsky 2.1 является абсолютно бесплатным сервисом, в отличие, например, от американского Midjourney, который полностью прекратил бесплатный доступ к своей нейросети. А ведь новая модель Кандинского вплотную приблизилась к качеству изображений, которые выдают 3 и 4 модели Midjourney.

Возможно, поэтому за первые 4 дня работы Kandinsky 2.1 воспользовались более одного миллиона уникальных пользователей. Еще через два дня их было уже два миллиона. Сегодня Кандинский доступен в урезанном функционале через телеграм-бот, и в «профессиональном» исполнении на сайте модели и веб-портале Fusion Brain.

Пользоваться Kandinsky 2.1 достаточно просто. Нужно ввести описания того, что должно быть на изображении, задать стиль исполнения и нажать кнопку генерации. Описание можно уточнять, дополнять — результат будет меняться. Можно попросить нейросеть сгенерировать сразу несколько вариантов картинок по одному описанию.

Работать можно не только с текстом, но и с готовыми изображениями. Kandinsky 2.1 можно использовать даже вместо Фотошопа. Можно убрать с реальной фотографии какие-то детали. Можно наоборот — дорисовать. Можно сделать новую картинку на основе фото и так далее.

Есть у Кандинского и еще одна особенность. Технологическое подразделение «Сбера» Sber AI, создавшее нейросеть совместно с учеными из Института искусственного интеллекта AIRI, обучало Kandinsky 2.1 более чем миллиарде смысловых пар «текст-изображение» и добавило в этот датасет немало информации, помогает сберовской нейросети лучше справляться с культурными и историческими особенностями пространства стран СНГ. Поэтому по запросам, которые связаны с нашей географией, историей и культурой Кандинский выдает результаты немного лучше и точнее, чем зарубежные аналоги.

Результат генерации по запросу «Казахстанская степь», стиль: 4k.

Успехи Kandinsky 2.1 оценили и за рубежом, включив модель в топ-5 трендовых мировых репозиториев по версии GitHub. Сегодня Kandinsky 2.1 может существенно облегчать работу журналистам, редакторам, стилистам, дизайнерам, иллюстраторам, и много кому еще. Ну и иногда просто приятно сделать себе новый аватар, заставку или фон для разных приложений и девайсов.

Помимо всего прочего Kandinsky 2.1 хорош тем, что корпорация Сбер намерена развивать ее и делиться этой и другими технологиями со всеми, кто нацелен на продуктивное сотрудничество. А значит, в перспективе может привести и к развитию потенциала.