Kandinsky 2.1 — новая нейросеть от Сбербанка

Нейросеть Kandinsky 2.1 — новая генеративная модель, разработанная и обученная сотрудниками лаборатории Sber AI при поддержке ученых из Института искусственного интеллекта AIRI и компании SberDevices.

Генератор изображений Kandinsky 2.1 основан на принципах генеративно-состязательных нейронных сетей (GAN), которые состоят из двух модулей: генератора (отвечает за создание новых изображений по заданным параметрам) и дискриминатора (отвечает за оценку их качества и реалистичности).


Основные особенности генератора изображений Kandinsky 2.1:

• Бесплатный доступ без регистрации.
• Бесконечная генерация изображений.
• Понятный и простой интерфейс.
• Поддержка текстового описания до 2000 символов.
• Модель понимает запросы на 101 языке (включая русский и английский).
• 23 вида стилистического оформления.
• Соотношение сторон изображения 1:1.
• Минимальное разрешение 128x128px.
• Максимальное разрешение 768x768px.
• Функция возвращения к предыдущему шагу.
• Результат можно скачать или поделиться им в соц. сетях.

Краткий обзор интерфейса редактора https://editor.fusionbrain.ai/:


Возможности Kandinsky 2.1:

1) # text to image или генерация по тексту — стандартный текстовый запрос (promt).
• Введите наиболее точное и понятное текстовое описание без орфографических ошибок.
• Используйте на выбор один из 23 стилей или укажите стиль в текстовом запросе.
• Нажмите кнопку «Создать». Если результат не понравился – нажмите кнопку снова.


2) # outpainting или дорисовка — продолжите генерацию по горизонтали и/или вертикали.
• Используйте сгенерированное или загруженное изображение.
• Уменьшите изображение или передвиньте рамку в пустую область для дорисовки.
• Введите новое текстовое описание или оставьте предыдущее.
• Нажмите кнопку «Создать».



3) # inpainting или замена части изображения.
• Сотрите область, которую нужно изменить.
• Скорректируйте свой текстовый запрос.
• Сгенерируйте часть изображения заново.


Комментарии

Популярные сообщения из этого блога

Как объединить несколько презентаций PowerPoint

Краткий словарь компьютерного сленга

Создание задания теста с типом вопроса «Вложенные ответы (Cloze)» для LMS Moodle

Excalidraw — виртуальная доска для совместной работы

Что выбрать для общения: Skype, WhatsApp или Viber?