NVIDIA GauGAN2 превращает предложения в реалистичные фотографии

Программа на базе искусственного интеллекта GauGAN2 от NVIDIA может использовать простые письменные фразы для создания подходящего фотореалистичного изображения. Алгоритм глубокого обучения способен создавать различные сцены всего за три - четыре слова.

image_13

Сгенерированное ИИ изображение, созданное с помощью фразы “мирное озеро, окруженное высокими деревьями в туманный день”.

GauGAN-это программа на базе искусственного интеллекта, выпущенная в 2019 году, которая использовалась для превращения грубых набросков в фотореалистичные шедевры, технология, которая в конечном итоге была включена в приложение NVIDIA Canvas в начале этого года. На этот раз NVIDIA продвинула искусственный интеллект еще дальше, и теперь для создания “фотографии " программе требуется только краткое описание.

Как говорит NVIDIA, алгорит на основе так называемых генеративных состязательных сетей, лежащий в основе первой версии GauGAN, позволяет любому создавать красивые сцены, а сейчас это стало даже проще, чем когда-либо. Пользователи могут просто ввести фразу, например, “закат на пляже”, а искусственный интеллект сгенерирует соотвествующую сцену.  По мере добавления слов, например, “закат на скалистом пляже” или заменив “закат” на “день” или “дождливый день”, изображение в режиме реального времени будет меняться соотвествующим образом.  

«Одним нажатием кнопки пользователи могут сгенерировать карту сегментации - высокоуровневую схему, показывающую расположение объектов в сцене, - объясняет NVIDIA. - Оттуда они могут переключиться на рисование, настраивая сцену с помощью грубых обрывков, таких как небо, дерево, скала и река, позволяя умной кисти включать это всё в создаваемое изображение».

image_14

Сгенерированное искусственным интеллектом изображение, созданное с помощью фразы “тропический остров с видом на пляж с белым песком ”.

image_16

Сгенерированное искусственным интеллектом изображение, созданное с помощью фразы “бесконечные высокие горы в солнечный день”.

Кроме того, GauGan2 объединяет в себе отображение сегментации, рисование и генерацию текста в одной модели, что, по словам NVIDA, делает эту программу мощным инструментом, позволяющим создавать фотореалистичное искусство с помощью сочетания слов и рисунков. Цель состоит в том, чтобы быстрее и проще превратить видение художника в высококачественное изображение, сгенерированное ИИ. NVIDIA говорит, что по сравнению с другими современными моделями, предназначенными специально для приложений преобразования текста в изображение, GauGAN2 генерирует более разнообразный и более качественный набор изображений.

Таким образом, вместо того, чтобы рисовать каждый элемент воображаемой сцены, пользователи могут ввести краткую фразу, чтобы быстро сгенерировать ключевые объекты и тему изображения, например, заснеженный горный хребет. Затем эту отправную точку можно дополнить с помощью эскизов, чтобы сделать конкретную гору выше или добавить пару деревьев на переднем плане или облака в небе.

Хотя создание реалистичного изображения, вероятно, является наиболее впечатляющим, GauGAN2 не ограничивается только этим. Художники также могут использовать новую версию программы для изображения потусторонних и вымышленных пейзажей. NVIDIA демонстрирует сцену, которая воссоздает что-то похожее на несуществующую планету Татуин из "Звездных войн", где искусственный интеллект изначально создает сцену пустыни, но затем добавляет второе солнце.

«Это итеративный процесс, когда каждое слово, которое пользователь вводит в текстовое поле, добавляет больше деталей к изображению, создаваемому искусственным интеллектом».

Функцию преобразования текста в изображение можно протестировать на странице NVIDIA AI DEMOS >>, где любой желающий может попробовать создать свои сцены с текстовыми подсказками и дополнительно настроить их с помощью быстрых эскизов для получения более точных результатов.

Источник: PetaPixel

Три эпохи фотографии: пластина, плёнка, «цифра»

Три эпохи фотографии: пластина, плёнка, «цифра»

Блог2 года назад
После изобретения в начале 1800-х годов фотография и фотокамеры прошли долгий путь развития. Громозд...
Как превратить плёночную камеру в цифровую

Как превратить плёночную камеру в цифровую

Блог3 года назад
Видеоблогер [befinitiv] опубликовал на своём YouTube-канале видео, в котором показал, как ему удалос...
Я | ФОТОГРАФ. Михаил Докудовский

Я | ФОТОГРАФ. Михаил Докудовский

Блог8 лет назад
Представляем вам подборку черно-белых портретов Михаила Докудовского. Не отвлекаясь на цвет, Михаил ...
5 кадров с Minolta XD7 и Kodak Vision 3 250D

5 кадров с Minolta XD7 и Kodak Vision 3 250D

Блог2 мес. назад
Влияет ли камера, которой я пользуюсь в данный момент, на получаемые изображения? Возможно. Я не сов...
Фотограф Билл Хао построил гигантскую камеру и превратил автобус в передвижную фотолабораторию.

Фотограф Билл Хао построил гигантскую камеру и превратил автобус в передвижную ф...

Блог2 года назад
Фотограф Билл Хао из Ванкувера, Канада, потратил два года на создание огромной камеры из дуба. Он сн...
Меган Доэрти: под кайфом от меланхолии

Меган Доэрти: под кайфом от меланхолии

Блог7 дн. назад
Подростковые годы часто отмечены фантазиями: мечтами о будущем и о той жизни, которой ты мог бы жить...
5 кадров на плёнку Ferrania P30

5 кадров на плёнку Ferrania P30

Блог3 года назад
Некоторое время назад я получил электронное письмо от магазина Film Photography Project, в котором м...
Булат Окуджава

Булат Окуджава

Блог8 лет назад
А ведь Булат Шалвович просил... Нет, не просил, конечно. Он пел в форме нежного повеления о то...
5 кадров на камеру Yashica Electro 35

5 кадров на камеру Yashica Electro 35

Блог2 года назад
Yashica Electro 35 — одна из тех камер, которую особенно советуют «эксперты по дальномерам». Это кла...
Дэвид Ниссен: остановить движение

Дэвид Ниссен: остановить движение

Блог1 год назад
Дэвид Ниссен родился в Валансьене, Франция, в 1969 году, изучал фотографию и живопись в Школе изящны...
Стереофотография: ретроспективный взгляд на истоки 3D-изображений

Стереофотография: ретроспективный взгляд на истоки 3D-изображений

Блог2 года назад
Виртуальная реальность, или VR, не является чем-то новым. Идея о том, что наш левый и правый глаз ви...
Среди медведиц тоже встречаются натуральные блондинки

Среди медведиц тоже встречаются натуральные блондинки

Блог8 лет назад
Бурые медведи только называются бурыми. В жизни же диапазон окраски их меха от светло-соломенного до...
Фотоархив: первые мобильные телефоны, 1970-1990 гг.

Фотоархив: первые мобильные телефоны, 1970-1990 гг.

Блог2 года назад
Наверное, началом эры мобильных телефонов можно считать 1902 год, когда изобретатель Натан Стабблфил...
Зимний Крым

Зимний Крым

Блог5 лет назад
Когда-то я задался вопросом: куда можно поехать на новый год, чтобы «и недорого, и красиво, и тепло»...
Алиса в зазеркалье

Алиса в зазеркалье

Блог8 лет назад
У зеркала нет памяти... Можно пофантазировать, будто оно помнит все наши лица, но, как и мы, не в со...
NVIDIA GauGAN2 превращает предложения в реалистичные фотографии
журнал ФотоТехника

Комментарии

Отправить