Гайд по Deep Daze и самые странные изображения из нейросети
Инструмент для генерации изображения из текста Deep Daze для преобразования использует OpenAI CLIP и Siren (сеть неявного нейронного представления). Проект выпущен под лицензией MIT и имеет на GiitHub 3,2 тысяч звездочек. Вот как с ним работать:
Минимальные системные требования для запуска:
— NVIDIA GPU;
— 4 Гб + VRAM — чем больше, тем лучше;
— Python 3.9 и выше.
Установка
- Убедитесь, что у вас установлен язык Python не ниже версии 3.9. Инструкция по проверке доступна здесь.
- Не забудьте добавить Python в PATH на первой вкладке процесса установки. В дальнейшем нужно будет использовать команду
pip. Все версии Python выше версии 3.4 автоматически устанавливаютpip. Чтобы проверить, установлен ли он на компьютере, нужно ввести в командной строке следующее —py –m pip –version. - Если
pipне возвращается версию, нужно загрузить файлhttps://pypi.org/project/pip#filesили использоватьpip get pipв командной строке для автоматической установки. - Чтобы загрузить deepdaze, введите в командной строке следующее:
pip install deep-daze
- Для создания изображения, используйте форму
Impress TEXT flags. Полное руководство по всем доступным флагам можно посмотреть здесь. - Пример генерации изображения:
$ imagine “mist over green hills
- Откройте командную строку от имени администратор и введите:
image “mist over green hills

Генерация изображения “туман над зелеными холмами”
Вот и все! Если у вас достаточно памяти, можно улучшить качество изображение, добавив флаг --deeper:
$ imagine “shattered plates on the ground» --deeper

Генерация изображения “разбитые тарелки на траве”
Продвинутые настройки и наложение большего количества слоев дадут лучший результат. Подробная информация по генерации более сложных изображений доступна здесь.
Подборка пользовательских генераций текста в изображение:

Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: