Рубріки: Новини

Нейромережа Stable Diffusion випустила масштабний апдейт

Ігор Шелудченко

Нейромережа Stable Diffusion, яка генерує зображення по текстовому опису, випустила нове масштабне оновлення. Про це говориться на офіційному сайті компанії-розробника Stability AI.

Для запуску нових моделей у поточних програмних збірках Stable Diffusion, таких як Automatic1111, NMKD, InvokeAi розробникам необхідно внести невеликі редагування в код. Або ж почекати оновлених версій програмного забезпечення, яке скоро повинно бути.

Нові моделі перетворення тексту на зображення

В Stable Diffusion 2.0 зявився новий текстовий кодувальник OpenCLIP, розроблений LAION. Він значно покращує якість генерованих зображень. Тепер у зображеннь з роздільною здатністю 768×768 пікселів не повинна ламатися композиція. Також можна безпроблемно генерувати зображення і з роздільною здатністю 512×512.

Моделі генеруються на підмножинні набору даних LAION-5B , який потім додатково фільтрується для видалення “контенту для дорослих” за допомогою фільтра LAION NSFW.

Модель-апскейлер для зображеннь 2048х2048

Розробники додали в Stable Diffusion 2.0 модельа-апскейлер, яка підвищує роздільну здатність зображень у 4 рази. Таким чином, в поєднанні з новими моделями перетворення тексту на зображення тепер можна генерувати зображення з роздільною здатністю 2048х2048.

Роспізнавання глибини на зображеннях

В новій версії програми тепер є модель depth2img з окремим шаром розпізнавання глибини зображення. Дозволяє краще переносити і зберігати глибину в методах img2img та inpainting. Це знадобиться при генерації скетчів та фотографій.

Depth2img визначає глибину вхідного зображення (використовуючи існуючу модель), а потім генерує нові зображення, використовуючи як текст, так і інформацію про глибину.

Нова Inpainting модель

Нова модель в версії 2.0 зберігати форми та деталі вихідного зображення при перемальовці.

Розробники обіцяють випустити моделі в Stability AI API Platform (platform.stability.ai) і DreamStudio в найближчі кілька днів.

Також для отримання більш детальної інформації про доступ до моделі компанія просить ознайомитись із примітками на GitHub.

Останні статті

Amazon дозволить стартапам безкоштовно користуватись інструментом кодування Kiro Pro+. Але не всім

Компанія Amazon оголосила про безкоштовну роздачу річних платних ліцензій на користування інструментом кодування Kiro Pro+,…

04.12.2025

OpenAI навчила ChatGPT визнавати власні помилки

Компанія OpenAI представила експериментальну систему «визнання», яка вчить LLM-моделі чесно повідомляти про власні помилки та…

04.12.2025

Google запускає Workspace Studio — платформу, де можна створювати агентів для автоматизації роботи

Google оголосила про запуск Workspace Studio — нової платформи, яка дозволяє створювати агентів штучного інтелекту…

04.12.2025

В Anthropic проаналізували роботу своїх програмістів, щоб дізнатись, які переваги дає штучний інтелект

В Anthropic провели внутрішнє опитування 132 програмістів та дослідників, 53 поглиблених інтерв'ю та проаналізували використання…

04.12.2025

AWS випустила три нові інструменти для покращення кодування на базі штучного інтелекту

На щорічній конференції Re:Invent, яка проходить цими днями в Лас-Вегасі, керівник AWS Метт Гарман оголосив…

04.12.2025

OpenAI готує реліз нової моделі Garlic, яка спеціалізується на кодуванні

Компанія OpenAI працює над новою LLM-моделлю Garlic («Часник»), яка спеціалізується на програмуванні та логічних завданнях.…

03.12.2025