Рубріки: Новини

Нейромережа Stable Diffusion випустила масштабний апдейт

Ігор Шелудченко

Нейромережа Stable Diffusion, яка генерує зображення по текстовому опису, випустила нове масштабне оновлення. Про це говориться на офіційному сайті компанії-розробника Stability AI.

Для запуску нових моделей у поточних програмних збірках Stable Diffusion, таких як Automatic1111, NMKD, InvokeAi розробникам необхідно внести невеликі редагування в код. Або ж почекати оновлених версій програмного забезпечення, яке скоро повинно бути.

Нові моделі перетворення тексту на зображення

В Stable Diffusion 2.0 зявився новий текстовий кодувальник OpenCLIP, розроблений LAION. Він значно покращує якість генерованих зображень. Тепер у зображеннь з роздільною здатністю 768×768 пікселів не повинна ламатися композиція. Також можна безпроблемно генерувати зображення і з роздільною здатністю 512×512.

Моделі генеруються на підмножинні набору даних LAION-5B , який потім додатково фільтрується для видалення “контенту для дорослих” за допомогою фільтра LAION NSFW.

Модель-апскейлер для зображеннь 2048х2048

Розробники додали в Stable Diffusion 2.0 модельа-апскейлер, яка підвищує роздільну здатність зображень у 4 рази. Таким чином, в поєднанні з новими моделями перетворення тексту на зображення тепер можна генерувати зображення з роздільною здатністю 2048х2048.

Роспізнавання глибини на зображеннях

В новій версії програми тепер є модель depth2img з окремим шаром розпізнавання глибини зображення. Дозволяє краще переносити і зберігати глибину в методах img2img та inpainting. Це знадобиться при генерації скетчів та фотографій.

Depth2img визначає глибину вхідного зображення (використовуючи існуючу модель), а потім генерує нові зображення, використовуючи як текст, так і інформацію про глибину.

Нова Inpainting модель

Нова модель в версії 2.0 зберігати форми та деталі вихідного зображення при перемальовці.

Розробники обіцяють випустити моделі в Stability AI API Platform (platform.stability.ai) і DreamStudio в найближчі кілька днів.

Також для отримання більш детальної інформації про доступ до моделі компанія просить ознайомитись із примітками на GitHub.

Останні статті

Meta закриває проект Workrooms — віртуальні простори для віддаленої роботи

Керівництво Meta ухвалило рішення припинити підтримку Workrooms як окремого додатку з 16 лютого 2026 року.…

16.01.2026

У ChatGPT з’явився розширений пошук в історії діалогів. Тільки для платних користувачів

Компанія OpenAI випустила велике оновлення для ChatGPT з підтримкою розширеного пошуку в історії чатів, але…

16.01.2026

У програмах, згенерованих штучним інтелектом, багато помилок безпеки — дослідження

Застосунки, створені за допомогою вайб-кодування, де розробник надає агенту штучного інтелекту повну свободу дій, ймовірно,…

16.01.2026

Українська компанія MacPaw закриває свій маркетплейс Setapp Mobile

Одна з найбільших українських продуктових IT-компаній MacPaw оголосила про закриття з 16 лютого 2026 року…

16.01.2026

Replit запускає інструмент вайб-кодингу iOS-додатків

Компанія Replit оголосила про запуск нового веб-інструменту вайб-кодування під назвою Mobile Apps on Replit. Він…

16.01.2026

GPT-5.2 написала веб-браузер з нуля. Модель створила три мільйони рядків коду і працювала безперервно цілий тиждень

Генеральний директор компанії Cursor AI Майкл Труелл повідомив, що LLM-модель GPT-5.2, яку задіяли через агент…

15.01.2026