Рубріки: Новини

Нейромережа Stable Diffusion випустила масштабний апдейт

Ігор Шелудченко

Нейромережа Stable Diffusion, яка генерує зображення по текстовому опису, випустила нове масштабне оновлення. Про це говориться на офіційному сайті компанії-розробника Stability AI.

Для запуску нових моделей у поточних програмних збірках Stable Diffusion, таких як Automatic1111, NMKD, InvokeAi розробникам необхідно внести невеликі редагування в код. Або ж почекати оновлених версій програмного забезпечення, яке скоро повинно бути.

Нові моделі перетворення тексту на зображення

В Stable Diffusion 2.0 зявився новий текстовий кодувальник OpenCLIP, розроблений LAION. Він значно покращує якість генерованих зображень. Тепер у зображеннь з роздільною здатністю 768×768 пікселів не повинна ламатися композиція. Також можна безпроблемно генерувати зображення і з роздільною здатністю 512×512.

Моделі генеруються на підмножинні набору даних LAION-5B , який потім додатково фільтрується для видалення “контенту для дорослих” за допомогою фільтра LAION NSFW.

Модель-апскейлер для зображеннь 2048х2048

Розробники додали в Stable Diffusion 2.0 модельа-апскейлер, яка підвищує роздільну здатність зображень у 4 рази. Таким чином, в поєднанні з новими моделями перетворення тексту на зображення тепер можна генерувати зображення з роздільною здатністю 2048х2048.

Роспізнавання глибини на зображеннях

В новій версії програми тепер є модель depth2img з окремим шаром розпізнавання глибини зображення. Дозволяє краще переносити і зберігати глибину в методах img2img та inpainting. Це знадобиться при генерації скетчів та фотографій.

Depth2img визначає глибину вхідного зображення (використовуючи існуючу модель), а потім генерує нові зображення, використовуючи як текст, так і інформацію про глибину.

Нова Inpainting модель

Нова модель в версії 2.0 зберігати форми та деталі вихідного зображення при перемальовці.

Розробники обіцяють випустити моделі в Stability AI API Platform (platform.stability.ai) і DreamStudio в найближчі кілька днів.

Також для отримання більш детальної інформації про доступ до моделі компанія просить ознайомитись із примітками на GitHub.

Останні статті

JetBrains: для 90% програмістів інструменти ШІ економлять мінімум годину на тиждень, для 20% — цілий робочий день

Компанія JetBrains оприлюднила результати щорічного опитування Developer Ecosystem Survey про стан на ринку розробки програмного…

20.10.2025

Microsoft: фішинг за допомогою штучного інтелекту в 4,5 рази ефективніший за традиційний

Фішингові листи, створені за допомогою штучного інтелекту, більш успішні для хакерів у порівнянні з традиційними.…

20.10.2025

П’ять пасток, у які потрапляють навіть досвідчені проджект-менеджери. Колонка FAVBET Tech

Мабуть, у кожного проджекта є день, коли він ловить себе на думці: «Я більше координую…

20.10.2025

FAVBET Tech сплатив понад 650 млн грн податків за 9 місяців 2025 року

Українська ІТ-компанія FAVBET Tech за дев’ять місяців 2025 року перерахувала до державного бюджету понад 650…

20.10.2025

Telegram тестує функцію прямих ефірів з особистих акаунтів

Незабаром месенджер Telegram може поповнитись функцією трансляції прямих ефірів. Як повідомляє канал Telegram Info, у…

20.10.2025

«Claude Haiku 4.5 генерує низькоякісний код»: експерт розповів, які моделі краще використовувати для рефакторингу

Тестування нещодавно випущеної LLM-моделі Claude Haiku 4.5 від компанії Anthropic виявило парадокс: вона створила найбільше…

20.10.2025