Нейромережа Stable Diffusion, яка генерує зображення по текстовому опису, випустила нове масштабне оновлення. Про це говориться на офіційному сайті компанії-розробника Stability AI.
Для запуску нових моделей у поточних програмних збірках Stable Diffusion, таких як Automatic1111, NMKD, InvokeAi розробникам необхідно внести невеликі редагування в код. Або ж почекати оновлених версій програмного забезпечення, яке скоро повинно бути.
Нові моделі перетворення тексту на зображення
В Stable Diffusion 2.0 зявився новий текстовий кодувальник OpenCLIP, розроблений LAION. Він значно покращує якість генерованих зображень. Тепер у зображеннь з роздільною здатністю 768×768 пікселів не повинна ламатися композиція. Також можна безпроблемно генерувати зображення і з роздільною здатністю 512×512.
Моделі генеруються на підмножинні набору даних LAION-5B , який потім додатково фільтрується для видалення “контенту для дорослих” за допомогою фільтра LAION NSFW.
Модель-апскейлер для зображеннь 2048х2048
Розробники додали в Stable Diffusion 2.0 модельа-апскейлер, яка підвищує роздільну здатність зображень у 4 рази. Таким чином, в поєднанні з новими моделями перетворення тексту на зображення тепер можна генерувати зображення з роздільною здатністю 2048х2048.
Роспізнавання глибини на зображеннях
В новій версії програми тепер є модель depth2img з окремим шаром розпізнавання глибини зображення. Дозволяє краще переносити і зберігати глибину в методах img2img та inpainting. Це знадобиться при генерації скетчів та фотографій.
Depth2img визначає глибину вхідного зображення (використовуючи існуючу модель), а потім генерує нові зображення, використовуючи як текст, так і інформацію про глибину.
Нова Inpainting модель
Нова модель в версії 2.0 зберігати форми та деталі вихідного зображення при перемальовці.
Розробники обіцяють випустити моделі в Stability AI API Platform (platform.stability.ai) і DreamStudio в найближчі кілька днів.
Також для отримання більш детальної інформації про доступ до моделі компанія просить ознайомитись із примітками на GitHub.
Керівництво Meta ухвалило рішення припинити підтримку Workrooms як окремого додатку з 16 лютого 2026 року.…
Компанія OpenAI випустила велике оновлення для ChatGPT з підтримкою розширеного пошуку в історії чатів, але…
Застосунки, створені за допомогою вайб-кодування, де розробник надає агенту штучного інтелекту повну свободу дій, ймовірно,…
Одна з найбільших українських продуктових IT-компаній MacPaw оголосила про закриття з 16 лютого 2026 року…
Компанія Replit оголосила про запуск нового веб-інструменту вайб-кодування під назвою Mobile Apps on Replit. Він…
Генеральний директор компанії Cursor AI Майкл Труелл повідомив, що LLM-модель GPT-5.2, яку задіяли через агент…