Компанія Stability AI випустила третю версію своєї нейромережі Stable Diffusion. Поки — в ранньому доступі та зі списком очікування.
Про це йдеться в офіційному блозі Stability AI.
В новій версії популярної нейромережі буде значно покращена продуктивність, якість зображення та текстові можливості.
Розробники підкреслюють, що модель поки в ранньому доступі і цей етап має вирішальне значення для збору інформації.
Записатися в список очікування можна за посиланням.
Набір моделей Stable Diffusion 3 має параметри від 800M до 8B і заснований на DiT-трансформаторі. Саме завдяки цьому текст на картинках став краще.
Також нова версія навчилася розуміти складніші промпти.
В основі лежить формуляція дифузії через Flow Matching. Тобто, навчаються саме на лінійних траєкторіях між шумом та реальними картинками.
Компанія пропонує більш детальний звіт опублікувати трохи згодом.
Також в повідомленні йдеться й про посилення заходів безпеки щодо Stable Diffusion 3.
«Готуючись до цієї попередньої версії, ми запровадили численні заходи безпеки. Постійно співпрацюючи з дослідниками, експертами та нашою спільнотою, ми очікуємо чесного впровадження інновацій у міру наближення до публічного випуску моделі», — сказано в блозі компанії.
Нагадаємо, Meta розробила за допомогою магнітоенцефалографії нейромережу, яка реконструює картинки з мозку в реальному часі.
Читайте також:
Stability AI випустила нейромережу StableCode для кодування
Забудьте про картинки: 10 речей, які ви можете створити за допомогою штучного інтелекту просто зараз
Компанія Google оголосила про інтеграцію агента на базі штучного інтелекту Gemini CLI з редактором коду…
OpenAI представила велику мовну модель gpt-realtime, оптимізовану для генерації мовлення. Про це повідомляє блог компанії.…
Більшість проектів з відкритим кодом тримаються на ентузіазмі одиночних розробників. Це стверджує Джош Брессерс, віце-президент…
Компанія Anthropic оголосила про зміни в політиці обробки даних: до 28 вересня всі користувачі інструмента…
Опитування, проведене хмарною платформою Fastly серед 791 розробника, виявило помітну різницю в тому, скільки коду,…
Компанія Microsoft представила новий проект з відкритим кодом VibeVoice, який перетворює текст на реалістичну мову…