Новини 28/01/2025 09:53

DeepSeek випускає Janus-Pro — генератор зображень, який конкурує з OpenAI DALL-E 3

Автор новин

Компанія DeepSeek, яка днями викликала фурор своєю моделлю штучного інтелекту DeepSeek-R1, оголосила про реліз ще одного програмного продукту. Китайський стартап випустив сімейство мультимодальних моделей Janus-Pro. Як повідомляє TechCrunch, ці моделі здатні генерувати зображення краще, ніж OpenAI DALL-E 3, PixArt-alpha та Stable Diffusion XL.

Janus-Pro поширюються за ліцензією MIT, що означає, що їх можна використовувати з комерційною метою без обмежень. Моделі вже доступні для завантаження з платформи розробки Hugging Face.

Janus-Pro пропонується у кількох версіях: від 1 до 7 мільярдів параметрів. Флагманська модель Janus-Pro-7B успішно продемонструвала свої можливості в бенчмарках GenEval та DPG-Bench. Її архітектура дозволяє не лише створювати зображення, а й аналізувати їх. Єдиним недоліком є те, що поточна версія обмежена генерацією картинок з роздільною здатністю 384 × 384 пікселів, що значно нижче за стандарти інших сучасних моделей.

«Janus-Pro перевершує попередню уніфіковану модель і відповідає або перевершує продуктивність моделей, орієнтованих на конкретні завдання. Простота, висока гнучкість та ефективність Janus-Pro роблять її сильним кандидатом для уніфікованих мультимодальних моделей наступного покоління», — пише DeepSeek у пості на Hugging Face.

На думку експертів, перевага Janus-Pro в її універсальності. Модель поєднує аналіз та генерацію, що рідко зустрічається в конкуруючих продуктах. Хоча роздільна здатність зображень поки не дотягує до рівня DALL-E 3, відкрита ліцензія та адаптивність можуть прискорити впровадження Janus-Pro в комерційні проекти.