Рубріки: Новини

DeepSeek стверджує, що її оновлена ​​модель R1 краще справляється з програмуванням

Дмитро Сімагін

Китайський стартап DeepSeek заявив, що його оновлена LLM-​​модель R1 може виконувати математичні обчислення, програмування та загальну логіку краще, ніж попередня версія, при цьому менше викликає галюцинації. Про це повідомляє Bloomberg.

У примітках до оновленого релізу, який викладено на Hugging Face 28 травня, стверджується, що нова версія моделі відрізняється більшою глибиною мислення, ніж перша версія, яку представили в січні. 

«Її загальна продуктивність зараз наближається до продуктивності провідних моделей, таких як o3 від OpenAI та Gemini 2.5 Pro від Google», — заявили в DeepSeek.

Водночас, китайський стартап наголошує, що останнє оновлення є «незначним», очевидно, натякаючи, що більшого прориву слід чекати в наступному повноцінному релізі.

Модель DeepSeek R1 має 685 мільярдів параметрів і довжину контекстного вікна в 128 тисяч токенів. Однак найбільшою перевагою моделі є те, що вона, на відміну від більшості американських аналогів, має відкритий код. Хоча R1 навряд чи можна запустити на обладнання споживчого рівня, вона доступна для вільного завантаження та запуску на професійному обладнанні.

Помірна вартість (лише $6 млн) і короткий термін розробки R1 свого часу шокували світові ринки, викликавши занепокоєння, що IT-гіганти США надмірно витрачають гроші на інфраструктуру.

Останні статті

Amazon запускає AgentCore — набір послуг для розгортання та роботи ШІ-агентів

Amazon оголосила про запуск preview-версії AgentCore — набору послуг, які допомагають розробникам розгортати та керувати…

17.07.2025

Компанії масово відмовляються від Oracle Java на користь відкритого коду

Згідно нового опитування ITAM & SAM Survey 2025, майже 80% фахівців з ITAM і SAM…

17.07.2025

Liquid AI випустив перший SDK для розробки мобільних додатків зі штучним інтелектом

Liquid AI — стартап, заснований колишніми дослідниками Массачусетського технологічного інституту, випустив комплект розробки програмного забезпечення…

17.07.2025

На Миколаївщині з’явився перший в Україні обласний ШІ-консультант «Хвилька»

Миколаївська область першою в Україні презентувала власного цифрового консультанта на основі штучного інтелекту — «Хвильку».…

16.07.2025

Українські хакери знищили сервери та мережеву інфраструктуру російської мілтек-компанії Gaskar Group

Українська хакерська група BO Team спільно з Українським кіберальянсом та військовою розвідкою України заявила про успішну кібератаку…

16.07.2025

Оновлення Next.js 15.4 покращує Turbopack перед версією 16

Команда Next.js, популярного в JavaScript-розробці фреймворку, випустила версію 15.4. Хоча це не дуже масштабне оновлення,…

16.07.2025