Рубріки: Новини

DeepSeek стверджує, що її оновлена ​​модель R1 краще справляється з програмуванням

Дмитро Сімагін

Китайський стартап DeepSeek заявив, що його оновлена LLM-​​модель R1 може виконувати математичні обчислення, програмування та загальну логіку краще, ніж попередня версія, при цьому менше викликає галюцинації. Про це повідомляє Bloomberg.

У примітках до оновленого релізу, який викладено на Hugging Face 28 травня, стверджується, що нова версія моделі відрізняється більшою глибиною мислення, ніж перша версія, яку представили в січні. 

«Її загальна продуктивність зараз наближається до продуктивності провідних моделей, таких як o3 від OpenAI та Gemini 2.5 Pro від Google», — заявили в DeepSeek.

Водночас, китайський стартап наголошує, що останнє оновлення є «незначним», очевидно, натякаючи, що більшого прориву слід чекати в наступному повноцінному релізі.

Модель DeepSeek R1 має 685 мільярдів параметрів і довжину контекстного вікна в 128 тисяч токенів. Однак найбільшою перевагою моделі є те, що вона, на відміну від більшості американських аналогів, має відкритий код. Хоча R1 навряд чи можна запустити на обладнання споживчого рівня, вона доступна для вільного завантаження та запуску на професійному обладнанні.

Помірна вартість (лише $6 млн) і короткий термін розробки R1 свого часу шокували світові ринки, викликавши занепокоєння, що IT-гіганти США надмірно витрачають гроші на інфраструктуру.

Останні статті

JetBrains закриває середовище розробки Fleet

Компанія JetBrains закриває Fleet — полегшене IDE нового покоління, яке розвивали паралельно з IntelliJ IDEA.…

10.12.2025

Підтримка Rust в ядрі Linux переведена з експериментальної в основну

Учасники конференції Maintainers Summit визнали успішним експеримент з додавання в ядро ​​Linux можливості розробки компонентів…

10.12.2025

Mistral випускає нову модель Devstral 2 та інтерфейс командного рядка Mistral Vibe CLI

Французький стартап Mistral представив нове покоління своєї LLM-моделі, яка доступна в двох варіантах: Devstral 2…

10.12.2025

Китайські моделі з відкритим кодом захопили 30% світового ринку LLM

Китайські LLM-моделі з відкритим кодом стрімко завойовують світовий ринок штучного інтелекту, зайнявши майже третину глобального…

09.12.2025

Дослідники виявили шкідливі пакети VS Code, Go, npm та Rust, які викрадають дані розробників

Дослідники з компанії Koi Security виявили на маркетплейсі Microsoft VS Code два нових розширення, які…

09.12.2025

В українській армії з’явиться окрема IT-структура з 7 тисячами цифрових офіцерів

Міністр цифрової трансформації Михайло Федоров анонсував появу в Силах оборони України нової цифрової IT-вертикалі. Її…

09.12.2025