Рубріки: Новини

DeepSeek стверджує, що її оновлена ​​модель R1 краще справляється з програмуванням

Дмитро Сімагін

Китайський стартап DeepSeek заявив, що його оновлена LLM-​​модель R1 може виконувати математичні обчислення, програмування та загальну логіку краще, ніж попередня версія, при цьому менше викликає галюцинації. Про це повідомляє Bloomberg.

У примітках до оновленого релізу, який викладено на Hugging Face 28 травня, стверджується, що нова версія моделі відрізняється більшою глибиною мислення, ніж перша версія, яку представили в січні. 

«Її загальна продуктивність зараз наближається до продуктивності провідних моделей, таких як o3 від OpenAI та Gemini 2.5 Pro від Google», — заявили в DeepSeek.

Водночас, китайський стартап наголошує, що останнє оновлення є «незначним», очевидно, натякаючи, що більшого прориву слід чекати в наступному повноцінному релізі.

Модель DeepSeek R1 має 685 мільярдів параметрів і довжину контекстного вікна в 128 тисяч токенів. Однак найбільшою перевагою моделі є те, що вона, на відміну від більшості американських аналогів, має відкритий код. Хоча R1 навряд чи можна запустити на обладнання споживчого рівня, вона доступна для вільного завантаження та запуску на професійному обладнанні.

Помірна вартість (лише $6 млн) і короткий термін розробки R1 свого часу шокували світові ринки, викликавши занепокоєння, що IT-гіганти США надмірно витрачають гроші на інфраструктуру.

Останні статті

ЄС запускає «тимчасове рішення» для перевірки віку інтернет-користувачів

За підтримки Європейської комісії представлено бета-версію мобільного додатку для перевірки віку користувачів онлайн-платформ та відвідувачів…

30.05.2025

Gemini тепер може аналізувати зміст відеофайлів в Google Drive

У Google Drive інтегровані нові функції LLM-моделі Gemini, які надають користувачам більше інформації про збережені…

30.05.2025

CEO Anthropic: штучний інтелект може знищити до 50% позицій джунів

Генеральний директор Anthropic Даріо Амодей вважає, що штучний інтелект незабаром може скоротити 50% офісних робочих…

30.05.2025

На Stack Overflow з’являться платні експерти, які допомагатимуть у вирішенні проблем з кодом

На фоні значного падіння трафіку та запитів користувачів, причиною чого є зростання популярності чат-ботів, сайт…

30.05.2025

Mistral випустив Codestral Embed — інструмент для автодоповнення, редагування та пояснення коду

Французький стартап Mistral AI представив Codestral Embed — свою першу модель, орієнтовану виключно на роботу…

30.05.2025

Microsoft розробила спрощений спосіб запуску C# з командного рядка

Компанія Microsoft розробила новий спрощений спосіб запуску C# з командного рядка. Цей спосіб призначений як…

29.05.2025