Рубріки: Новини

DeepSeek стверджує, що її оновлена ​​модель R1 краще справляється з програмуванням

Дмитро Сімагін

Китайський стартап DeepSeek заявив, що його оновлена LLM-​​модель R1 може виконувати математичні обчислення, програмування та загальну логіку краще, ніж попередня версія, при цьому менше викликає галюцинації. Про це повідомляє Bloomberg.

У примітках до оновленого релізу, який викладено на Hugging Face 28 травня, стверджується, що нова версія моделі відрізняється більшою глибиною мислення, ніж перша версія, яку представили в січні. 

«Її загальна продуктивність зараз наближається до продуктивності провідних моделей, таких як o3 від OpenAI та Gemini 2.5 Pro від Google», — заявили в DeepSeek.

Водночас, китайський стартап наголошує, що останнє оновлення є «незначним», очевидно, натякаючи, що більшого прориву слід чекати в наступному повноцінному релізі.

Модель DeepSeek R1 має 685 мільярдів параметрів і довжину контекстного вікна в 128 тисяч токенів. Однак найбільшою перевагою моделі є те, що вона, на відміну від більшості американських аналогів, має відкритий код. Хоча R1 навряд чи можна запустити на обладнання споживчого рівня, вона доступна для вільного завантаження та запуску на професійному обладнанні.

Помірна вартість (лише $6 млн) і короткий термін розробки R1 свого часу шокували світові ринки, викликавши занепокоєння, що IT-гіганти США надмірно витрачають гроші на інфраструктуру.

Останні статті

Мова програмування Rust оновлена до версії 1.93

Команда Rust оновила мову програмування до версії 1.93. Новий реліз, який має коміти від 406…

23.01.2026

«Дія» отримає функціонал для пошуку роботи

Кабінет міністрів України погодив пілотний проєкт, за яким послуги Центрів зайнятості будуть оцифровані через систему…

23.01.2026

Microsoft представляє новий інструмент WinApp CLI, який спрощує розробку програм для Windows

Microsoft анонсувала публічну попередню версію WinApp CLI, інтерфейсу командного рядка з відкритим вихідним кодом. WinApp…

23.01.2026

JetBrains інтегрувала Codex в свої IDE та показала, як з ним працювати

Інструмент кодування Codex тепер працює всередині чату JetBrains AI, що дає можливість використовувати його безпосередньо…

23.01.2026

Міноборони України разом з Palantir починає тестування військових моделей штучного інтелекту

Державна платформа військових технологій BRAVE1 разом з Міністерством оборони України та за підтримки американської компанії…

23.01.2026

«Вони використовували вайб-кодинг»: хакер створив каталог «небезпечних додатків»

Анонімний хакер запустив «магазин небезпечних iOS-додатків» — публічний реєстр програм, швидко створених за допомогою вайб-кодингу.…

22.01.2026