Рубріки: Новини

DeepSeek стверджує, що її оновлена ​​модель R1 краще справляється з програмуванням

Дмитро Сімагін

Китайський стартап DeepSeek заявив, що його оновлена LLM-​​модель R1 може виконувати математичні обчислення, програмування та загальну логіку краще, ніж попередня версія, при цьому менше викликає галюцинації. Про це повідомляє Bloomberg.

У примітках до оновленого релізу, який викладено на Hugging Face 28 травня, стверджується, що нова версія моделі відрізняється більшою глибиною мислення, ніж перша версія, яку представили в січні. 

«Її загальна продуктивність зараз наближається до продуктивності провідних моделей, таких як o3 від OpenAI та Gemini 2.5 Pro від Google», — заявили в DeepSeek.

Водночас, китайський стартап наголошує, що останнє оновлення є «незначним», очевидно, натякаючи, що більшого прориву слід чекати в наступному повноцінному релізі.

Модель DeepSeek R1 має 685 мільярдів параметрів і довжину контекстного вікна в 128 тисяч токенів. Однак найбільшою перевагою моделі є те, що вона, на відміну від більшості американських аналогів, має відкритий код. Хоча R1 навряд чи можна запустити на обладнання споживчого рівня, вона доступна для вільного завантаження та запуску на професійному обладнанні.

Помірна вартість (лише $6 млн) і короткий термін розробки R1 свого часу шокували світові ринки, викликавши занепокоєння, що IT-гіганти США надмірно витрачають гроші на інфраструктуру.

Останні статті

У Києві пройде перший хакатон з вайб-кодингу: як взяти участь

4-5 жовтня в Києві на Подолі пройде захід Vibecoding Hackathon. Протягом двох днів розробники, користувачі…

05.09.2025

OpenAI запустить платформу для IT-найму та програму сертифікації навичок

OpenAI готується запустити платформу для найму, яка конкуруватиме з LinkedIn. Майбутній сервіс під назвою OpenAI…

05.09.2025

Google випустила бету бібліотеки Compose 1.2 — базовий інструментарій для створення user-інтерфейсів в Android

Google оголосила, що бібліотека адаптивних макетів Compose 1.2 офіційно переходить у бета-версію. Вона надає розробникам…

04.09.2025

«Тепер важлива не кваліфікація, а ключові слова»: IT-фахівці розчаровані автоматизованим аналізом резюме

Опитування Dice, проведене серед понад 200 IT-працівників, виявило широке розчарування автоматизованою перевіркою резюме. Багато респондентів…

04.09.2025

Хакери навчились використовувати Grok для поширення шкідливих посилань

Зловмисники використовують Grok, вбудований у X помічник на основі штучного інтелекту, щоб обійти обмеження на…

04.09.2025

На GitHub виклали оригінальний код BASIC 1978 року

На GitHub виклали оригінальний вихідний код інтерпретатора BASIC 1.1 для процесора MOS 6502. Microsoft датує…

04.09.2025