DeepSeek стверджує, що її оновлена модель R1 краще справляється з програмуванням
Китайський стартап DeepSeek заявив, що його оновлена LLM-модель R1 може виконувати математичні обчислення, програмування та загальну логіку краще, ніж попередня версія, при цьому менше викликає галюцинації. Про це повідомляє Bloomberg.
У примітках до оновленого релізу, який викладено на Hugging Face 28 травня, стверджується, що нова версія моделі відрізняється більшою глибиною мислення, ніж перша версія, яку представили в січні.
«Її загальна продуктивність зараз наближається до продуктивності провідних моделей, таких як o3 від OpenAI та Gemini 2.5 Pro від Google», — заявили в DeepSeek.
Водночас, китайський стартап наголошує, що останнє оновлення є «незначним», очевидно, натякаючи, що більшого прориву слід чекати в наступному повноцінному релізі.
Модель DeepSeek R1 має 685 мільярдів параметрів і довжину контекстного вікна в 128 тисяч токенів. Однак найбільшою перевагою моделі є те, що вона, на відміну від більшості американських аналогів, має відкритий код. Хоча R1 навряд чи можна запустити на обладнання споживчого рівня, вона доступна для вільного завантаження та запуску на професійному обладнанні.
Помірна вартість (лише $6 млн) і короткий термін розробки R1 свого часу шокували світові ринки, викликавши занепокоєння, що IT-гіганти США надмірно витрачають гроші на інфраструктуру.
Керівна рада проекту Fedora затвердила правила, які регламентують використання інструментів на базі штучного інтелекту при…
Браузер на основі штучного інтелекту ChatGPT Atlas, який днями представила компанія OpenAI, виявився вразливим до…
Користувач форуму ResetEra помітив, що інструмент на базі штучного інтелекту Microsoft Gaming Copilot, який автоматично…
Розробник під ніком donno2048 знову побив власний рекорд, зумівши помістити легендарну онлайн-гру «Змійка» (Snake) в…
Microsoft оголосила про публічний попередній перегляд функції планування у Visual Studio. Компанія запевняє, що вона…
Черговий російський обстріл Харкова, який стався 22 жовтня, призвів до пошкодження будівлі Європейського інноваційного хабу,…