Рубріки: Новини

Розробники Hugging Face почали роботу над Open-R1 — «повністю відкритим» форком DeepSeek-R1

Дмитро Сімагін

Керівник відділу Hugging Face Леандро фон Верра та кілька розробників компанії запустили Open-R1 — проект, який має на меті створити удосконалений форк моделі DeepSeek-R1 з відкритими даними для всіх компонентів, включно з тими, які використовуються для навчання. Як повідомляє TechCrunch, дослідження, для роботи над яким виділено 768 графічних процесорів Nvidia H100, лише за три дні набрало на GitHub понад 11 000 зірок. 

Технічно DeepSeek-R1 має «відкритий» код, оскільки модель має дозвільну ліцензію, що дає можливість розгортати її без обмежень. Однак R1 не є «відкритим вихідним кодом» за загальноприйнятим визначенням, оскільки деякі інструменти, використані для її створення, оповиті таємницею. Як і багато інших компаній, які працюють над створенням систем штучного інтелекту, DeepSeek не хоче розкривати всі свої секрети.

«Модель R1 вражає, але немає відкритого набору даних, деталей експерименту чи проміжних моделей, що ускладнює реплікацію та подальші дослідження», — заявив Елі Бакуш, один з розробників проекту Open-R1. 

Будучи моделлю міркування, R1 ефективно перевіряє факти, але її робота для пошуку рішення займає трохи більше часу — зазвичай секунди або хвилини — порівняно з іншими моделями без міркування. Перевагою є те, що відповіді R1, як правило, більш надійні в питаннях фізики, природничих наук та математики.

Якщо проект Open-R1 стане успішним, дослідники штучного інтелекту зможуть доповнити навчальний конвеєр і працювати над розробкою моделей міркування з відкритим кодом наступного покоління.

«Коли форк R1 буде відтворено, будь-хто, хто може орендувати кілька графічних процесорів, зможе створити свій варіант R1 із власними даними, ще більше поширюючи цю технологію», — додав Бакуш. 

Останні статті

Відповідала за Резерв+ та Армія+. Заступниця міністра оборони Катерина Черногоренко подала у відставку

Катерина Черногоренко, яка з вересня 2023‑го очолювала цифрову трансформацію в Міністерстві оборони України, оголосила про завершення роботи…

23.07.2025

Ілон Маск: перший гігаватний суперкомп’ютер Colossus 2 запустять в найближчі тижні

Засновник компанії xAI Ілон Маск поділився про майбутнє найбільшого в світу дата-центру, який зараз будується…

23.07.2025

Alibaba випустила «найпотужнішу» LLM-модель для програмування — Qwen3-Coder

Alibaba представила нову велику мовну модель з відкритою ліцензією Qwen3-Coder. У компанії назвали модель найкращим…

23.07.2025

Amazon вводить обмеження на безкоштовне використання Kiro

Amazon Web Services (AWS) обмежує безкоштовне використання Kiro,  інструменту для вайб-кодингу, який має функціонал інтегрованого…

23.07.2025

Вийшов Python 3.14 RC1: реліз-кандидат з прискореним інтерпретатором

Команда Python оголосила про вихід першої версії реліз-кандидата Python 3.14. Це фінальна стадія перед повноцінним…

23.07.2025

16% працівників у США брешуть про використання штучного інтелекту, щоб догодити начальству

Результати опитування, проведеного компанією Howdy, свідчать про те, що кожен шостий американський працівник (16%) бреше…

23.07.2025