Рубріки: Новини

Розробники Hugging Face почали роботу над Open-R1 — «повністю відкритим» форком DeepSeek-R1

Дмитро Сімагін

29.01.2025 10:02

Керівник відділу Hugging Face Леандро фон Верра та кілька розробників компанії запустили Open-R1 — проект, який має на меті створити удосконалений форк моделі DeepSeek-R1 з відкритими даними для всіх компонентів, включно з тими, які використовуються для навчання. Як повідомляє TechCrunch, дослідження, для роботи над яким виділено 768 графічних процесорів Nvidia H100, лише за три дні набрало на GitHub понад 11 000 зірок.

Технічно DeepSeek-R1 має «відкритий» код, оскільки модель має дозвільну ліцензію, що дає можливість розгортати її без обмежень. Однак R1 не є «відкритим вихідним кодом» за загальноприйнятим визначенням, оскільки деякі інструменти, використані для її створення, оповиті таємницею. Як і багато інших компаній, які працюють над створенням систем штучного інтелекту, DeepSeek не хоче розкривати всі свої секрети.

«Модель R1 вражає, але немає відкритого набору даних, деталей експерименту чи проміжних моделей, що ускладнює реплікацію та подальші дослідження», — заявив Елі Бакуш, один з розробників проекту Open-R1.

Будучи моделлю міркування, R1 ефективно перевіряє факти, але її робота для пошуку рішення займає трохи більше часу — зазвичай секунди або хвилини — порівняно з іншими моделями без міркування. Перевагою є те, що відповіді R1, як правило, більш надійні в питаннях фізики, природничих наук та математики.

Якщо проект Open-R1 стане успішним, дослідники штучного інтелекту зможуть доповнити навчальний конвеєр і працювати над розробкою моделей міркування з відкритим кодом наступного покоління.

«Коли форк R1 буде відтворено, будь-хто, хто може орендувати кілька графічних процесорів, зможе створити свій варіант R1 із власними даними, ще більше поширюючи цю технологію», — додав Бакуш.

Наступна стаття Третина українських IT-спеціалістів працює в компаніях, що входять до «Дія.City» »

попередня стаття « «Я просто шукаю собі хлопця». HR Deloitte розповів про делікатне прохання від дівчини щодо співбесіди

Дмитро Сімагін

Теги: DeepSeekLLM-модельOpen-R1штучний інтелект

29.01.2025 10:02

Останні статті

Новини

Обкрадали геймерів по всьому світу: на Львівщині затримали групу хакерів

Поліцейські Львівської області затримали хакерське угруповання, учасники якого зламали понад 610 тисяч геймерських профілів. Метою…

28.04.2026

Новини

Програма «в кредит»: в App Store з’являться підписки з річним зобов’язанням

Компанія Apple анонсувала впровадження нової моделі монетизації програм в App Store. Вона має зробити платні…

28.04.2026

Новини

Сем Альтман пояснив, хто керуватиме суперінтелектом

Генеральний директор OpenAI Сем Альтман опублікував допис «Наші принципи», у якому виклав п'ять ключових орієнтирів…

28.04.2026

Новини

Штучний інтелект став дорожчим за програмістів: Uber витратив річний ліміт на LLM за один квартал

Ейфорія навколо впровадження штучного інтелекту змінюється жорстким прагматизмом: для багатьох технологічних гігантів вартість використання LLM…

27.04.2026

Новини

Прощавай, Codex! OpenAI відмовляється від окремої моделі для програмування

Компанія OpenAI офіційно оголосила про припинення підтримки Codex як окремої спеціалізованої моделі для завдань програмування.…

27.04.2026

Новини

Microsoft капітулює: оновлення Windows 11 тепер можна відкладати «назавжди»

Після років скарг на раптові перезавантаження Windows під час важливих нарад та робочих зустрічей, Microsoft…

27.04.2026

Розробники Hugging Face почали роботу над Open-R1 — «повністю відкритим» форком DeepSeek-R1

Схожі статті

Останні статті

Обкрадали геймерів по всьому світу: на Львівщині затримали групу хакерів

Програма «в кредит»: в App Store з’являться підписки з річним зобов’язанням

Сем Альтман пояснив, хто керуватиме суперінтелектом

Штучний інтелект став дорожчим за програмістів: Uber витратив річний ліміт на LLM за один квартал

Прощавай, Codex! OpenAI відмовляється від окремої моделі для програмування

Microsoft капітулює: оновлення Windows 11 тепер можна відкладати «назавжди»