Рубріки: Новини

OpenAI стверджує, що має докази «несанкціонованого використання» її моделі для навчання DeepSeek-R1

Дмитро Сімагін

Компанія OpenAI заявляє, що має докази того, що китайський стартап DeepSeek використовував її великі мовні моделі для навчання власної моделі DeepSeek-R1 з відкритим кодом. Представник Адміністрації президента США Девід Сакс вважає, що йдеться про ймовірну крадіжку інтелектуальної власності, пише Financial Times.

За інформацією OpenAI, її спеціалісти знайшли докази «дистиляції», які можуть вести слід до DeepSeek. Техніка дистиляції використовується розробниками для отримання кращої продуктивності на менших моделях за рахунок використання результатів більших та потужніших моделей. Це дозволяє їм досягати подібних результатів у конкретних завданнях, витрачаючи набагато менше ресурсів.

Дистиляція є звичайною практикою в галузі, але занепокоєння полягає в тому, що в DeepSeek могли робити це для створення власної конкурентної моделі, що є порушенням умов обслуговування OpenAI.

«Проблема виникає тоді, коли ви робите це, щоб створити власну модель для власних цілей», — сказала неназвана людина, близька до OpenAI.

Представники компанії Сема Альтмана відмовились від подальших коментарів або надання деталей своїх доказів. Умови обслуговування OpenAI стверджують, що користувачі не можуть копіювати жодні з її сервісів або «використовувати результати для розробки моделей, які конкурують з OpenAI».

Модель DeepSeek-R1 привернула широку увагу в IT-індустрії завдяки досягненню результатів на рівні провідних моделей за надзвичайно низькою ціною. Китайська компанія стверджує, що витратила лише $5,6 мільйона на розробку, що є невеликою частиною того, скільки зазвичай інвестують OpenAI чи Google. Цього тижня мобільний додаток DeepSeek досяг першої позиції в рейтингах безкоштовних програм Apple App Store і Google Play у багатьох країнах, включаючи США.

Останні статті

Brave1 продовжили прийняття заявок на конкурс Battle Proven для deftech-стартапів

Кластер Brave1 продовжив прийняття заявок на конкурс Battle Proven — тепер податися можна до 25 липня 2025 року. Про це…

21.07.2025

Експериментальна LLM-модель OpenAI досягла рівня переможця Міжнародної математичної олімпіади

Експериментальна модель OpenAI досягла рівня золотої медалі на Міжнародній математичній олімпіаді (IMO), вирішивши п'ять із…

21.07.2025

JetBrains переводить всі продукти IntelliJ IDEA на єдиний інсталятор

Компанія JetBrains повідомила, що всі програмні продукти серії IntelliJ IDEA відтепер переходять на єдиний уніфікований…

21.07.2025

Українські кіберфахівці викрили намагання росіян використати LLM-модель для атак на держустанови

Команда реагування на комп'ютерні надзвичайні ситуації України (CERT-UA) розкрила деталі фішингової кампанії, спрямованої на поширення…

21.07.2025

Hugging Face представляє AnyCoder — безкоштовний інструмент для веб-розробки без знання мов програмування

Платформа Hugging Face представляє AnyCoder — середовище для розробки веб-додатків з відкритим кодом. Новий інструмент,…

21.07.2025

Intel припинила 10-річний проект розробки власного дистрибутиву Linux

Компанія Intel оголосила про згортання проекту Clear Linux, робота над яким тривала 10 років. Метою…

21.07.2025