OpenAI випустила GPT-OSS — першу LLM-модель з відкритим кодом з часів GPT-2
Компанія OpenAI вперше за шість років випустила модель з відкритим кодом. На ринок представили gpt-oss-120b та gpt-oss-20b — обидві LLM можуть працювати локально на пристроях користувачів і налаштовуватися для конкретних цілей, повідомляє The Verge.
Старша модель має 120 мільярдів параметрів, gpt-oss-20b — 20 мільярдів. Версія gpt-oss-120b може працювати на одному графічному процесорі Nvidia, та аналогічна існуючій моделі OpenAI o4-mini, тоді як менша версія працює приблизно на такому ж рівні, як o3-mini, але використовує на пристрої лише 16 ГБ пам’яті.
Обидві версії моделі вже доступні на платформах Hugging Face, Databricks, Azure та AWS за ліцензією Apache 2.0, що дозволяє їх широко модифікувати для комерційних цілей. Останньою моделлю з відкритим кодом, яку випустили в OpenAI, була GPT-2 ще у 2019 році.
Оскільки нові LLM-моделі є загальнодоступними, це означає, що будь-хто може переглянути внутрішні параметри gpt-oss, щоб отримати уявлення про те, як вони обробляють інформацію. На відміну від ChatGPT, їх можна запускати без підключення до інтернету та через брандмауер.
Для OpenAI реліз моделі з відкритим кодом є відмовою від стратегії, яка зосереджується виключно на комерційних релізах, оскільки компанія останніми місяцями все більше стикається з конкуренцією з боку DeepSeek, Meta, Alibaba та інших розробників.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: