OpenAI випустила GPT-OSS — першу LLM-модель з відкритим кодом з часів GPT-2
Компанія OpenAI вперше за шість років випустила модель з відкритим кодом. На ринок представили gpt-oss-120b та gpt-oss-20b — обидві LLM можуть працювати локально на пристроях користувачів і налаштовуватися для конкретних цілей, повідомляє The Verge.
Старша модель має 120 мільярдів параметрів, gpt-oss-20b — 20 мільярдів. Версія gpt-oss-120b може працювати на одному графічному процесорі Nvidia, та аналогічна існуючій моделі OpenAI o4-mini, тоді як менша версія працює приблизно на такому ж рівні, як o3-mini, але використовує на пристрої лише 16 ГБ пам’яті.
Обидві версії моделі вже доступні на платформах Hugging Face, Databricks, Azure та AWS за ліцензією Apache 2.0, що дозволяє їх широко модифікувати для комерційних цілей. Останньою моделлю з відкритим кодом, яку випустили в OpenAI, була GPT-2 ще у 2019 році.
Оскільки нові LLM-моделі є загальнодоступними, це означає, що будь-хто може переглянути внутрішні параметри gpt-oss, щоб отримати уявлення про те, як вони обробляють інформацію. На відміну від ChatGPT, їх можна запускати без підключення до інтернету та через брандмауер.
Для OpenAI реліз моделі з відкритим кодом є відмовою від стратегії, яка зосереджується виключно на комерційних релізах, оскільки компанія останніми місяцями все більше стикається з конкуренцією з боку DeepSeek, Meta, Alibaba та інших розробників.
Google випустила стабільний реліз системи визначення вмісту файлів Magika 1.0. Вона вміє аналізувати тип та…
Компанія Microsoft представила нову функцію в маркетплейсі Microsoft Store, яка дозволяє створювати один інсталяційний пакет…
12 листопада у кінотеатрі «Жовтень» відбудеться The Late Business Show by OBRIO — вечір, де…
Google Cloud оновлює свій конструктор агентів Vertex AI Agent Builder, додавши до нього нові інструменти…
Компанія Microsoft опублікувала результати випробувань Magentic Marketplace — симуляції торгового майданчика для дослідження можливостей агентів…
Некомерційна організація AI HOUSE розпочинає реєстрацію на Deep Tech Accelerator: Hardware Edition — non-equity програми…