Meta, материнська компанія Facebook сьогодні офіційно оголосила про реліз нової large language model з назвою LLaMa.
Про це йдеться на офіційному сайті Meta AI.
Судячи з інформації, це скоріше дослідницький інструмент, для вирішення деяких проблем, які заважають іншим мовним моделям ШІ.
Цей дослідницький інструмент повинен «демократизувати доступ у цій важливій області, що швидко змінюється». Тобто, допомогти експертам виявити проблеми мовних моделей ШІ: упередженість, токсичнисть і схильність вигадувати інформацію.
LLaMA насправді є не єдиною системою, а збіркою моделей різного розміру під «некомерційною ліцензією, орієнтованою на дослідницькі варіанти використання».
«Ми робимо LLaMA доступними в декількох розмірах (параметри 7B, 13B, 33B та 65B), а також ділимося карткою моделі LLAMA, в якій детально описується, як ми побудували модель відповідно до нашого підходу до практики відповідального ШІ», — стверджують дослідники.
Відповідно, доступ до мови матимуть університети та дослідницькі заклади.
У дослідницькій статті Meta стверджує, що друга за розміром версія моделі LLaMA, LLaMA-13B, працює краще, ніж популярна модель OpenAI GPT-3, «у більшості тестів», у той час як найбільша, LLaMA-65B, «конкурентоспроможна з кращими моделі», такі як Chinchilla70B від DeepMind та PaLM 540B від Google.
Зазначимо, Google та OpenAI, який співпрацює з Microsoft, зараз ведуть війну штучного інтелекту.
Нещодавно Google анонсував запуск чат-бота на базі штучного інтелекту під назвою Bard, щоб конкурувати з ChatGPT. Bard побудовано на існуючій великій мовній моделі Google Lamda, яку один з інженерів описував як достатньо «розумну» у своїх відповідях.
При цьому на днях ChatGPT став найбільш зростаючим застосунком в історії.
Раніше повідомлялося, що корпорація Microsoft розпочала роботу над «вбивцею Google» — новою версією своєї пошукової системи Bing з використанням штучного інтеллекту, який лежить в основі ChatGPT від Open AI.
Компанія OpenAI представила масштабне оновлення свого десктопного застосунку Codex. Воно перетворює інструмент з простого помічника…
Модель штучного інтелекту Claude Opus 4.6 від компанії Anthropic продемонструвала здатність створювати функціональні експлойти для…
Ринок навчання штучного інтелекту виходить на новий рівень: тепер «паливом» для нейромереж стають не лише…
Молода польська розробниця Каміла Шевчик змогла розв'язати технічну проблему в інтерфейсі Linux, яка залишалася непоміченою…
Компанія Google випустила четверту та фінальну бету Android 17, яка стала важливою віхою на шляху…
Компанія Anthropic офіційно представила свою найпотужнішу на сьогодні LLM-модель — Claude Opus 4.7, яка стала…