Некоммерческая и лучше GPT-3: Meta выпустила новый язык машинного обучения LLaMa
Meta, материнская компания Facebook сегодня официально объявила о релизе новой large language model с названием LLaMa.
Об этом идет речь на официальном сайте Meta AI.
Судя по информации, это скорее исследовательский инструмент для решения некоторых проблем, мешающих другим языковым моделям ИИ.
Этот исследовательский инструмент должен «демократизировать доступ в этой быстро меняющейся важной области». То есть, помочь экспертам выявить проблемы языковых моделей ИИ: пристрастность, токсичность и склонность придумывать информацию.
LLaMA на самом деле не единственная система, а сборка моделей разного размера под «некоммерческой лицензией, ориентированной на исследовательские варианты использования».
«Мы делаем LLaMa доступной в нескольких размерах (параметры 7B, 13B, 33B и 65B), а также делимся карточкой модели LLAMA, в которой подробно описывается, как мы построили модель в соответствии с нашим подходом к практике ответственного ИИ», — утверждают исследователи.
Соответственно, доступ к языку получат университеты и исследовательские учреждения.
В исследовательской статье Meta утверждает, что вторая по размеру версия модели LLaMA, LLaMA-13B, работает лучше, чем популярная модель OpenAI GPT-3, «в большинстве тестов», в то время как самая большая, LLaMA-65B, «конкурентоспособна с лучшими моделями», такие как Chinchilla70B от DeepMind и PaLM 540B от Google.
Отметим, что Google и OpenAI, сотрудничающий с Microsoft, сейчас ведут войну искусственного интеллекта.
Недавно Google анонсировал запуск чат-бота на базе искусственного интеллекта под названием Bard, чтобы конкурировать с ChatGPT. Bard построен на существующей большой языковой модели Google Lamda, которую один из инженеров описывал как достаточно «умную» в своих ответах.
При этом ранее ChatGPT стал наиболее растущим приложением в истории.
Ранее сообщалось, что корпорация Microsoft приступила к работе над «убийцей Google» — новой версией своей поисковой системы Bing с использованием искусственного интеллекта, лежащего в основе ChatGPT от Open AI.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: