Рубріки: Новости

Новый искусственный интеллект Meta может распознавать более 4 тысяч языков

Ігор Шелудченко

Meta создала языковую модель искусственного интеллекта Massively Multilingual Speech (MMS), которая способна распознавать более 4 тысяч языков, а также преобразовывать текст в вещание более чем на 1100 языках.

Об этом компания  сообщила  в своем блоге.

«Сегодня мы публично делимся нашими моделями и кодом, чтобы другие в исследовательском сообществе могли использовать нашу работу, — говорится в сообщении. — Благодаря этой работе мы надеемся внести небольшой вклад в сохранение невероятного языкового разнообразия мира».

Что характерно, компания выпустила MMS для исследований с открытым исходным кодом, чтобы помочь сохранить языковое разнообразие и привлечь исследователей.

Создание и дальнейшее развитие MMS предполагает возможность доступа к информации и использования устройств на том языке, на котором владеет пользователь: от технологий виртуальной и дополненной реальности до служб обмена сообщениями.

«Модели MMS расширяют технологию преобразования текста в вещание и вещание в текст с примерно 100 до более 1100 языков — в более чем 10 раз больше, чем раньше», — отметили в компании.

Необычный подход

Meta использовала довольно нетрадиционный подход к сбору аудиоданных: обратились к прослушиванию аудиозаписей переведенных религиозных текстов.

«Мы обратились к религиозным текстам, таким как Библия, которые были переведены на многие разные языки. Эти переводы были широко изучены для изучения языкового перевода на основе текста», – заявили в компании. 

Включив немаркированные записи Библии и подобных текстов, исследователи Meta увеличили количество доступных языков модели до более чем 4000.

Для обучения MMS распознавания языков прибегли к нестандартному подходу – обратились к религиозным текстам. Библия и другие основные книги мировых религии переведены на множество языков, и существует множество общедоступных аудиозаписей, где эти тексты зачитываются. Обучение модели усложнилось из-за того, что аудиозаписи не имели точной текстовой разметки, но в итоге количество поддерживаемых языков превысило 4 тысячи.

«Хотя эти тексты часто начитываются представителями мужского пола, анализ показал, что наши модели все равно хорошо работают как для мужского, так и для женского голоса , — отметили в Meta.

В компании добавили, что собираются расширять список языков, которыми будет владеть MMS. Ожидается, что в дальнейшем она овладеет и региональными диалектами.

Напомним, недавно Google выпустил  новую обширную языковую модель PaLM 2, использующую почти в пять раз больше обучающих данных, чем ее предшественница. Это позволяет ей выполнять более продвинутые задачи по кодированию, математике и написанию текстов.

Останні статті

Что такое прокси-сервер: пояснение простыми словами, зачем нужны прокси

Прокси (proxy), или прокси-сервер — это программа-посредник, которая обеспечивает соединение между пользователем и интернет-ресурсом. Принцип…

21.11.2024

Что такое PWA приложение? Зачем необходимо прогрессивное веб-приложение

Согласитесь, было бы неплохо соединить в одно сайт и приложение для смартфона. Если вы еще…

19.11.2024

Как создать игру на телефоне: программирование с помощью конструктора

Повсеместное распространение смартфонов привело к огромному спросу на мобильные игры и приложения. Миллиарды пользователей гаджетов…

17.11.2024

Google Bard: эффективный аналог ChatGPT

В перечне популярных чат-ботов с искусственным интеллектом Google Bard (Gemini) еще не пользуется такой популярностью…

14.11.2024

Скрипт и программирование: что это такое простыми словами

Скрипт (англ. — сценарий), — это небольшая программа, как правило, для веб-интерфейса, выполняющая определенную задачу.…

12.11.2024

Дедлайн в разработке: что это такое простыми словами

Дедлайн (от англ. deadline — «крайний срок») — это конечная дата стачи проекта или задачи…

11.11.2024