Компанія Meta випустила нейромережу AudioCraft — це генератор музики, в якому працює одразу три моделі штучного інтелекту.
Цією новиною Meta поділилася у себе в блозі.
AudioCraft складається з трьох моделей: MusicGen, AudioGen та EnCodec
Крім того, за рахунок відкритого вихідного коду розробники можуть покращувати нейромережу та навчати її далі.
«Люди можуть легко розширити наші моделі та адаптувати їх до своїх випадків використання для дослідження. Є майже безмежні можливості, коли ви надаєте людям доступ до моделей, щоб налаштувати їх відповідно до своїх потреб. І це те, що ми хочемо зробити з цим сімейством моделей: дати людям можливість покращити свою роботу», — повідомила компанія.
У Meta вважають, що AudioCraft можуть використовувати й професійні музиканти, розробники ігор та представники малого бізнесу, щоб створити аудіо до постів у соцмережах.
Прослухати готові записи можна на сайті AudioCraft, а вихідний код проєкту вже доступний на GitHub.
Зазначимо, що це далеко не перша подібна нейромережа. Пів року тому розробники Google створили MusicLM. Вона генерує музику на частоті 24 кГц, яка залишається незмінною протягом декількох хвилин.
Розробники «для підтримки майбутніх досліджень» опублікували набір даних, який складається з 5,5 тис. пар «музика-текст», тобто детальний опис + аудіофайл.
Читайте також:
YouTube створює нейромережу для багатомовного дубляжу відео
Як тобі таке, Midjourney? Нейромережа-генератор відео за текстом GEN-2 стала загальнодоступною
Oracle та OpenAI уклали угоду про створення дата-центру Stargate на 4,5 ГВт, повідомили Dev.ua. В…
Ethereum Ukraine організовує офіційне святкування десятиріччя блокчейну Ethereum разом із його офіційним представництвом. Подія пройде…
Міністерство цифрової трансформації України анонсує програму Veteran Venture Program від компанії SKELAR, яка надає шанс…
3 липня в Києві відбулися загальні збори Асоціації IT Ukraine. Це була закрита подія для…
Компанія Microsoft провела дослідження щодо того, на які професії найбільше вплине розвиток штучного інтелекту. Для…
Google розширює сферу застосування своєї LLM-моделі Gemini 2.5 Pro, додаючи агента для роботи в терміналі…