Jump to content

Риффузия

Риффузия
Разработчик(и)
  • Сет Форсгрен
  • Айк Мученики
Первоначальный выпуск 15 декабря 2022 г.
Репозиторий github /хмартиро /riffusion-вывод
Написано в Питон
Тип Модель преобразования текста в изображение
Лицензия МОЯ лицензия
Веб-сайт распространение
Duration: 16 seconds.
Сгенерированная спектрограмма из подсказки « боссанова с электрогитарой » (вверху) и полученный звук после преобразования (внизу)

Riffusion — это нейронная сеть , разработанная Сетом Форсгреном и Айком Мартиросом, которая генерирует музыку, используя образы звука, а не аудио. [1] Он был создан как доработка Stable Diffusion — существующей модели с открытым исходным кодом для генерации изображений из текстовых подсказок на спектрограммах . [1] В результате получается модель, которая использует текстовые подсказки для создания файлов изображений, которые можно подвергнуть обратному преобразованию Фурье и преобразовать в аудиофайлы. [2] Хотя длина этих файлов составляет всего несколько секунд, модель также может использовать скрытое пространство между выходными данными для интерполяции различных файлов вместе. [1] [3] Это достигается с помощью функциональности модели Stable Diffusion, известной как img2img . [4]

Получившаяся в результате музыка была описана как « de otro mundo » (потусторонняя). [5] хотя вряд ли заменит рукотворную музыку. [5] Модель стала доступна 15 декабря 2022 года, а код также доступен в свободном доступе на GitHub . [2] Это одна из многих моделей, полученных на основе стабильной диффузии. [4]

Riffusion классифицируется как подмножество генераторов текста в музыку с использованием искусственного интеллекта. В декабре 2022 года Муберт [6] аналогичным образом использовал Stable Diffusion, чтобы превратить описательный текст в музыкальные циклы. В январе 2023 года Google опубликовала статью о собственном генераторе текста в музыку под названием MusicLM. [7] [8]

  1. ^ Jump up to: а б с Колдьюи, Девин (15 декабря 2022 г.). «Попробуйте Riffusion — модель искусственного интеллекта, которая сочиняет музыку, визуализируя ее» .
  2. ^ Jump up to: а б Наси, Мишель (15 декабря 2022 г.). «Риффузия: создание аудиодорожек с помощью искусственного интеллекта» . IlSoftware.it .
  3. ^ «Попробуйте Riffusion — модель искусственного интеллекта, которая сочиняет музыку, визуализируя ее» . 15 декабря 2022 г.
  4. ^ Jump up to: а б «Представляем искусственный интеллект «Riffusion», который автоматически генерирует музыку, соответствующую тексту, и каждый может свободно использовать его на основе искусственного интеллекта «Stable Diffusion» . GIGAZINE .
  5. ^ Jump up to: а б Ллано, Евтропио (15 декабря 2022 г.). «Генератор изображений искусственного интеллекта также может создавать музыку (с потусторонними результатами)» .
  6. ^ «Mubert запускает интерфейс Text-to-Music — совершенно новый способ создания музыки с помощью одной текстовой подсказки» . 21 декабря 2022 г.
  7. ^ «MusicLM: создание музыки из текста» . 26 января 2023 г.
  8. ^ «5 причин, по которым приложение Google MusicLM AI для преобразования текста в музыку отличается» . 27 января 2023 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 868125b322f980aa623782141f867b53__1701245760
URL1:https://arc.ask3.ru/arc/aa/86/53/868125b322f980aa623782141f867b53.html
Заголовок, (Title) документа по адресу, URL1:
Riffusion - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)