Jump to content

OpenSMILE

openSMILE
Разработчик(и) аудЕЕРИНГ ГмбХ
Первоначальный выпуск сентябрь 2010 г .; 13 лет назад ( 2010-09 )
Стабильная версия
3.0.1 [ 1 ] / 4 января 2022 г .; 2 года назад ( 04.01.2022 )
Написано в С++
Платформа Linux , macOS , Windows , Android , iOS
Тип Машинное обучение
Лицензия Доступен исходный код , собственная собственность
Веб-сайт audeering.com

openSMILE [ 2 ] — это доступное для источника программное обеспечение для автоматического извлечения характеристик из аудиосигналов и классификации речевых и музыкальных сигналов. «SMILE» означает «Интерпретация речи и музыки путем извлечения большого пространства». Программное обеспечение в основном применяется в области автоматического распознавания эмоций и широко используется в исследовательском сообществе аффективных вычислений . Проект openSMILE существует с 2008 года и поддерживается немецкой компанией audEERING GmbH с 2013 года. openSMILE предоставляется бесплатно для исследовательских целей и личного использования по лицензии, доступной в исходном коде. Для коммерческого использования инструмента компания audEERING предлагает специальные варианты лицензий.

Области применения

[ редактировать ]

openSMILE используется для академических исследований, а также для коммерческих приложений для автоматического анализа речевых и музыкальных сигналов в режиме реального времени. В отличие от автоматического распознавания речи , которое извлекает речевой контент из речевого сигнала, openSMILE способен распознавать характеристики данного речевого или музыкального сегмента. говорящего Примерами таких характеристик, закодированных в человеческой речи, являются эмоции , [ 3 ] возраст, пол и личность, а также состояния говорящего, такие как депрессия , интоксикация или голосовые патологические расстройства. Программное обеспечение также включает в себя технологию классификации музыки для автоматического определения музыкального настроения и распознавания сегментов припева , тональности, аккордов , темпа, метра, танцевального стиля и жанра.

Набор инструментов openSMILE служит эталоном в многочисленных исследовательских конкурсах, таких как Interspeech ComParE, [ 4 ] С, [ 5 ] МедиаЭвал, [ 6 ] и ЭмотиВ. [ 7 ]

Проект openSMILE был начат в 2008 году Флорианом Эйбеном, Мартином Вёлльмером и Бьорном Шуллером в Мюнхенском техническом университете в рамках исследовательского проекта Европейского Союза SEMAINE. Целью проекта SEMAINE была разработка виртуального агента с эмоциональным и социальным интеллектом . В этой системе openSMILE применялся для анализа речи и эмоций в реальном времени. Последняя версия программного обеспечения SEMAINE основана на openSMILE версии 1.0.1.

В 2009 году на основе openSMILE был опубликован набор инструментов для распознавания эмоций (openEAR). «EAR» означает «Распознавание эмоций и аффектов».

В 2010 году была опубликована версия openSMILE 1.0.1, которая была представлена ​​и награждена на конкурсе ACM Multimedia Open-Source Software Challenge.

В период с 2011 по 2013 год технология openSMILE была расширена и улучшена Флорианом Эйбеном и Феликсом Венингером в контексте их докторской диссертации в Техническом университете Мюнхена . Программное обеспечение также применялось для проекта ASC-Inclusion, который финансировался Европейским Союзом . Для этого проекта Эрик Марчи расширил программное обеспечение, чтобы научить детей с аутизмом выражать эмоции на основе автоматического распознавания и визуализации эмоций.

В 2013 году компания audEERING приобрела права на кодовую базу у Технического университета Мюнхена , и версия 2.0 была опубликована под лицензией на исследования с доступным исходным кодом.

До 2016 года openSMILE был загружен более 50 000 раз по всему миру и зарекомендовал себя как стандартный набор инструментов для распознавания эмоций.

openSMILE был награжден в 2010 году в рамках конкурса ACM Multimedia Open Source. Программный инструмент применяется в многочисленных научных публикациях по автоматическому распознаванию эмоций. openSMILE [ 8 ] и его расширение openEAR [ 9 ] до сегодняшнего дня цитировались более чем в 1000 научных публикациях.

  1. ^ «Выпуск openSMILE 3.0.1» . Проверено 5 января 2022 г.
  2. ^ Ф. Эйбен, М. Вёлльмер, Б. Шуллер: « openSMILE - мюнхенский универсальный и быстрый экстрактор аудио с открытым исходным кодом », в Proc. ACM Multimedia (MM), ACM, Флоренция, Италия, ACM, стр. 1459–1462, октябрь 2010 г.
  3. ^ Б. Шуллер, Б. Власенко, Ф. Эйбен, М. Вёлльмер, А. Штулзац, А. Вендемут, Г. Ригол, « Межкорпусное акустическое распознавание эмоций: варианты и стратегии (расширенное резюме) », в Proc. ACII 2015, Сиань, Китай, приглашен на специальную сессию, посвященную наиболее влиятельным статьям в области транзакций IEEE по аффективным вычислениям.
  4. ^ Б. Шуллер, С. Стейдл, А. Батлинер, Дж. Хиршберг, Дж. К. Бургун, А. Элкинс, Ю. Чжан, Э. Коутиньо: « Вызов вычислительной паралингвистики INTERSPEECH 2016: обман и искренность. Архивировано 9 июня 2017 г., The Wayback Machine », Proceedings INTERSPEECH 2016, ISCA, Сан-Франциско, США, 2016.
  5. ^ Ф. Рингеваль, Б. Шуллер, М. Валстар, Р. Коуи, М. Пантик, « AVEC 2015 — 5-й международный конкурс и семинар по аудио/визуальным эмоциям », в материалах 23-й Международной конференции ACM по мультимедиа, MM 2015, (Брисбен, Австралия), ACM, октябрь 2015 г.
  6. ^ М. Ескевич, Р. Али, Д. Ракка, Р. Ордельман, С. Чен, Г. Дж. Джонс, « Задача поиска и гиперссылок на MediaEval 2014 ».
  7. ^ Ф. Рингеваль, С. Амирипарян, Ф. Эйбен, К. Шерер, Б. Шуллер, « Распознавание эмоций в дикой природе: включение активности голоса и губ в мультимодальное слияние на уровне принятия решений », в материалах ICMI 2014 EmotiW - Emotion Recognition In The Wild Challenge and Workshop (EmotiW 2014), Сателлит 16-й Международной конференции ACM по мультимодальному взаимодействию (ICMI 2014), (Стамбул, Турция), стр. 473–480, ACM, ноябрь 2014 г.
  8. ^ Эйбен, Флориан; Вёльмер, Мартин; Шуллер, Бьёрн (26 апреля 2018 г.). Opensmile: мюнхенский универсальный и быстрый экстрактор аудио с открытым исходным кодом . АКМ. стр. 1459–1462. дои : 10.1145/1873951.1874246 . ISBN  978-1-60558-933-6 – через Google Scholar.
  9. ^ Эйбен, Флориан; Вёльмер, Мартин; Шуллер, Бьёрн (26 апреля 2018 г.). «OpenEAR — представляем мюнхенский набор инструментов для распознавания эмоций и аффектов с открытым исходным кодом» . IEEE. стр. 1–6 – через Google Scholar.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1fd1cb0a14b40c4ba669a46af0d78811__1710996840
URL1:https://arc.ask3.ru/arc/aa/1f/11/1fd1cb0a14b40c4ba669a46af0d78811.html
Заголовок, (Title) документа по адресу, URL1:
OpenSMILE - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)