OpenSMILE

openSMILE
Разработчик(и)	аудЕЕРИНГ ГмбХ
Первоначальный выпуск	сентябрь 2010 г .; 13 лет назад
Стабильная версия	3.0.1 / 4 января 2022 г .; 2 года назад
Написано в	С++
Платформа	Linux , macOS , Windows , Android , iOS
Тип	Машинное обучение
Лицензия	Доступен исходный код , собственная собственность
Веб-сайт	audeering.com

openSMILE ^{[ 2 ]} — это доступное для источника программное обеспечение для автоматического извлечения характеристик из аудиосигналов и классификации речевых и музыкальных сигналов. «SMILE» означает «Интерпретация речи и музыки путем извлечения большого пространства». Программное обеспечение в основном применяется в области автоматического распознавания эмоций и широко используется в исследовательском сообществе аффективных вычислений . Проект openSMILE существует с 2008 года и поддерживается немецкой компанией audEERING GmbH с 2013 года. openSMILE предоставляется бесплатно для исследовательских целей и личного использования по лицензии, доступной в исходном коде. Для коммерческого использования инструмента компания audEERING предлагает специальные варианты лицензий.

Области применения

openSMILE используется для академических исследований, а также для коммерческих приложений для автоматического анализа речевых и музыкальных сигналов в режиме реального времени. В отличие от автоматического распознавания речи , которое извлекает речевой контент из речевого сигнала, openSMILE способен распознавать характеристики данного речевого или музыкального сегмента. говорящего Примерами таких характеристик, закодированных в человеческой речи, являются эмоции , ^{[ 3 ]} возраст, пол и личность, а также состояния говорящего, такие как депрессия , интоксикация или голосовые патологические расстройства. Программное обеспечение также включает в себя технологию классификации музыки для автоматического определения музыкального настроения и распознавания сегментов припева , тональности, аккордов , темпа, метра, танцевального стиля и жанра.

Набор инструментов openSMILE служит эталоном в многочисленных исследовательских конкурсах, таких как Interspeech ComParE, ^{[ 4 ]} С, ^{[ 5 ]} МедиаЭвал, ^{[ 6 ]} и ЭмотиВ. ^{[ 7 ]}

История

Проект openSMILE был начат в 2008 году Флорианом Эйбеном, Мартином Вёлльмером и Бьорном Шуллером в Мюнхенском техническом университете в рамках исследовательского проекта Европейского Союза SEMAINE. Целью проекта SEMAINE была разработка виртуального агента с эмоциональным и социальным интеллектом . В этой системе openSMILE применялся для анализа речи и эмоций в реальном времени. Последняя версия программного обеспечения SEMAINE основана на openSMILE версии 1.0.1.

В 2009 году на основе openSMILE был опубликован набор инструментов для распознавания эмоций (openEAR). «EAR» означает «Распознавание эмоций и аффектов».

В 2010 году была опубликована версия openSMILE 1.0.1, которая была представлена и награждена на конкурсе ACM Multimedia Open-Source Software Challenge.

В период с 2011 по 2013 год технология openSMILE была расширена и улучшена Флорианом Эйбеном и Феликсом Венингером в контексте их докторской диссертации в Техническом университете Мюнхена . Программное обеспечение также применялось для проекта ASC-Inclusion, который финансировался Европейским Союзом . Для этого проекта Эрик Марчи расширил программное обеспечение, чтобы научить детей с аутизмом выражать эмоции на основе автоматического распознавания и визуализации эмоций.

В 2013 году компания audEERING приобрела права на кодовую базу у Технического университета Мюнхена , и версия 2.0 была опубликована под лицензией на исследования с доступным исходным кодом.

До 2016 года openSMILE был загружен более 50 000 раз по всему миру и зарекомендовал себя как стандартный набор инструментов для распознавания эмоций.

Награды

openSMILE был награжден в 2010 году в рамках конкурса ACM Multimedia Open Source. Программный инструмент применяется в многочисленных научных публикациях по автоматическому распознаванию эмоций. openSMILE ^{[ 8 ]} и его расширение openEAR ^{[ 9 ]} до сегодняшнего дня цитировались более чем в 1000 научных публикациях.

Ссылки

^ «Выпуск openSMILE 3.0.1» . Проверено 5 января 2022 г.
^ Ф. Эйбен, М. Вёлльмер, Б. Шуллер: « openSMILE - мюнхенский универсальный и быстрый экстрактор аудио с открытым исходным кодом », в Proc. ACM Multimedia (MM), ACM, Флоренция, Италия, ACM, стр. 1459–1462, октябрь 2010 г.
^ Б. Шуллер, Б. Власенко, Ф. Эйбен, М. Вёлльмер, А. Штулзац, А. Вендемут, Г. Ригол, « Межкорпусное акустическое распознавание эмоций: варианты и стратегии (расширенное резюме) », в Proc. ACII 2015, Сиань, Китай, приглашен на специальную сессию, посвященную наиболее влиятельным статьям в области транзакций IEEE по аффективным вычислениям.
^ Б. Шуллер, С. Стейдл, А. Батлинер, Дж. Хиршберг, Дж. К. Бургун, А. Элкинс, Ю. Чжан, Э. Коутиньо: « Вызов вычислительной паралингвистики INTERSPEECH 2016: обман и искренность. Архивировано 9 июня 2017 г., The Wayback Machine », Proceedings INTERSPEECH 2016, ISCA, Сан-Франциско, США, 2016.
^ Ф. Рингеваль, Б. Шуллер, М. Валстар, Р. Коуи, М. Пантик, « AVEC 2015 — 5-й международный конкурс и семинар по аудио/визуальным эмоциям », в материалах 23-й Международной конференции ACM по мультимедиа, MM 2015, (Брисбен, Австралия), ACM, октябрь 2015 г.
^ М. Ескевич, Р. Али, Д. Ракка, Р. Ордельман, С. Чен, Г. Дж. Джонс, « Задача поиска и гиперссылок на MediaEval 2014 ».
^ Ф. Рингеваль, С. Амирипарян, Ф. Эйбен, К. Шерер, Б. Шуллер, « Распознавание эмоций в дикой природе: включение активности голоса и губ в мультимодальное слияние на уровне принятия решений », в материалах ICMI 2014 EmotiW - Emotion Recognition In The Wild Challenge and Workshop (EmotiW 2014), Сателлит 16-й Международной конференции ACM по мультимодальному взаимодействию (ICMI 2014), (Стамбул, Турция), стр. 473–480, ACM, ноябрь 2014 г.
^ Эйбен, Флориан; Вёльмер, Мартин; Шуллер, Бьёрн (26 апреля 2018 г.). Opensmile: мюнхенский универсальный и быстрый экстрактор аудио с открытым исходным кодом . АКМ. стр. 1459–1462. дои : 10.1145/1873951.1874246 . ISBN 978-1-60558-933-6 – через Google Scholar.
^ Эйбен, Флориан; Вёльмер, Мартин; Шуллер, Бьёрн (26 апреля 2018 г.). «OpenEAR — представляем мюнхенский набор инструментов для распознавания эмоций и аффектов с открытым исходным кодом» . IEEE. стр. 1–6 – через Google Scholar.

Внешние ссылки

[1] «Выпуск openSMILE 3.0.1» . Проверено 5 января 2022 г.

[2] Ф. Эйбен, М. Вёлльмер, Б. Шуллер: « openSMILE - мюнхенский универсальный и быстрый экстрактор аудио с открытым исходным кодом », в Proc. ACM Multimedia (MM), ACM, Флоренция, Италия, ACM, стр. 1459–1462, октябрь 2010 г.

[3] Б. Шуллер, Б. Власенко, Ф. Эйбен, М. Вёлльмер, А. Штулзац, А. Вендемут, Г. Ригол, « Межкорпусное акустическое распознавание эмоций: варианты и стратегии (расширенное резюме) », в Proc. ACII 2015, Сиань, Китай, приглашен на специальную сессию, посвященную наиболее влиятельным статьям в области транзакций IEEE по аффективным вычислениям.

[4] Б. Шуллер, С. Стейдл, А. Батлинер, Дж. Хиршберг, Дж. К. Бургун, А. Элкинс, Ю. Чжан, Э. Коутиньо: « Вызов вычислительной паралингвистики INTERSPEECH 2016: обман и искренность. Архивировано 9 июня 2017 г., The Wayback Machine », Proceedings INTERSPEECH 2016, ISCA, Сан-Франциско, США, 2016.

[5] Ф. Рингеваль, Б. Шуллер, М. Валстар, Р. Коуи, М. Пантик, « AVEC 2015 — 5-й международный конкурс и семинар по аудио/визуальным эмоциям », в материалах 23-й Международной конференции ACM по мультимедиа, MM 2015, (Брисбен, Австралия), ACM, октябрь 2015 г.

[6] М. Ескевич, Р. Али, Д. Ракка, Р. Ордельман, С. Чен, Г. Дж. Джонс, « Задача поиска и гиперссылок на MediaEval 2014 ».

[7] Ф. Рингеваль, С. Амирипарян, Ф. Эйбен, К. Шерер, Б. Шуллер, « Распознавание эмоций в дикой природе: включение активности голоса и губ в мультимодальное слияние на уровне принятия решений », в материалах ICMI 2014 EmotiW - Emotion Recognition In The Wild Challenge and Workshop (EmotiW 2014), Сателлит 16-й Международной конференции ACM по мультимодальному взаимодействию (ICMI 2014), (Стамбул, Турция), стр. 473–480, ACM, ноябрь 2014 г.

[8] Эйбен, Флориан; Вёльмер, Мартин; Шуллер, Бьёрн (26 апреля 2018 г.). Opensmile: мюнхенский универсальный и быстрый экстрактор аудио с открытым исходным кодом . АКМ. стр. 1459–1462. дои : 10.1145/1873951.1874246 . ISBN 978-1-60558-933-6 – через Google Scholar.

[9] Эйбен, Флориан; Вёльмер, Мартин; Шуллер, Бьёрн (26 апреля 2018 г.). «OpenEAR — представляем мюнхенский набор инструментов для распознавания эмоций и аффектов с открытым исходным кодом» . IEEE. стр. 1–6 – через Google Scholar.

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]