Jump to content

Распознавание эмоций в разговоре

Распознавание эмоций в разговоре ( ERC ) — это подобласть распознавания эмоций , которая фокусируется на изучении человеческих эмоций в разговорах или диалогах с двумя или более собеседниками . [1] Наборы данных в этой области обычно получаются с социальных платформ , которые предоставляют бесплатные и многочисленные образцы, часто содержащие мультимодальные данные (т. е. некоторую комбинацию текстовых, визуальных и акустических данных). [2] Личностное и межличностное влияние играют решающую роль. [3] в выявлении некоторых основных эмоций, таких как страх , гнев , радость, удивление и т. д. Чем более детальны ярлыки эмоций, тем труднее обнаружить правильную эмоцию. ERC ставит ряд проблем, [1] такие как моделирование разговорного контекста, моделирование состояния говорящего, присутствие сарказма в разговоре, сдвиг эмоций в последовательных высказываниях одного и того же собеседника .

Задача ERC заключается в обнаружении эмоций, выраженных говорящими в каждом высказывании разговора. ERC зависит от трех основных факторов – контекста разговора, психического состояния собеседников и намерений. [1]

Наборы данных

[ редактировать ]

ИЕМОКАП, [4] НЕДЕЛЯ, [5] Ежедневный Диалог, [6] и МЭЛД [7] — это четыре широко используемых набора данных в ERC. Среди этих четырех наборов данных MELD содержит многосторонние диалоги.

Подходы к ERC включают неконтролируемый , полунеконтролируемый и контролируемый подходы. [8] методы. Популярные контролируемые методы включают использование или объединение заранее определенных функций, рекуррентных нейронных сетей. [9] (ДиалогРНН [10] ), графические сверточные сети [11] (ДиалогGCN [12] ) и иерархическая сеть памяти, управляемая вниманием. [13] Большинство современных методов ERC основаны на глубоком обучении и идее моделирования скрытого состояния говорящего.

Распознавание причин эмоций в разговоре

[ редактировать ]

Недавно появилась новая подзадача ERC, направленная на распознавание причин эмоций в разговоре. [14] Методы решения этой задачи основаны на механизме ответов на вопросы на основе языковых моделей. РЕККОН [14] является одним из ключевых наборов данных для этой задачи.

См. также

[ редактировать ]
  1. ^ Jump up to: Перейти обратно: а б с Пория, Суджанья; Маджумдер, Навонил; Михалча, Рада; Хови, Эдуард (2019). «Распознавание эмоций в разговоре: проблемы исследования, наборы данных и последние достижения». Доступ IEEE . 7 : 100943–100953. arXiv : 1905.02947 . Бибкод : 2019arXiv190502947P . дои : 10.1109/ACCESS.2019.2929050 . S2CID   147703962 .
  2. ^ Ли, Чул Мин; Нарайанан, Шрикант (март 2005 г.). «На пути к распознаванию эмоций в разговорных диалогах». Транзакции IEEE по обработке речи и аудио . 13 (2): 293–303. дои : 10.1109/TSA.2004.838534 . S2CID   12710581 .
  3. ^ Хазарика, Деваманью; Пория, Суджанья; Циммерманн, Роджер; Михалча, Рада (октябрь 2019 г.). «Распознавание эмоций в разговорах с помощью трансферного обучения на основе генеративного моделирования разговоров». arXiv : 1910.04980 [ cs.CL ].
  4. ^ Буссо, Карлос; Булут, Муртаза; Ли, Чи-Чун; Каземзаде, Абэ; Мауэр, Эмили ; Ким, Сэмюэл; Чанг, Жаннетт Н.; Ли, Сунгбок; Нарайанан, Шрикант С. (5 ноября 2008 г.). «IEMOCAP: интерактивная база данных эмоционального диадного захвата движений». Языковые ресурсы и оценка . 42 (4): 335–359. дои : 10.1007/s10579-008-9076-6 . ISSN   1574-020X . S2CID   11820063 .
  5. ^ Маккеун, Г.; Валстар, М.; Коуи, Р.; Пантич, М.; Шредер, М. (2 января 2012 г.). «База данных SEMAINE: аннотированные мультимодальные записи эмоционально окрашенных разговоров между человеком и агентом с ограниченной ответственностью» . Транзакции IEEE для аффективных вычислений . 3 (1): 5–17. дои : 10.1109/t-affc.2011.20 . ISSN   1949-3045 . S2CID   2995377 .
  6. ^ Ли, Яньрань, Хуэй Су, Сяоюй Шен, Вэньцзе Ли, Цзыцян Цао и Шузи Ню. «DailyDialog: набор данных многоходового диалога, размеченный вручную». В материалах восьмой международной совместной конференции по обработке естественного языка (Том 1: Длинные статьи) , стр. 986-995. 2017.
  7. ^ Пория, Суджанья; Хазарика, Деваманью; Маджумдер, Навонил; Наик, Гаутама; Камбрия, Эрик; Михалча, Рада (2019). «MELD: мультимодальный многосторонний набор данных для распознавания эмоций в разговорах». Материалы 57-го ежегодного собрания Ассоциации компьютерной лингвистики . Страудсбург, Пенсильвания, США: Ассоциация компьютерной лингвистики: 527–536. arXiv : 1810.02508 . дои : 10.18653/v1/p19-1050 . S2CID   52932143 .
  8. ^ Абдельвахаб, Мохаммед; Буссо, Карлос (март 2005 г.). «Адаптация контролируемой области для распознавания эмоций по речи». Международная конференция IEEE по акустике, речи и обработке сигналов (ICASSP) , 2015 г. стр. 5058–5062. дои : 10.1109/ICASSP.2015.7178934 . ISBN  978-1-4673-6997-8 . S2CID   8207841 . {{cite book}}: |journal= игнорируется ( помогите )
  9. ^ Chernykh, Vladimir; Prikhodko, Pavel; King, Irwin (Jul 2019). "Emotion Recognition From Speech With Recurrent Neural Networks". arXiv : 1701.08071 [ cs.CL ].
  10. ^ Маджумдер, Навонил; Пория, Суджанья; Хазарика, Деваманью; Михалча, Рада; Гельбух, Александр; Камбрия, Эрик (17 июля 2019 г.). «DialogueRNN: Внимательная RNN для обнаружения эмоций в разговорах» . Материалы конференции AAAI по искусственному интеллекту . 33 : 6818–6825. arXiv : 1811.00405 . дои : 10.1609/aaai.v33i01.33016818 . ISSN   2374-3468 .
  11. ^ «Сверточные сети на графах приближают распознавание эмоций к машинам. Вот как» . Тех Таймс. 2019-11-26 . Проверено 25 февраля 2020 г.
  12. ^ Госал, Дипанвей; Маджумдер, Навонил; Суджанья, Пория (август 2019 г.). DialogueGCN: графовая сверточная нейронная сеть для распознавания эмоций в разговоре . Конференция по эмпирическим методам обработки естественного языка (EMNLP).
  13. ^ Цзяо, Вэньсян; Р. Лю, Майкл; Кинг, Ирвин (ноябрь 2019 г.). «Распознавание эмоций в реальном времени с помощью иерархической сети памяти, управляемой вниманием». arXiv : 1911.09075 [ cs.CL ].
  14. ^ Jump up to: Перейти обратно: а б Пория, Суджанья; Маджумдер, Навонил; Хазарика, Деваманью; Госал, Дипанвей; Бхардвадж, Ришаб; Цзянь, Самсон Ю Бай; Хун, Пэнфэй; Гош, Ромила; Рой, Абхинаба; Чхая, Нияти; Гельбух, Александр (13 сентября 2021 г.). «Распознавание причин эмоций в разговоре» . Когнитивные вычисления . 13 (5): 1317–1332. arXiv : 2012.11820 . дои : 10.1007/s12559-021-09925-7 . ISSN   1866-9964 . S2CID   229349214 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 40944b7152b847963fb8fc748ed46c65__1715070420
URL1:https://arc.ask3.ru/arc/aa/40/65/40944b7152b847963fb8fc748ed46c65.html
Заголовок, (Title) документа по адресу, URL1:
Emotion recognition in conversation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)