Анализ настроений
Анализ настроений (также известный как интеллектуальный анализ мнений или искусственный интеллект эмоций ) — это использование обработки естественного языка , анализа текста , компьютерной лингвистики и биометрии для систематической идентификации, извлечения, количественной оценки и изучения аффективных состояний и субъективной информации. Анализ настроений широко применяется для анализа материалов клиентов, таких как обзоры и ответы на опросы, онлайн- и социальные сети, а также материалов о здравоохранении для приложений, которые варьируются от маркетинга до обслуживания клиентов и клинической медицины. С появлением моделей глубокого языка, таких как RoBERTa , можно анализировать и более сложные области данных, например, тексты новостей, где авторы обычно выражают свое мнение/чувства менее явно. [1]
Простые случаи [ править ]
- У Coronet лучшие линии среди дневных круизеров.
- Бертрам имеет глубокий V-образный корпус и легко плавает по морям.
- Дневные круизеры 1980-х годов из Флориды в пастельных тонах выглядят уродливо.
- Я не люблю старые круизеры с каютами .
Более сложные примеры [ править ]
- Я не люблю круизеры с каютами. ( Обработка отрицания )
- Нелюбовь к водному транспорту — это не мое. (Отрицание, обратный порядок слов )
- Иногда я действительно ненавижу РИБы . ( Наречие изменяет настроение)
- Мне бы очень хотелось погулять в такую погоду! (Возможно, с сарказмом )
- Крис Крафт выглядит лучше, чем Лаймстоун. (Два торговых знака , определить цель отношения сложно)
- Chris Craft выглядит лучше, чем Limestone, но Limestone демонстрирует мореходные качества и надежность. (Два подхода, два бренда)
- Фильм неожиданный, с множеством тревожных поворотов сюжета. (Отрицательный термин, используемый в положительном смысле в определенных областях)
- Вы должны увидеть их декадентское десертное меню. (Установочный термин в последнее время изменил полярность в некоторых областях)
- Мне нравится мой мобильный телефон, но я бы не рекомендовал его никому из своих коллег. (Оговоренное положительное настроение, которое трудно классифицировать)
- Концерт на следующей неделе будет прямо koide9! («Quoi de neuf?», по-французски «что нового?». Недавно созданные термины могут быть очень установочными, но изменчивыми по полярности и часто выходят за рамки известного словаря.)
Типы [ править ]
Основная задача анализа настроений - классифицировать полярность данного текста на уровне документа, предложения или функции/аспекта - является ли выраженное мнение в документе, предложении или функции/аспекте объекта положительным, отрицательным или нейтральным. Усовершенствованная классификация чувств «за пределами полярности» рассматривает, например, эмоциональные состояния, такие как удовольствие, гнев, отвращение, печаль, страх и удивление. [2]
Предшественниками сентиментального анализа являются General Inquirer, [3] человека которые дали подсказки для количественной оценки закономерностей в тексте и, отдельно, психологические исследования, в которых изучалось психологическое состояние на основе анализа его речевого поведения. [4]
Впоследствии метод описан в патенте Вулкани и Фогеля. [5] специально рассматривал настроения и идентифицировал отдельные слова и фразы в тексте по разным эмоциональным шкалам. Современная система, основанная на их работе, под названием EffectCheck, представляет синонимы, которые можно использовать для увеличения или уменьшения уровня вызванных эмоций по каждой шкале.
Многие другие последующие попытки были менее изощренными, в них использовался просто полярный взгляд на чувства, от позитивного к негативному, например, работы Тёрни, [6] и Панг [7] которые применили разные методы для выявления полярности обзоров продуктов и обзоров фильмов соответственно. Эта работа ведется на уровне документа. Можно также классифицировать полярность документа по многофакторной шкале, что и предпринял Панг. [8] и Снайдер [9] среди других: Панг и Ли [8] расширил основную задачу классификации рецензии на фильм как положительную или отрицательную, чтобы предсказать звездный рейтинг по 3- или 4-звездочной шкале, в то время как Снайдер [9] провели углубленный анализ отзывов о ресторанах, прогнозируя рейтинги различных аспектов данного ресторана, таких как еда и атмосфера (по пятизвездочной шкале).
Первые шаги по объединению различных подходов — обучения, лексики, знаний и т. д. — были сделаны на весеннем симпозиуме AAAI 2004 года , где лингвисты, компьютерщики и другие заинтересованные исследователи впервые согласовали интересы и предложили общие задачи и наборы эталонных данных для систематические вычислительные исследования аффекта, привлекательности, субъективности и настроений в тексте. [10]
Несмотря на то, что в большинстве методов статистической классификации нейтральный класс игнорируется, исходя из предположения, что нейтральные тексты лежат вблизи границы бинарного классификатора, некоторые исследователи предполагают, что, как и в каждой проблеме полярности, необходимо идентифицировать три категории. Более того, можно доказать, что конкретные классификаторы, такие как максимальная энтропия, [11] и SVM [12] может выиграть от введения нейтрального класса и повысить общую точность классификации. В принципе есть два способа работы с нейтральным классом. Либо алгоритм сначала идентифицирует нейтральный язык, фильтрует его, а затем оценивает остальные с точки зрения положительных и отрицательных настроений, либо строит трехстороннюю классификацию за один шаг. [13] Этот второй подход часто включает оценку распределения вероятностей по всем категориям (например, наивные классификаторы Байеса , реализованные NLTK ). Как использовать нейтральный класс, зависит от характера данных: если данные четко сгруппированы в нейтральные, негативные и позитивные выражения, имеет смысл отфильтровать нейтральные выражения и сосредоточиться на полярности между позитивными и негативными настроениями. Если, напротив, данные в основном нейтральны с небольшими отклонениями в сторону положительного и отрицательного воздействия, эта стратегия затруднит четкое различие между двумя полюсами.
Другой метод определения настроений - это использование системы шкалы, при которой словам, которые обычно ассоциируются с отрицательными, нейтральными или положительными настроениями, присваивается соответствующее число по шкале от -10 до +10 (от самого отрицательного до самого положительного). или просто от 0 до положительного верхнего предела, например +4. Это позволяет корректировать тональность данного термина относительно его окружения (обычно на уровне предложения). Когда фрагмент неструктурированного текста анализируется с использованием обработки естественного языка , каждому понятию в указанной среде присваивается оценка, основанная на том, как слова, выражающие эмоциональную окраску, соотносятся с понятием и связанной с ним оценкой. [14] [15] Это позволяет перейти к более сложному пониманию настроений, поскольку теперь можно корректировать значение настроения концепции относительно модификаций, которые могут ее окружать. Например, слова, которые усиливают, ослабляют или сводят на нет чувство, выражаемое концепцией, могут повлиять на ее оценку. В качестве альтернативы текстам можно присвоить положительную и отрицательную оценку силы настроения, если цель состоит в том, чтобы определить настроение в тексте, а не общую полярность и силу текста. [16]
Существуют и другие типы анализа настроений, такие как анализ настроений на основе аспектов, анализ настроений по шкале (положительные, отрицательные, нейтральные), многоязычный анализ настроений и обнаружение эмоций.
Идентификация субъективности/объективности [ править ]
Эту задачу обычно определяют как отнесение данного текста (обычно предложения) к одному из двух классов: объективному или субъективному. [17] Эта проблема иногда может быть более сложной, чем классификация полярностей. [18] Субъективность слов и фраз может зависеть от их контекста, а объективный документ может содержать субъективные предложения (например, новостная статья, цитирующая мнения людей). Более того, как упомянул Су, [19] результаты во многом зависят от определения субъективности, используемого при аннотировании текстов. Однако Панг [20] показали, что удаление объективных предложений из документа перед классификацией его полярности помогает повысить производительность.
Субъективная и объективная идентификация, новые подзадачи анализа настроений для использования синтаксических, семантических особенностей и знаний машинного обучения для определения того, содержит ли предложение или документ факты или мнения. Осознание необходимости распознавания фактов и мнений появилось не недавно: возможно, впервые оно было представлено Карбонеллом в Йельском университете в 1979 году. [ объяснить ]
Термин «цель» относится к инциденту, несущему фактическую информацию. [21]
- Пример объективного предложения: «Чтобы быть избранным президентом Соединенных Штатов, кандидату должно быть не менее тридцати пяти лет».
Термин «субъективный» описывает инцидент, содержащий нефактическую информацию в различных формах, таких как личное мнение, суждение и прогнозы, также известные как «частные состояния». [22] В приведенном ниже примере это отражает частное государство «Мы, американцы». Более того, целевой объект, комментируемый мнениями, может принимать различные формы: от материального продукта до нематериальных тем, указанных в Liu (2010). [23] Кроме того, Лю (2010) наблюдал три типа отношения: 1) положительные мнения, 2) нейтральные мнения и 3) отрицательные мнения. [23]
- Пример субъективного предложения: «Мы, американцы, должны избрать зрелого президента, способного принимать мудрые решения».
Этот анализ представляет собой проблему классификации. [24]
Коллекции слов или индикаторов фраз каждого класса определены для поиска желаемых шаблонов в неаннотированном тексте. Для субъективного выражения был создан другой список слов. Списки субъективных показателей в словах или фразах были разработаны многими исследователями в области лингвистики и обработки естественного языка в Riloff et al. (2003). [25] Для измерения заданных выражений необходимо создать словарь правил извлечения. С годами, в субъективном обнаружении, извлечение функций прогрессировало от ручного управления функциями до автоматического изучения функций. На данный момент методы автоматизированного обучения можно разделить на контролируемое и неконтролируемое машинное обучение . Извлечение шаблонов с помощью процесса машинного обучения, аннотированного и неаннотированного текста, широко изучалось академическими исследователями.
Тем не менее, исследователи признали несколько проблем в разработке фиксированных наборов правил для респектабельных выражений. Большая часть проблем при разработке правил связана с природой текстовой информации. Несколько исследователей признали шесть проблем: 1) метафорические выражения, 2) несоответствия в написании, 3) контекстно-зависимые, 4) представленные слова с меньшим употреблением, 5) чувствительные ко времени и 6) постоянно растущий объем.
- Метафорические выражения. Текст содержит метафорические выражения, которые могут повлиять на результативность извлечения. [26] Кроме того, метафоры принимают разные формы, что, возможно, способствовало увеличению раскрываемости.
- Расхождения в сочинениях. Для текста, полученного из Интернета, расхождения в стиле написания целевых текстовых данных связаны с разными жанрами и стилями письма.
- Контекстно-зависимый. Классификация может варьироваться в зависимости от субъективности или объективности предыдущих и последующих предложений. [24]
- Атрибут, чувствительный ко времени. Задача усложняется из-за того, что некоторые текстовые данные чувствительны к времени. Если группа исследователей хочет подтвердить какой-либо факт в новостях, им потребуется больше времени для перекрестной проверки, чем новости устареют.
- Ключевые слова с меньшим количеством употреблений.
- Постоянно растущий объем. Задача также усложняется огромным объемом текстовых данных. Постоянно растущий характер текстовых данных чрезвычайно затрудняет исследователям выполнение задачи вовремя.
Ранее исследования в основном были сосредоточены на классификации на уровне документов. Однако классификация уровня документа страдает меньшей точностью, поскольку в статье могут использоваться различные типы выражений. Данные исследования показывают, что в ряде новостных статей, как ожидается, будет доминировать объективное выражение, тогда как результаты показывают, что он состоит более чем на 40% из субъективного выражения. [21]
Чтобы преодолеть эти проблемы, исследователи приходят к выводу, что эффективность классификатора зависит от точности изучаемых шаблонов. А учащиеся, получающие большие объемы аннотированных обучающих данных, превосходили тех, кто обучался менее полным субъективным характеристикам. Однако одним из основных препятствий для выполнения этого типа работы является ручное создание большого набора данных аннотированных предложений. Метод ручного аннотирования пользуется меньшим предпочтением, чем автоматическое обучение, по трем причинам:
- Различия в понимании. При выполнении задачи аннотации вручную среди аннотаторов могут возникнуть разногласия по поводу того, является ли один экземпляр субъективным или объективным из-за двусмысленности языков.
- Человеческие ошибки. Задача ручного аннотирования — это кропотливое задание, для выполнения которого требуется напряженная концентрация.
- Кропотливый. Задача ручного аннотирования — кропотливая работа. Рилофф (1996) показал, что на обработку 160 текстов одному аннотатору уходит 8 часов. [27]
Все эти упомянутые причины могут повлиять на эффективность и результативность субъективной и объективной классификации. Соответственно, были разработаны два метода начальной загрузки для изучения лингвистических шаблонов на основе неаннотированных текстовых данных. Оба метода начинаются с нескольких исходных слов и неаннотированных текстовых данных.
- Мета-бутстреп, разработанный Рилоффом и Джонсом в 1999 году. [28] Уровень первый: создание шаблонов извлечения на основе заранее определенных правил и извлеченных шаблонов по количеству исходных слов, которые содержит каждый шаблон. Уровень второй: 5 лучших слов будут отмечены и добавлены в словарь. Повторить.
- Василиск ( самонастраивающийся подход к и семантической . лексики индукции Рилофф с использованием знаний ) семантических Телен [29] Шаг первый: Создайте шаблоны извлечения. Шаг второй: переместите лучшие шаблоны из пула шаблонов в пул слов-кандидатов. Шаг третий: 10 лучших слов будут отмечены и добавлены в словарь. Повторить.
В целом, эти алгоритмы подчеркивают необходимость автоматического распознавания и извлечения образов в субъективных и объективных задачах.
Субъективный и объектный классификаторы могут улучшить некоторые приложения обработки естественного языка. Одним из основных преимуществ классификатора является то, что он популяризирует практику процессов принятия решений на основе данных в различных отраслях. По словам Лю, применение субъективной и объективной идентификации реализовано в бизнесе, рекламе, спорте и социальных науках. [30]
- Классификация онлайн-обзоров. В бизнес-индустрии классификатор помогает компании лучше понять отзывы о продукте и причины, лежащие в основе обзоров.
- Прогнозирование цен на акции. В финансовой отрасли классификатор помогает модели прогнозирования, обрабатывая вспомогательную информацию из социальных сетей и другую текстовую информацию из Интернета. Предыдущие исследования цен на японские акции, проведенные Dong et al. указывает на то, что модели с субъективным и объективным модулем могут работать лучше, чем модели без этой части. [31]
- Анализ социальных сетей.
- Классификация отзывов студентов. [32]
- Обобщение документов: классификатор может извлекать целевые комментарии и собирать мнения, высказанные одним конкретным объектом.
- Ответ на сложный вопрос. Классификатор может анализировать сложные вопросы, классифицируя языковой предмет или объективную и целенаправленную цель. В исследовании Ю и др. (2003) исследователь разработал предложение и уровень документа, сгруппировав их, тождественные части мнения. [33]
- Приложения, специфичные для предметной области.
- Анализ электронной почты. Субъективный и объективный классификатор обнаруживает спам, отслеживая языковые шаблоны целевых слов.
На основе функций/аспектов [ изменить ]
Это относится к определению мнений или настроений, выраженных в отношении различных характеристик или аспектов объектов, например сотового телефона, цифровой камеры или банка. [34] Особенность или аспект — это атрибут или компонент объекта, например, экрана сотового телефона, сервиса в ресторане или качества изображения камеры. Преимущество анализа настроений на основе признаков заключается в возможности улавливать нюансы интересующих объектов. Различные функции могут вызывать разные реакции настроения, например, отель может иметь удобное расположение, но посредственную еду. [35] Эта проблема включает в себя несколько подзадач, например, идентификация соответствующих объектов, извлечение их особенностей/аспектов и определение того, является ли мнение, выраженное по каждой функции/аспекту, положительным, отрицательным или нейтральным. [36] Автоматическое выявление признаков может осуществляться синтаксическими методами, с помощью тематического моделирования , [37] [38] или с глубоким обучением . [39] [40] Более подробное обсуждение этого уровня анализа настроений можно найти в работе Лю. [23]
Рейтинг интенсивности [ править ]
Эмоции и чувства субъективны по своей природе. Степень . эмоций/чувств, выраженных в данном тексте на уровне документа, предложения или функции/аспекта — степень интенсивности, выраженная по мнению документа, предложения или объекта, различается в каждом конкретном случае основе. [41] Однако предсказание только эмоций и настроений не всегда дает полную информацию. Степень или уровень эмоций и чувств часто играет решающую роль в понимании конкретного чувства в пределах одного класса (например, «хорошо» или «потрясающе»). Некоторые методы используют составного ансамбля . метод [42] для прогнозирования интенсивности эмоций и настроений путем объединения полученных результатов и использования моделей глубокого обучения на основе сверточных нейронных сетей , [43] сети с длинной кратковременной памятью и закрытые рекуррентные единицы . [44]
Методы и возможности [ править ]
Существующие подходы к анализу настроений можно сгруппировать в три основные категории: методы, основанные на знаниях, статистические методы и гибридные подходы. [45] Методы, основанные на знаниях, классифицируют текст по категориям аффектов на основе наличия однозначных аффектных слов, таких как счастье, грусть, страх и скука. [46] Некоторые базы знаний не только перечисляют очевидные слова, влияющие на эмоции, но также приписывают произвольным словам возможную «близость» к конкретным эмоциям. [47] Статистические методы используют элементы машинного обучения, такие как скрытый семантический анализ , машины опорных векторов , « мешок слов », « точечная взаимная информация » для семантической ориентации. [6] модели семантического пространства или встраивания слов , модели [48] и глубокое обучение . Более сложные методы пытаются обнаружить носителя настроения (т. е. человека, который поддерживает это аффективное состояние) и цель (т. е. сущность, в отношении которой ощущается аффект). [49] Чтобы уловить мнение в контексте и получить особенность, о которой высказал мнение говорящий, используются грамматические связи слов. Отношения грамматической зависимости получаются путем глубокого разбора текста. [50] Гибридные подходы используют как машинное обучение, так и элементы представления знаний, такие как онтологии и семантические сети, для обнаружения семантики, которая выражена тонким способом, например, посредством анализа концепций, которые не передают соответствующую информацию явно, но которые неявно связаны. к другим концепциям, которые делают это. [51]
Программные инструменты с открытым исходным кодом, а также ряд бесплатных и платных инструментов анализа настроений используют методы машинного обучения , статистики и обработки естественного языка для автоматизации анализа настроений в больших коллекциях текстов, включая веб-страницы, онлайн-новости, интернет-дискуссионные группы, онлайн-обзоры, веб-блоги и социальные сети. [52] С другой стороны, системы, основанные на знаниях, используют общедоступные ресурсы для извлечения семантической и аффективной информации, связанной с концепциями естественного языка. Система может помочь в реализации аффективных рассуждений, основанных на здравом смысле . [53] Анализ тональности также можно выполнять на визуальном контенте, т. е. изображениях и видео (см. Мультимодальный анализ тональности ). Одним из первых подходов в этом направлении является SentiBank. [54] использование пары прилагательных-существительных для представления визуального контента. Кроме того, подавляющее большинство подходов к классификации настроений основано на модели «мешка слов», которая игнорирует контекст, грамматику и даже порядок слов . Подходы, которые анализируют настроения на основе того, как слова составляют значение более длинных фраз, показали лучшие результаты. [55] но они влекут за собой дополнительные накладные расходы на аннотации.
При анализе настроений необходим компонент человеческого анализа, поскольку автоматизированные системы не способны анализировать исторические тенденции отдельного комментатора или платформы и часто неправильно классифицируются по выраженным ими настроениям. Автоматизация влияет примерно на 23% комментариев, которые правильно классифицируются людьми. [56] Однако люди часто не соглашаются, и утверждается, что соглашение между людьми обеспечивает верхнюю границу, которой в конечном итоге могут достичь автоматизированные классификаторы настроений. [57]
Оценка [ править ]
Точность системы анализа настроений, в принципе, определяется тем, насколько хорошо она согласуется с человеческими суждениями. Обычно это измеряется различными показателями, основанными на точности и запоминаемости двух целевых категорий негативных и позитивных текстов. Однако, согласно исследованиям, оценщики обычно соглашаются только примерно с 80% [58] того времени (см. Межоценочная надежность ). Таким образом, программа, которая достигает 70% точности в классификации настроений, работает почти так же хорошо, как люди, хотя такая точность может показаться не впечатляющей. Если бы программа была «правильной» в 100% случаев, люди все равно не соглашались бы с ней примерно в 20% случаев, поскольку они не согласны с любым ответом. [ нужна ссылка ]
С другой стороны, компьютерные системы допускают совсем другие ошибки, чем люди-оценщики, поэтому цифры не совсем сопоставимы. Например, у компьютерной системы будут проблемы с отрицаниями, преувеличениями, шутками или сарказмом, с которыми обычно легко справиться читателю: некоторые ошибки, которые допускает компьютерная система, покажутся человеку слишком наивными. В целом полезность анализа настроений для практических коммерческих задач, как он определен в академических исследованиях, была поставлена под сомнение, главным образом потому, что простая одномерная модель настроения от негативного к позитивному дает довольно мало полезной информации для клиента, беспокоящегося о влияние общественного дискурса, например, на репутацию бренда или компании. [59] [60] [61]
Чтобы лучше соответствовать потребностям рынка, оценка анализа настроений перешла к более целенаправленным измерениям, сформулированным совместно с представителями PR-агентств и специалистами по исследованию рынка. Например, в наборе оценочных данных RepLab основное внимание уделяется не содержанию рассматриваемого текста, а влиянию рассматриваемого текста на репутацию бренда . [62] [63] [64]
Поскольку оценка анализа настроений становится все более и более основанной на задачах, для каждой реализации требуется отдельная модель обучения, чтобы получить более точное представление настроений для данного набора данных.
Веб 2.0 [ править ]
Рост социальных сетей, таких как блоги и социальные сети, подогрел интерес к анализу настроений. С распространением обзоров, рейтингов, рекомендаций и других форм онлайн-выражения онлайн-мнение превратилось в своего рода виртуальную валюту для компаний, стремящихся продвигать свою продукцию, выявлять новые возможности и управлять своей репутацией. Поскольку компании стремятся автоматизировать процесс фильтрации шума, понимания разговоров, определения релевантного контента и принятия соответствующих мер, многие теперь обращают внимание на область анализа настроений. [65] Ситуация еще больше усложняется ростом анонимных социальных сетей, таких как 4chan и Reddit . [66] Если веб 2.0 был направлен на демократизацию публикации, то следующий этап развития Интернета вполне может быть основан на демократизации интеллектуального анализа данных всего публикуемого контента. [67]
Один шаг к этой цели делается в исследованиях. Несколько исследовательских групп в университетах по всему миру в настоящее время сосредоточены на понимании динамики настроений в электронных сообществах посредством анализа настроений. [68]
Проблема в том, что большинство алгоритмов анализа настроений используют простые термины для выражения настроений по поводу продукта или услуги. Однако культурные факторы, лингвистические нюансы и различные контексты чрезвычайно затрудняют превращение строки письменного текста в простое высказывание «за» или «против». [65] Тот факт, что люди часто расходятся во мнениях по поводу содержания текста, показывает, насколько трудной задачей для компьютеров является правильное понимание этого вопроса. Чем короче строка текста, тем сложнее она становится.
Несмотря на то, что короткие текстовые строки могут быть проблемой, анализ настроений в рамках микроблогов показал, что Twitter можно рассматривать как надежный онлайн-индикатор политических настроений. Политические настроения в твитах демонстрируют близкое соответствие политическим позициям партий и политиков, что указывает на то, что содержание сообщений в Твиттере правдоподобно отражает офлайновый политический ландшафт. [69] анализ настроений в Твиттере отражает общественные настроения, лежащие в основе циклов воспроизводства человека во всем мире. Кроме того, было показано, что [70] а также другие проблемы общественного здравоохранения, такие как побочные реакции на лекарства. [71]
Хотя анализ настроений был популярен в областях, где авторы выражают свое мнение довольно явно («фильм потрясающий»), таких как социальные сети и обзоры продуктов, только недавно были разработаны надежные методы для других областей, где настроения сильно неявны или косвенны. Например, в новостных статьях - в основном из-за ожидаемой журналистской объективности - журналисты часто описывают действия или события, а не прямо заявляют о полярности той или иной информации. Более ранние подходы с использованием словарей или поверхностных функций машинного обучения не могли уловить «смысл между строк», но недавно исследователи предложили подход, основанный на глубоком обучении, и набор данных, который способен анализировать настроения в новостных статьях. [1]
Ученые использовали анализ настроений для анализа твитов о здоровье и безопасности строительства (теперь они называются X). Исследование показало, что существует положительная корреляция между избранным и ретвитами с точки зрения валентности настроений. Другие исследовали влияние YouTube на распространение знаний в области охраны труда и техники безопасности в строительстве. С помощью семантического анализа они исследовали, как эмоции влияют на поведение пользователей при просмотре и комментировании. В другом исследовании позитивные настроения составили подавляющую цифру в 85% при обмене знаниями о безопасности и гигиене строительства через Instagram. [72]
Применение в рекомендательных системах [ править ]
Для рекомендательной системы анализ настроений оказался ценным методом. Цель рекомендательной системы — предсказать предпочтение элемента целевого пользователя. Основные рекомендательные системы работают с явным набором данных. Например, совместная фильтрация работает с матрицей рейтингов, а фильтрация на основе контента — с метаданными элементов.
Во многих социальных сетях или на веб-сайтах электронной коммерции пользователи могут оставлять текстовые обзоры, комментарии или отзывы о товарах. Этот генерируемый пользователем текст представляет собой богатый источник мнений пользователей о многочисленных продуктах и предметах. Потенциально для элемента такой текст может раскрывать как связанную функцию/аспекты элемента, так и мнение пользователей по поводу каждой функции. [73] Характеристики/аспекты элемента, описанные в тексте, играют ту же роль, что и метаданные при контентной фильтрации , но первые более ценны для рекомендательной системы. Поскольку эти функции широко упоминаются пользователями в своих обзорах, их можно рассматривать как наиболее важные функции, которые могут существенно повлиять на взаимодействие пользователя с элементом, в то время как метаданные элемента (обычно предоставляемые производителями, а не потребителями) может игнорировать функции, которые интересуют пользователей. К различным элементам с общими характеристиками пользователь может относиться по-разному. Кроме того, функция одного и того же элемента может вызывать разные мнения у разных пользователей. Мнения пользователей по поводу функций можно рассматривать как многомерный рейтинг, отражающий их предпочтения в отношении элементов.
На основе особенностей/аспектов и настроений, извлеченных из пользовательского текста, можно построить гибридную рекомендательную систему. [74] Существует два типа мотивации рекомендовать пользователю элемент-кандидат. Первая мотивация заключается в том, что элемент-кандидат имеет множество общих черт с элементами, предпочитаемыми пользователем. [75] в то время как вторая мотивация заключается в том, что элемент-кандидат получает высокую оценку своих характеристик. В случае предпочтительного предмета разумно полагать, что предметы с одинаковыми характеристиками будут иметь аналогичную функцию или полезность. Таким образом, эти элементы также, скорее всего, будут предпочтительнее пользователем. С другой стороны, что касается общей функции двух элементов-кандидатов, другие пользователи могут положительно относиться к одному из них и отрицательно относиться к другому. Очевидно, что продукт с высокой оценкой должен быть рекомендован пользователю. На основе этих двух мотиваций для каждого кандидата можно построить комбинацию рейтинговых оценок сходства и рейтинга настроений. [74]
Помимо сложности самого анализа настроений, применение анализа настроений к отзывам или отзывам также сталкивается с проблемой спама и предвзятых отзывов. Одно направление работы сосредоточено на оценке полезности каждого обзора. [76] Плохо написанный обзор или обратная связь вряд ли полезны для рекомендательной системы. Кроме того, отзыв может быть составлен таким образом, чтобы препятствовать продажам целевого продукта и тем самым нанести вред рекомендательной системе, даже если он хорошо написан.
Исследователи также обнаружили, что к длинным и коротким формам пользовательского текста следует относиться по-разному. Интересный результат показывает, что краткие обзоры иногда более полезны, чем развернутые. [77] потому что в коротком тексте легче отфильтровать шум. Для длинного текста растущая длина текста не всегда приводит к пропорциональному увеличению количества особенностей или настроений в тексте.
Ламба и Мадхусудхан [78] представить зарождающийся способ удовлетворения информационных потребностей сегодняшних пользователей библиотеки путем переупаковки результатов анализа настроений социальных сетей, таких как Twitter, и предоставления их в виде консолидированного сервиса, основанного на времени, в различных форматах. Кроме того, они предлагают новый способ проведения маркетинга в библиотеках, используя анализ социальных сетей и анализ настроений.
См. также [ править ]
- Аффективные вычисления
- Потребительские настроения
- Распознавание эмоций
- Дружественный искусственный интеллект
- Межличностная точность
- Мультимодальный анализ настроений
- Стилометрия
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б Хамборг, Феликс; Донней, Карстен (2021). «NewsMTSC: набор данных для (много)целевой классификации настроений в статьях политических новостей» . «Материалы 16-й конференции Европейского отделения Ассоциации компьютерной лингвистики: основной том»
- ^ Вонг Ань Хо, Дуонг Хуинь-Конг Нгуен, Дан Хоанг Нгуен, Линь Тхи-Ван Фам, Дык-Ву Нгуен, Киет Ван Нгуен, Нган Луу-Туи Нгуен. «Распознавание эмоцийдля вьетнамского текста в социальных сетях». В материалах Международной конференции Тихоокеанской ассоциации компьютерной лингвистики 2019 г. (PACLING 2019), Ханой, Вьетнам (2019).
- ^ Стоун, Филип Дж., Декстер К. Данфи и Маршалл С. Смит. «Общий исследователь: компьютерный подход к контент-анализу». MIT Press, Кембридж, Массачусетс (1966).
- ^ Готшальк, Луи Огюст и Голдин К. Глезер . Измерение психологических состояний посредством контент-анализа речевого поведения. Университет Калифорнии Пресс, 1969.
- ^ США Выпущено 7 136 877 , Вулкани, Янон; И Фогель, Дэвид Б., «Система и метод определения и контроля воздействия текста», опубликовано 28 июня 2001 г.
- ^ Jump up to: Перейти обратно: а б Терни, Питер (2002). «Большой палец вверх или большой палец вниз? Семантическая ориентация применительно к неконтролируемой классификации обзоров». Труды Ассоциации компьютерной лингвистики . стр. 417–424. arXiv : cs.LG/0212032 .
- ^ Панг, Бо; Ли, Лилиан ; Вайтьянатан, Шивакумар (2002). «Большой палец вверх? Классификация настроений с использованием методов машинного обучения» . Материалы конференции по эмпирическим методам обработки естественного языка (EMNLP) . стр. 79–86.
- ^ Jump up to: Перейти обратно: а б Панг, Бо; Ли, Лилиан (2005). «Видеть звезды: использование классовых отношений для категоризации настроений в соответствии с рейтинговыми шкалами» . Труды Ассоциации компьютерной лингвистики (ACL) . стр. 115–124.
- ^ Jump up to: Перейти обратно: а б Снайдер, Бенджамин; Барзилай, Регина (2007). «Множественное ранжирование с использованием алгоритма Good Grief» . Труды совместной технологии человеческого языка/Североамериканского отделения конференции ACL (HLT-NAACL) . стр. 300–307. Архивировано из оригинала 6 августа 2016 года . Проверено 16 июня 2009 г.
- ^ Цюй, Ян, Джеймс Шанахан и Дженис Вибе . «Изучение отношения и аффекта в тексте: теории и приложения». На весеннем симпозиуме AAAI, технический отчет SS-04-07. AAAI Press, Менло-Парк, Калифорния. 2004.
- ^ Вриниотис, Василис (2013). Важность нейтрального класса в анализе настроений .
- ^ Коппель, Моше; Шлер, Джонатан (2006). «Важность нейтральных примеров для изучения настроений». Вычислительный интеллект 22 . стр. 100–109. CiteSeerX 10.1.1.84.9735 .
- ^ Рибейро, Филипе Нуньес; Араужо, Матеус (2010). «Эталонное сравнение современных методов анализа настроений» . Транзакции по встроенным вычислительным системам . 9 (4).
- ^ Табоада, Майте; Брук, Джулиан (2011). «Лексиконные методы анализа настроений» . Компьютерная лингвистика . 37 (2): 272–274. CiteSeerX 10.1.1.188.5517 . дои : 10.1162/coli_a_00049 . S2CID 3181362 .
- ^ Августыняк, Лукаш; Шиманский, Петр; Кайданович, Томаш; Тулиглович, Влодзимеж (25 декабря 2015 г.). «Комплексное исследование анализа тональности ансамблевой классификации на основе лексикона» . Энтропия . 18 (1): 4. Бибкод : 2015Entrp..18....4A . дои : 10.3390/e18010004 .
- ^ Телвалл, Майк; Бакли, Киван; Палтоглу, Георгиос; Кай, Ди; Каппас, Арвид (2010). «Определение силы чувств в коротком неофициальном тексте» . Журнал Американского общества информатики и технологий . 61 (12): 2544–2558. CiteSeerX 10.1.1.278.3863 . дои : 10.1002/asi.21416 .
- ^ Панг, Бо; Ли, Лилиан (2008). «4.1.2 Обнаружение субъективности и идентификация мнений» . Анализ мнений и настроений . Теперь Паблишерс Инк.
- ^ Михалча, Рада; Банеа, Кармен; Вибе, Дженис (2007). «Изучение многоязычного субъективного языка с помощью межъязыковых проекций» (PDF) . Труды Ассоциации компьютерной лингвистики (ACL) . стр. 976–983. Архивировано из оригинала (PDF) 8 июля 2010 года.
- ^ Су, Фанчжун; Маркерт, Катя (2008). «От слов к чувствам: пример распознавания субъективности» (PDF) . Proceedings of Coling 2008, Манчестер, Великобритания .
- ^ Панг, Бо; Ли, Лилиан (2004). «Воспитание сентиментальности: анализ настроений с использованием обобщения субъективности на основе минимальных сокращений» . Труды Ассоциации компьютерной лингвистики (ACL) . стр. 271–278.
- ^ Jump up to: Перейти обратно: а б Вибе, Дженис ; Рилофф, Эллен (2005). «Создание классификаторов субъективных и объективных предложений на основе неаннотированных текстов» . В Гельбух, Александр (ред.). Компьютерная лингвистика и интеллектуальная обработка текста . Конспекты лекций по информатике. Том. 3406. Берлин, Гейдельберг: Springer. стр. 486–497. дои : 10.1007/978-3-540-30586-6_53 . ISBN 978-3-540-30586-6 .
- ^ Квирк, Рэндольф; Гринбаум, Сидней; Джеффри, Лич; Ян, Свартвик (1985). Комплексная грамматика английского языка (общая грамматика) . Лонгман . стр. 175–239. ISBN 1933108312 .
- ^ Jump up to: Перейти обратно: а б с Лю, Бинг (2010). «Анализ настроений и субъективность» (PDF) . В Индурхье, Н.; Дамерау, Ф.Дж. (ред.). Справочник по обработке естественного языка (второе изд.).
- ^ Jump up to: Перейти обратно: а б Панг, Бо; Ли, Лилиан (6 июля 2008 г.). «Анализ мнений и настроений» . Основы и тенденции в области информационного поиска . 2 (1–2): 1–135. дои : 10.1561/1500000011 . ISSN 1554-0669 . S2CID 207178694 .
- ^ Рилофф, Эллен; Вибе, Дженис (11 июля 2003 г.). «Изучение шаблонов извлечения субъективных выражений». Материалы конференции 2003 года по эмпирическим методам обработки естественного языка . ЭМНЛП '03. Том. 10. США: Ассоциация компьютерной лингвистики. стр. 105–112. дои : 10.3115/1119355.1119369 . S2CID 6541910 .
- ^ Вибе, Дженис ; Рилофф, Эллен (июль 2011 г.). «Нахождение взаимной выгоды между анализом субъективности и извлечением информации» . Транзакции IEEE для аффективных вычислений . 2 (4): 175–191. дои : 10.1109/T-AFFC.2011.19 . ISSN 1949-3045 . S2CID 16820846 .
- ^ Рилофф, Эллен (1 августа 1996 г.). «Эмпирическое исследование автоматизированного построения словарей для извлечения информации в трех областях» . Искусственный интеллект . 85 (1): 101–134. дои : 10.1016/0004-3702(95)00123-9 . ISSN 0004-3702 .
- ^ Рилофф, Эллен; Джонс, Рози (июль 1999 г.). «Изучение словарей для извлечения информации путем многоуровневой загрузки» (PDF) . AAAI '99/IAAI '99: Материалы шестнадцатой национальной конференции по искусственному интеллекту и одиннадцатой конференции по инновационным применениям искусственного интеллекта. Инновационные применения искусственного интеллекта : 474–479.
- ^ Телен, Майкл; Рилофф, Эллен (6 июля 2002 г.). «Метод начальной загрузки для изучения семантических лексиконов с использованием контекстов шаблонов извлечения». Материалы конференции ACL-02 по эмпирическим методам обработки естественного языка - EMNLP '02 . Том. 10. США: Ассоциация компьютерной лингвистики. стр. 214–221. дои : 10.3115/1118693.1118721 . S2CID 137155 .
- ^ Лю, Бин (23 мая 2012 г.). «Анализ настроений и анализ мнений» . Обобщающие лекции по технологиям человеческого языка . 5 (1): 1–167. дои : 10.2200/S00416ED1V01Y201204HLT016 . ISSN 1947-4040 . S2CID 38022159 . Архивировано из оригинала 10 мая 2021 года . Проверено 9 декабря 2020 г.
- ^ Дэн, Шанкунь; Мицубути, Такаши; Сиода, Кей; Симада, Тацуро; Сакураи, Акито (декабрь 2011 г.). «Сочетание технического анализа с анализом настроений для прогнозирования цен на акции» . 2011 Девятая международная конференция IEEE по надежным, автономным и безопасным вычислениям . IEEE. стр. 800–807. дои : 10.1109/dasc.2011.138 . ISBN 978-1-4673-0006-3 . S2CID 15262023 .
- ^ Нгуен, Киет Ван; Нгуен, Ву Дык; Нгуен, Фу XV; Труонг, Там TH; Нгуен, Для LT. (1 октября 2018 г.). «UIT-VSFC: Корпус отзывов вьетнамских студентов для анализа настроений» . 2018 10-я Международная конференция по знаниям и системной инженерии (KSE) . Вьетнам: IEEE. пп. 19–24. дои : 10.1109/KSE.2018.8573337 . ISBN 978-1-5386-6113-0 . S2CID 56172224 .
- ^ Ю, Хун; Хацивасилоглу, Василейос (11 июля 2003 г.). «На пути к ответам на вопросы мнения». Материалы конференции 2003 года по эмпирическим методам обработки естественного языка . ЭМНЛП '03. Том. 10. США: Ассоциация компьютерной лингвистики. стр. 129–136. дои : 10.3115/1119355.1119372 .
- ^ Ху, Минцин; Лю, Бинг (2004). «Извлечение и обобщение отзывов клиентов» . Труды КДД 2004 .
- ^ Катальди, Марио; Баллаторе, Андреа; Тидди, Илария; Офор, Мари-Од (22 июня 2013 г.). «Хорошее расположение, ужасная еда: определение настроений в отзывах пользователей». Анализ социальных сетей и майнинг . 3 (4): 1149–1163. CiteSeerX 10.1.1.396.9313 . дои : 10.1007/s13278-013-0119-7 . ISSN 1869-5450 . S2CID 5025282 .
- ^ Лю, Бинг; Ху, Минцин; Ченг, Цзюньшэн (2005). «Обозреватель общественного мнения: анализ и сравнение мнений в Интернете» . Труды WWW 2005 .
- ^ Чжай, Чжунву; Лю, Бинг; Сюй, Хуа; Цзя, Пейфа (1 января 2011 г.). «Ограниченный LDA для группировки характеристик продукта при анализе мнений». В Хуане — Джошуа Чжэсюэ; Цао, Лунбин; Шривастава, Джайдип (ред.). Достижения в области обнаружения знаний и интеллектуального анализа данных . Конспекты лекций по информатике. Том. 6634. Шпрингер Берлин Гейдельберг. стр. 448–459. CiteSeerX 10.1.1.221.5178 . дои : 10.1007/978-3-642-20841-6_37 . ISBN 978-3-642-20840-9 .
- ^ Титов Иван; Макдональд, Райан (1 января 2008 г.). «Моделирование онлайн-обзоров с помощью многогранных тематических моделей». Материалы 17-й международной конференции по Всемирной паутине . WWW '08. Нью-Йорк, штат Нью-Йорк, США: ACM. стр. 111–120. arXiv : 0801.1063 . дои : 10.1145/1367497.1367513 . ISBN 978-1-60558-085-2 . S2CID 13609860 .
- ^ Лян, Бин; и др. (2022). «Аспектный анализ настроений с помощью сверточных сетей графов с расширенными аффективными знаниями». Системы, основанные на знаниях . 235 : 107643. doi : 10.1016/j.knosys.2021.107643 . S2CID 237258427 .
- ^ Ма, Юкун; и др. (2018). «Целевой аспектный анализ настроений посредством внедрения здравого смысла в внимательный LSTM». Труды АААИ . стр. 5876–5883.
- ^ Шарма, Ракша; сомани; Кумар; Бхаттачарья (2017). «Рейтинг интенсивности тональности среди прилагательных с использованием встраивания слов, несущих тональности» (PDF) . Ассоциация компьютерной лингвистики : 547–552.
- ^ М. С. Ахтар, А. Экбал и Э. Камбрия, «Насколько вы интенсивны? Прогнозирование интенсивности эмоций и чувств с использованием составного ансамбля [Замечания по применению]», в журнале IEEE Computational Intelligence Magazine , vol. 15, нет. 1, стр. 64–75, февраль 2020 г., doi: 10.1109/MCI.2019.2954667.
- ^ X. Оуян, П. Чжоу, Ч. Ли и Л. Лю, «Анализ настроений с использованием сверточной нейронной сети», Международная конференция IEEE 2015 г. по компьютерным и информационным технологиям; Повсеместные вычисления и коммуникации; Надежные, автономные и безопасные вычисления; Pervasive Intelligence and Computing, 2015, стр. 2359–2364, doi: 10.1109/CIT/IUCC/DASC/PICOM.2015.349.
- ^ Ю. Сантур, «Анализ настроений на основе закрытого рекуррентного блока», Международный симпозиум по искусственному интеллекту и обработке данных (IDAP), 2019 г., стр. 1–5, doi: 10.1109/IDAP.2019.8875985.
- ^ Камбрия, Э; Шуллер, Б; Ся, Ю; Хаваси, К. (2013). «Новые возможности в анализе мнений и настроений». Интеллектуальные системы IEEE . 28 (2): 15–21. CiteSeerX 10.1.1.688.1384 . дои : 10.1109/MIS.2013.30 . S2CID 12104996 .
- ^ Ортони, Эндрю; Клор, Дж; Коллинз, А. (1988). Когнитивная структура эмоций (PDF) . Кембриджский университет. Нажимать. Архивировано из оригинала (PDF) 23 ноября 2015 г.
- ^ Стивенсон, Райан; Микелс, Джозеф; Джеймс, Томас (2007). «Характеристика аффективных норм английских слов по дискретным эмоциональным категориям» . Методы исследования поведения . 39 (4): 1020–1024. дои : 10.3758/bf03192999 . ПМИД 18183921 . S2CID 6673690 .
- ^ Салгрен, Магнус ; Карлгрен, Юсси; Эрикссон, Гуннар (2007). «Валентная аннотация на основе семян в пространстве слов». Материалы Четвертого международного семинара по семантическим оценкам (SemEval-2007) .
- ^ Ким, С.М.; Хови, Э.Х. (2006). «Выявление и анализ мнений о суждениях». (PDF) . Материалы конференции «Технологии человеческого языка» / Североамериканская ассоциация компьютерной лингвистики (HLT-NAACL 2006). Нью-Йорк, штат Нью-Йорк . Архивировано из оригинала (PDF) 29 июня 2011 года.
- ^ Дей, Липика; Хак, СК Миражул (2008). «Анализ мнений на основе зашумленных текстовых данных» . Материалы второго семинара по аналитике зашумленных неструктурированных текстовых данных, стр.83-90 .
- ^ Камбрия, Э; Хусейн, А. (2015). Сентические вычисления: основанная на здравом смысле концепция анализа настроений на концептуальном уровне . Спрингер. ISBN 9783319236544 .
- ^ Аккора, Джунейт Гуркан; Баир, Мурат Али; Демирбас, Мюрат; Ферхатосманоглу, Хакан (2010). «Выявление переломных моментов в общественном мнении» . SigKDD, Материалы первого семинара по аналитике социальных сетей .
- ^ Камбрия, Эрик; Лю, Цянь; Декерки, Серджио; Син, Фрэнк; Квок, Кеннет (2022). «SenticNet 7: основанная на здравом смысле система нейросимволического искусственного интеллекта для объяснимого анализа настроений» (PDF) . Труды ЛРЭК . стр. 3829–3839.
- ^ Борт, Дамиан; Цзи, Ронгронг; Чен, Тао; Брейэль, Томас; Чанг, Ши-Фу (2013). «Крупномасштабная онтология визуального настроения и детекторы, использующие пары прилагательных-существительных» . Труды ACM Int. Конференция по мультимедиа . стр. 223–232. Архивировано из оригинала 15 апреля 2021 года . Проверено 2 ноября 2017 г.
- ^ Сошер, Ричард; Перелыгин, Алексей; Ву, Джин Ю.; Чуанг, Джейсон; Мэннинг, Кристофер Д.; Нг, Эндрю Ю.; Поттс, Кристофер (2013). «Рекурсивные глубокие модели семантической композиционности в дереве настроений». В трудах EMNLP : 1631–1642. CiteSeerX 10.1.1.593.7427 .
- ^ «Кейс-стади: расширенный анализ настроений» . Архивировано из оригинала 29 октября 2013 года . Проверено 18 октября 2013 г.
- ^ Мозетич, Игорь; Грчар, Миха; Смайлович, Ясмина (5 мая 2016 г.). «Многоязычная классификация настроений в Твиттере: роль комментаторов-людей» . ПЛОС ОДИН . 11 (5): e0155036. arXiv : 1602.07563 . Бибкод : 2016PLoSO..1155036M . дои : 10.1371/journal.pone.0155036 . ISSN 1932-6203 . ПМЦ 4858191 . ПМИД 27149621 .
- ^ Огнева М. «Как компании могут использовать анализ настроений для улучшения своего бизнеса» . Машаемый . Проверено 13 декабря 2012 г.
- ^ Карлгрен, Юсси , Магнус Салгрен , Фредрик Олссон, Фредрик Эспиноза и Ола Хамфорс. «Полезность анализа настроений». На Европейской конференции по информационному поиску, стр. 426-435. Шпрингер Берлин Гейдельберг, 2012.
- ^ Карлгрен, Юсси . «Связь между настроением автора и аффектом в тексте и текстовом жанре». В материалах четвертого семинара по использованию семантических аннотаций в информационном поиске, стр. 9-10. АКМ, 2011.
- ^ Карлгрен, Юсси . « Аффект, привлекательность и настроения как факторы, влияющие на взаимодействие с мультимедийной информацией ». В материалах семинара «Тезей/ImageCLEF» по оценке поиска визуальной информации, стр. 8–11. 2009.
- ^ Амиго, Энрике, Адольфо Корухо, Хулио Гонсало, Эдгар Мей и Маартен де Рийке . «Обзор RepLab 2012: оценка систем управления репутацией в Интернете». В CLEF (онлайн-рабочие заметки/лабораторные работы/семинар). 2012.
- ^ Амиго, Энрике, Хорхе Каррильо Де Альборнос, Ирина Чугур, Адольфо Корухо, Хулио Гонсало, Тамара Мартин, Эдгар Мей, Маартен де Рийке и Дамиано Спина. «Обзор relab 2013: оценка систем мониторинга онлайн-репутации». На Международной конференции Форума межъязыковой оценки европейских языков, стр. 333-352. Шпрингер Берлин Гейдельберг, 2013.
- ^ Амиго, Энрике, Хорхе Каррильо-де-Альборнос, Ирина Чугур, Адольфо Корухо, Хулио Гонсало, Эдгар Мей, Маартен де Рийке и Дамиано Спина. «Обзор relab 2014: профилирование авторов и аспекты репутации для управления репутацией в Интернете». На Международной конференции Форума межъязыковой оценки европейских языков, стр. 307–322. Международное издательство Спрингер, 2014.
- ^ Jump up to: Перейти обратно: а б Райт, Алекс. «Искать в Интернете чувства, а не факты» , New York Times , 23 августа 2009 г. Проверено 1 октября 2009 г.
- ^ «Анализ настроений на Reddit» . 30 сентября 2014 года . Проверено 10 октября 2014 г.
- ^ Киркпатрик, Маршалл. " , ReadWriteWeb , 15 апреля 2009 г. Проверено 1 октября 2009 г.
- ^ Кондлифф, Джейми. «Flaming движет социальными сетями в Интернете» , New Scientist , 7 декабря 2010 г. Проверено 13 декабря 2010 г.
- ^ Тумасян, Андраник; О.Шпренгер, Тимм; Г.Санднер, Филипп; М.Велпе, Изабель (2010). «Прогнозирование выборов с помощью Твиттера: что 140 символов говорят о политических настроениях». Архивировано 12 декабря 2020 года в Wayback Machine . «Материалы четвертой международной конференции AAAI по блогам и социальным сетям»
- ^ Вуд, Ян Б.; Варела, Педро Л.; Боллен, Йохан; Роша, Луис М.; Гонсалвеш-Са, Жоана (2017). «Человеческие сексуальные циклы определяются культурой и соответствуют коллективным настроениям» . Научные отчеты . 7 (1): 17973. arXiv : 1707.03959 . Бибкод : 2017NatSR...717973W . дои : 10.1038/s41598-017-18262-5 . ПМК 5740080 . ПМИД 29269945 .
- ^ Корконцелос, Иоаннис; Никфарджам, Азаде; Шардлоу, Мэтью; Саркер, Абид; Ананиаду, София; Гонсалес, Грасиела Х. (2016). «Анализ влияния анализа настроений на извлечение побочных реакций на лекарства из твитов и сообщений на форумах» . Журнал биомедицинской информатики . 62 : 148–158. дои : 10.1016/j.jbi.2016.06.007 . ПМЦ 4981644 . ПМИД 27363901 .
- ^ Цзэн, Л.; Ли, РИМ; Йигитканлар, Т.; Цзэн, Х. Общественное мнение горнодобывающей промышленности о здоровье и безопасности строительства: латентный подход Дирихле к распределению. Здания 2023, 13, 927. https://doi.org/10.3390/buildings13040927.
- ^ Тан, Хуэйфэн; Тан, Сонгбо; Ченг, Сюэци (2009). «Опрос по выявлению настроений в обзорах» (PDF) . Экспертные системы с приложениями . 36 (7): 10760–10773. дои : 10.1016/j.eswa.2009.02.063 . S2CID 2178380 . Архивировано из оригинала (PDF) 24 мая 2018 г.
- ^ Jump up to: Перейти обратно: а б Якоб, Никлас и др. «За пределами звезд: использование свободных текстовых обзоров пользователей для повышения точности рекомендаций фильмов». Материалы 1-го международного семинара CIKM «Темно-сентиментальный анализ массового мнения» . АКМ, 2009.
- ^ Минцин, Ху; Лю, Бинг (2004). «Мнения о горнодобывающей промышленности в отзывах клиентов» (PDF) . АААИ . 4 (4). S2CID 5724860 . Архивировано из оригинала (PDF) 24 мая 2018 года.
- ^ Лю, Ян; Хуан, Сянцзи; Ан, Айджун; Ю, Сяохуэй (2008). «Моделирование и прогнозирование полезности онлайн-обзоров» (PDF) . ICDM'08. Восьмая международная конференция IEEE по интеллектуальному анализу данных . IEEE. стр. 443–452. дои : 10.1109/ICDM.2008.94 . ISBN 978-0-7695-3502-9 . S2CID 18235238 .
- ^ Бермингем, Адам; Смитон, Алан Ф. (2010). «Классификация настроений в микроблогах». Материалы 19-й международной конференции ACM по управлению информацией и знаниями (PDF) . стр. 1833–1836. дои : 10.1145/1871437.1871741 . ISBN 9781450300995 . S2CID 2084603 .
- ^ Ламба, Маника; Мадхусудхан, Маргам (2018). «Применение анализа настроений в библиотеках для предоставления услуг временной информации: тематическое исследование различных аспектов производительности». Анализ социальных сетей и майнинг . 8 (1): 1–12. дои : 10.1007/s13278-018-0541-y . S2CID 53047128 .