WordStat
![]() | |
Разработчик(и) | Provalis Research |
---|---|
Первоначальный выпуск | 1998 |
Стабильная версия | 9
|
Операционная система | Microsoft Windows |
Доступно в | Многоязычный |
Тип | Анализ текста , Контент-анализ , Текстовый анализ , Анализ тональности |
Лицензия | Собственное программное обеспечение |
Веб-сайт | www |
WordStat — это программное обеспечение для контент-анализа и интеллектуального анализа текста . [ 1 ] Впервые он был выпущен в 1998 году после того, как его разработал Норман Пеладо из Provalis Research . Последняя версия 9 вышла в 2021 году.
Программное обеспечение в основном используется для бизнес-аналитики и конкурентного анализа веб-сайтов, анализа настроений , контент-анализа открытых вопросов, извлечения тем из данных социальных сетей и т. д.
Некоторые особенности WordStat 9 [ 2 ]
[ редактировать ]- Категоризация контента с использованием пользовательских словарей.
- Классификация документов с использованием алгоритмов Наива-Байеса или алгоритмов k-ближайшего соседа, применяемых либо к словам, либо к понятиям.
- Автоматическое извлечение тем с использованием иерархической кластеризации первого порядка (совпадение слов) или второго порядка (профили совпадения) и многомерного масштабирования.
- Тематическое моделирование для извлечения основных тем с использованием NNMF и факторного анализа.
- Анализ соответствия с целью идентификации слов или понятий (или категорий контента), связанных с любыми категориальными метаданными, связанными с документами.
- Предварительная и постобработка с помощью скрипта R и Python.
- Анализируйте более 70 языков, включая китайский, японский, корейский, тайский.
- Интерактивные облака слов и таблицы частотности слов теперь можно получить непосредственно на основе результатов поиска ключевых слов и ключевых слов в контексте (KWIC), что позволяет быстро идентифицировать слова, связанные с определенными категориями контента или слова, которые появляются до или после определенного целевого элемента.
- Свяжите неструктурированный текст со структурированными данными, такими как даты, числа или категориальные данные , для выявления временных тенденций или различий между подгруппами или для оценки взаимосвязи с рейтингами или другими видами категориальных или числовых данных.
- Инструменты визуализации для визуализации и интерпретации результатов анализа текста:
- Дендрограмма с дополнительной гистограммой
- 2D и 3D многомерное масштабирование
- График близости
- Тепловая карта (с двойной кластеризацией)
- Пузырьковая диаграмма
- Гистограмма, круговая диаграмма, линейная диаграмма, облака слов
- Графики соответствия (2D и 3D)
Ссылки
[ редактировать ]- ^ «Список ЛИНГВИСТОВ 15.1171: Программное обеспечение: Wordstat, v.4» . 10 апреля 2004 г.
- ^ «Применение статистического анализа текста Provalis Research Corp. к отчетам о безопасности авиакомпаний» (PDF) . Проверено 17 сентября 2023 г.