Список программного обеспечения для интеллектуального анализа текста
Компьютерные программы для анализа текста доступны во многих коммерческих компаниях и с открытым исходным кодом источниках .
Коммерческий
[ редактировать ]- Angoss – Angoss Text Analytics обеспечивает извлечение сущностей и тем, категоризацию тем, анализ настроений и возможности обобщения документов с помощью встроенного
- AUTINDEX – это коммерческий пакет программного обеспечения для интеллектуального анализа текста, основанный на сложной лингвистике IAI (Институт прикладных информационных наук), Саарбрюккен.
- DigitalMR – инструмент для прослушивания социальных сетей и анализа текста и изображений для исследования рынка.
- FICO Score – ведущий поставщик аналитики [ нужна ссылка ] .
- General Sentiment – платформа социального интеллекта, которая использует обработку естественного языка для выявления сходства между поклонниками брендов и поклонниками традиционных телешоу в социальных сетях. Автономная текстовая аналитика для сбора базы социальных знаний по миллиардам тем, хранящихся до 2004 года.
- IBM LanguageWare – пакет IBM для анализа текста (инструменты и среда выполнения).
- IBM SPSS - поставщик Modeler Premium (ранее называвшийся IBM SPSS Modeler и IBM SPSS Text Analytics), который содержит расширенные возможности анализа текста на основе NLP (многоязычное извлечение настроений, событий и фактов), которые можно использовать в сочетании с прогнозным моделированием. . Текстовая аналитика для опросов предоставляет возможность классифицировать ответы на опросы, используя возможности NLP для дальнейшего анализа или составления отчетов.
- Inxight – поставщик технологий текстовой аналитики, поиска и неструктурированной визуализации. (Inxight была куплена компанией Business Objects , которую в 2008 году купила SAP AG ).
- Language Computer Corporation – инструменты извлечения и анализа текста, доступные на нескольких языках.
- Lexalytics - поставщик механизма текстового анализа, используемого в мониторинге социальных сетей, голосе клиента, анализе опросов и других приложениях. Механизм заметности. Программное обеспечение предоставляет уникальную возможность объединения результатов неструктурированного текстового анализа со структурированными данными для предоставления дополнительных прогнозных переменных для улучшения прогнозных моделей и ассоциативного анализа.
- Linguamatics — поставщик корпоративного программного обеспечения для анализа и анализа текста на основе обработки естественного языка (NLP) I2E для обнаружения ценных знаний и поддержки принятия решений.
- Mathematica – предоставляет встроенные инструменты для выравнивания текста, сопоставления с образцом, кластеризации и семантического анализа. См. Wolfram Language , язык программирования Mathematica.
- MATLAB предлагает Text Analytics Toolbox для импорта текстовых данных, преобразования их в числовую форму для использования в задачах машинного и глубокого обучения, анализа настроений и классификации. [1]
- Medallia – предлагает одну систему записи для опросов, социальных, текстовых, письменных и онлайн-отзывов.
- NetOwl — набор многоязычных продуктов для анализа текста и объектов, включая извлечение объектов, извлечение ссылок и событий, анализ настроений, геотегирование, перевод имен, сопоставление имен и разрешение идентификационных данных, среди прочего.
- PolyAnalyst — среда текстовой аналитики.
- PoolParty Semantic Suite — платформа для анализа текста на основе графов.
- RapidMiner с расширением для обработки текста — программное обеспечение для анализа данных и текста.
- SAS – SAS Text Miner и Teragram; коммерческое программное обеспечение для анализа текста, обработки естественного языка и таксономии, используемое для управления информацией .
- Sketch Engine - менеджер корпусов и программное обеспечение для анализа, которое обеспечивает создание корпусов текстов из загруженных текстов или Интернета, включая маркировку частей речи и лемматизацию или обнаружение определенного веб-сайта. [2]
- Sysomos — поставщик программного обеспечения для аналитики социальных сетей, включая текстовый анализ и анализ настроений в разговорах с потребителями в Интернете.
- WordStat — дополнительный модуль контент-анализа и интеллектуального анализа текста для QDA Miner для анализа больших объемов текстовых данных.
Открытый исходный код
[ редактировать ]- Carrot2 – структура кластеризации текста и результатов поиска.
- GATE – общая архитектура для текстовой инженерии, набор инструментов с открытым исходным кодом для обработки естественного языка и языковой инженерии.
- Gensim — масштабное тематическое моделирование и извлечение смысловой информации из неструктурированного текста ( Python ).
- KH Coder – для количественного контент-анализа или анализа текста
- Расширение обработки текста KNIME .
- Natural Language Toolkit (NLTK) — набор библиотек и программ символьной и статистической обработки естественного языка (NLP) для языка программирования Python .
- OpenNLP – обработка естественного языка.
- Orange с надстройкой для интеллектуального анализа текста.
- Коллекция анализа текста PLOS . [3]
- Язык программирования R предоставляет основу для приложений интеллектуального анализа текста в пакете tm . [4] Представление задач «Обработка естественного языка» содержит tm и другие библиотечные пакеты интеллектуального анализа текста. [5]
- spaCy - библиотека обработки естественного языка с открытым исходным кодом для Python
- Stanbol — механизм интеллектуального анализа текста с открытым исходным кодом, предназначенный для управления семантическим контентом.
- Voyant Tools – веб-среда анализа текста, созданная как научный проект.
Ссылки
[ редактировать ]- ^ «Панель инструментов текстовой аналитики» . mathworks.com . Проверено 10 июля 2019 г.
- ^ «Анализ текста с помощью Sketch Engine» . Эскизный движок . LEXICAL COMPUTING CZ sro 14 декабря 2017 г. . Проверено 17 января 2018 г.
- ^ «Содержание: интеллектуальный анализ текста» . Коллекции ПЛОС . doi : 10.1371/issue.pcol.v01.i14 (неактивен 31 января 2024 г.). Архивировано из оригинала 4 июля 2013 г. Проверено 20 февраля 2014 г.
{{cite journal}}
: CS1 maint: DOI неактивен по состоянию на январь 2024 г. ( ссылка ) - ^ «Введение в пакет tm: анализ текста в R» (PDF) .
- ^ Вильд, Фридолин (20 февраля 2020 г.). «Представление задач CRAN: обработка естественного языка» . Проект КРАН.Р.