Jump to content

Список программного обеспечения для интеллектуального анализа текста

Компьютерные программы для анализа текста доступны во многих коммерческих компаниях и с открытым исходным кодом источниках .

Коммерческий

[ редактировать ]
  • Angoss – Angoss Text Analytics обеспечивает извлечение сущностей и тем, категоризацию тем, анализ настроений и возможности обобщения документов с помощью встроенного
  • AUTINDEX – это коммерческий пакет программного обеспечения для интеллектуального анализа текста, основанный на сложной лингвистике IAI (Институт прикладных информационных наук), Саарбрюккен.
  • DigitalMR – инструмент для прослушивания социальных сетей и анализа текста и изображений для исследования рынка.
  • FICO Score – ведущий поставщик аналитики [ нужна ссылка ] .
  • General Sentiment – ​​платформа социального интеллекта, которая использует обработку естественного языка для выявления сходства между поклонниками брендов и поклонниками традиционных телешоу в социальных сетях. Автономная текстовая аналитика для сбора базы социальных знаний по миллиардам тем, хранящихся до 2004 года.
  • IBM LanguageWare – пакет IBM для анализа текста (инструменты и среда выполнения).
  • IBM SPSS - поставщик Modeler Premium (ранее называвшийся IBM SPSS Modeler и IBM SPSS Text Analytics), который содержит расширенные возможности анализа текста на основе NLP (многоязычное извлечение настроений, событий и фактов), которые можно использовать в сочетании с прогнозным моделированием. . Текстовая аналитика для опросов предоставляет возможность классифицировать ответы на опросы, используя возможности NLP для дальнейшего анализа или составления отчетов.
  • Inxight – поставщик технологий текстовой аналитики, поиска и неструктурированной визуализации. (Inxight была куплена компанией Business Objects , которую в 2008 году купила SAP AG ).
  • Language Computer Corporation – инструменты извлечения и анализа текста, доступные на нескольких языках.
  • Lexalytics - поставщик механизма текстового анализа, используемого в мониторинге социальных сетей, голосе клиента, анализе опросов и других приложениях. Механизм заметности. Программное обеспечение предоставляет уникальную возможность объединения результатов неструктурированного текстового анализа со структурированными данными для предоставления дополнительных прогнозных переменных для улучшения прогнозных моделей и ассоциативного анализа.
  • Linguamatics — поставщик корпоративного программного обеспечения для анализа и анализа текста на основе обработки естественного языка (NLP) I2E для обнаружения ценных знаний и поддержки принятия решений.
  • Mathematica – предоставляет встроенные инструменты для выравнивания текста, сопоставления с образцом, кластеризации и семантического анализа. См. Wolfram Language , язык программирования Mathematica.
  • MATLAB предлагает Text Analytics Toolbox для импорта текстовых данных, преобразования их в числовую форму для использования в задачах машинного и глубокого обучения, анализа настроений и классификации. [1]
  • Medallia – предлагает одну систему записи для опросов, социальных, текстовых, письменных и онлайн-отзывов.
  • NetOwl — набор многоязычных продуктов для анализа текста и объектов, включая извлечение объектов, извлечение ссылок и событий, анализ настроений, геотегирование, перевод имен, сопоставление имен и разрешение идентификационных данных, среди прочего.
  • PolyAnalyst — среда текстовой аналитики.
  • PoolParty Semantic Suite — платформа для анализа текста на основе графов.
  • RapidMiner с расширением для обработки текста — программное обеспечение для анализа данных и текста.
  • SAS – SAS Text Miner и Teragram; коммерческое программное обеспечение для анализа текста, обработки естественного языка и таксономии, используемое для управления информацией .
  • Sketch Engine - менеджер корпусов и программное обеспечение для анализа, которое обеспечивает создание корпусов текстов из загруженных текстов или Интернета, включая маркировку частей речи и лемматизацию или обнаружение определенного веб-сайта. [2]
  • Sysomos — поставщик программного обеспечения для аналитики социальных сетей, включая текстовый анализ и анализ настроений в разговорах с потребителями в Интернете.
  • WordStat — дополнительный модуль контент-анализа и интеллектуального анализа текста для QDA Miner для анализа больших объемов текстовых данных.

Открытый исходный код

[ редактировать ]
  • Carrot2 – структура кластеризации текста и результатов поиска.
  • GATE – общая архитектура для текстовой инженерии, набор инструментов с открытым исходным кодом для обработки естественного языка и языковой инженерии.
  • Gensim — масштабное тематическое моделирование и извлечение смысловой информации из неструктурированного текста ( Python ).
  • KH Coder – для количественного контент-анализа или анализа текста
  • Расширение обработки текста KNIME .
  • Natural Language Toolkit (NLTK) — набор библиотек и программ символьной и статистической обработки естественного языка (NLP) для языка программирования Python .
  • OpenNLP – обработка естественного языка.
  • Orange с надстройкой для интеллектуального анализа текста.
  • Коллекция анализа текста PLOS . [3]
  • Язык программирования R предоставляет основу для приложений интеллектуального анализа текста в пакете tm . [4] Представление задач «Обработка естественного языка» содержит tm и другие библиотечные пакеты интеллектуального анализа текста. [5]
  • spaCy - библиотека обработки естественного языка с открытым исходным кодом для Python
  • Stanbol — механизм интеллектуального анализа текста с открытым исходным кодом, предназначенный для управления семантическим контентом.
  • Voyant Tools – веб-среда анализа текста, созданная как научный проект.
  1. ^ «Панель инструментов текстовой аналитики» . mathworks.com . Проверено 10 июля 2019 г.
  2. ^ «Анализ текста с помощью Sketch Engine» . Эскизный движок . LEXICAL COMPUTING CZ sro 14 декабря 2017 г. . Проверено 17 января 2018 г.
  3. ^ «Содержание: интеллектуальный анализ текста» . Коллекции ПЛОС . doi : 10.1371/issue.pcol.v01.i14 (неактивен 31 января 2024 г.). Архивировано из оригинала 4 июля 2013 г. Проверено 20 февраля 2014 г. {{cite journal}}: CS1 maint: DOI неактивен по состоянию на январь 2024 г. ( ссылка )
  4. ^ «Введение в пакет tm: анализ текста в R» (PDF) .
  5. ^ Вильд, Фридолин (20 февраля 2020 г.). «Представление задач CRAN: обработка естественного языка» . Проект КРАН.Р.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d487f5830d862123d9b908e691df41f6__1710253080
URL1:https://arc.ask3.ru/arc/aa/d4/f6/d487f5830d862123d9b908e691df41f6.html
Заголовок, (Title) документа по адресу, URL1:
List of text mining software - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)