Jump to content

Генерал

Генерал
Оригинальный автор(ы) Радим Регурек
Разработчик(и) РЕДКИЕ Технологии, ООО
Первоначальный выпуск 2009
Стабильная версия
4.3.2 [1] / 24 августа 2023 г .; 11 месяцев назад ( 24 августа 2023 г. )
Репозиторий github /РаРе-Технологии / ген
Написано в Питон
Операционная система Линукс , Виндовс , МакОС
Тип Поиск информации
Лицензия LGPL
Веб-сайт радимрехурек / ген /

Gensim — это библиотека с открытым исходным кодом для неконтролируемого тематического моделирования , индексации документов , поиска по сходству и других обработки естественного языка функций с использованием современного статистического машинного обучения .

Gensim реализован на Python и Cython для повышения производительности. Gensim предназначен для обработки больших коллекций текста с использованием потоковой передачи данных и дополнительных онлайн-алгоритмов, что отличает его от большинства других пакетов программного обеспечения для машинного обучения, ориентированных только на обработку в памяти.

Основные характеристики

[ редактировать ]

Gensim включает в себя потоковые параллельные реализации fastText , [2] алгоритмы word2vec и doc2vec, [3] а также скрытый семантический анализ (LSA, LSI, SVD), факторизация неотрицательной матрицы (NMF), скрытое распределение Дирихле (LDA), tf-idf и случайные проекции . [4]

Некоторые из новых онлайн-алгоритмов в Gensim также были опубликованы в докторской диссертации 2011 года « Масштабируемость семантического анализа в обработке естественного языка» Радима Ржегуржека, создателя Gensim. [5]

Использование Генсима

[ редактировать ]

По состоянию на 2018 год библиотека Gensim использовалась и цитировалась в более чем 1400 коммерческих и академических приложениях. [6] в самых разных дисциплинах: от медицины до анализа страховых претензий и патентного поиска. [7] О программном обеспечении было рассказано в нескольких новых статьях, подкастах и ​​интервью. [8] [9] [10]

Бесплатная и коммерческая поддержка

[ редактировать ]

Открытый исходный код разработан и размещен на GitHub. [11] и форум общественной поддержки поддерживается в группах Google. [12] и сетка . [13]

Gensim имеет коммерческую поддержку со стороны компании Rare-technologies.com, которая также предоставляет студенческое наставничество и проекты академических диссертаций для Gensim через свою программу Студенческий инкубатор. [14]

  1. ^ «Выпуск 4.3.2» . 24 августа 2023 г. Проверено 18 сентября 2023 г.
  2. ^ Масштабируемое *2vec обучение
  3. ^ Глубокое обучение с помощью word2vec и Gensim.
  4. ^ Радим Ржегуржек и Петр Сойка (2010). Программная среда для тематического моделирования с использованием больших корпусов . Учеб. Семинар LREC по новым проблемам в рамках НЛП
  5. ^ Ржегуржек, Радим (2011). «Масштабируемость семантического анализа при обработке естественного языка» (PDF) . Проверено 27 января 2015 г. мой пакет программного обеспечения gensim с открытым исходным кодом , который сопровождает эту диссертацию
  6. ^ Академические цитаты Генсима
  7. ^ Коммерческие пользователи Gensim
  8. ^ Podcast.__init__, эпизод № 71 на Gensim
  9. ^ Интервью с Радимом Ржегуржеком, создателем Gensim.
  10. ^ «Интервью DecisionStats с Радимом Ржегуржеком Генсимом #python» . 8 декабря 2015 г.
  11. ^ Исходный код Gensim на Github.
  12. ^ Список рассылки Gensim в группах Google.
  13. ^ Чат Gensim на Gitter
  14. ^ Инкубатор Gensim с открытым исходным кодом
[ редактировать ]


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a1d3a99317580db07e0d09876202d4fd__1712287860
URL1:https://arc.ask3.ru/arc/aa/a1/fd/a1d3a99317580db07e0d09876202d4fd.html
Заголовок, (Title) документа по адресу, URL1:
Gensim - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)