Jump to content

простор

простор
Оригинальный автор(ы) Мэтью Хоннибал
Разработчик(и) Взрывной ИИ, различные
Первоначальный выпуск февраль 2015 г .; 9 лет назад ( 2015-02 ) [1]
Стабильная версия
3.7.4 [2]  Отредактируйте это в Викиданных / 15 февраля 2024 г .; 4 месяца назад ( 15 февраля 2024 г. )
Репозиторий
Написано в Питон , Китон
Операционная система Linux , Windows , macOS , ОС
Платформа Кросс-платформенный
Тип Обработка естественного языка
Лицензия МОЯ лицензия
Веб-сайт просторный .что Отредактируйте это в Викиданных

spaCy ( / s p ˈ s / spay- SEE ) — это программная библиотека с открытым исходным кодом для расширенной обработки естественного языка , написанная на языках программирования Python и Cython . [3] [4] Библиотека издается под лицензией MIT , а ее основными разработчиками являются Мэтью Хоннибал и Инес Монтани , основатели компании-разработчика программного обеспечения Explosion.

В отличие от NLTK , который широко используется для обучения и исследований, spaCy фокусируется на предоставлении программного обеспечения для производственного использования. [5] [6] spaCy также поддерживает рабочие процессы глубокого обучения , которые позволяют подключать статистические модели, обученные популярными машинного обучения библиотеками , такими как TensorFlow , PyTorch или MXNet, через собственную библиотеку машинного обучения Thinc. [7] [8] Используя Thinc в качестве серверной части, spaCy предлагает сверточных нейронных сетей модели для маркировки частей речи , анализа зависимостей , категоризации текста и распознавания именованных объектов (NER) . Готовые статистические модели нейронных сетей для выполнения этих задач доступны для 23 языков, включая английский, португальский, испанский, русский и китайский, а также имеется многоязычная модель NER . Дополнительная поддержка токенизации для более чем 65 языков позволяет пользователям обучать собственные модели на собственных наборах данных. [9]

История [ править ]

  • Версия 1.0 была выпущена 19 октября 2016 г. и включала предварительную поддержку рабочих процессов глубокого обучения за счет поддержки пользовательских конвейеров обработки. [10] Кроме того, он включал средство сопоставления правил, поддерживающее аннотации сущностей , и официально документированный API обучения.
  • Версия 2.0 была выпущена 7 ноября 2017 года и представила модели сверточных нейронных сетей для 7 разных языков. [11] Он также поддерживал пользовательские компоненты конвейера обработки и атрибуты расширения, а также имел встроенный обучаемый компонент классификации текста .
  • Версия 3.0 была выпущена 1 февраля 2021 года и представила современные конвейеры на основе трансформаторов . [12] Также была представлена ​​новая система конфигурации и рабочий процесс обучения, а также подсказки по типам и шаблоны проектов. В этой версии прекращена поддержка Python 2 .

Основные возможности [ править ]

Расширения и визуализаторы [ править ]

Визуализация дерева разбора зависимостей, созданная с помощью визуализатора displaCy
зависимостей Визуализация дерева разбора , созданная с помощью визуализатора displaCy.

SpaCy поставляется с несколькими расширениями и визуализациями, которые доступны в виде бесплатных библиотек с открытым исходным кодом :

Ссылки [ править ]

  1. ^ «Представляем SpaCy» . взрыв.ай . Проверено 18 декабря 2016 г.
  2. ^ «Выпуск 3.7.4» . 15 февраля 2024 г. Проверено 20 февраля 2024 г.
  3. ^ Чой и др. (2015). Это зависит: сравнение анализатора зависимостей с использованием веб-инструмента оценки .
  4. ^ «Новый искусственный интеллект Google не может понять эти предложения. Сможете ли вы?» . Вашингтон Пост . Проверено 18 декабря 2016 г.
  5. ^ «Факты и цифры — SpaCy» . spacy.io . Проверено 4 апреля 2020 г.
  6. ^ Берд, Стивен; Кляйн, Юэн; Лопер, Эдвард; Болдридж, Джейсон (2008). «Мультидисциплинарное обучение с набором инструментов естественного языка» (PDF) . Материалы третьего семинара по проблемам преподавания компьютерной лингвистики, ACL : 62. doi : 10.3115/1627306.1627317 . ISBN  9781932432145 . S2CID   16932735 .
  7. ^ «PyTorch, TensorFlow и MXNet» . думаю.ай . Проверено 4 апреля 2020 г.
  8. ^ «взрыв/тонкий» . Гитхаб . Проверено 30 декабря 2016 г.
  9. ^ «Модели и языки | Документация по использованию SpaCy» . spacy.io . Проверено 10 марта 2020 г.
  10. ^ "взрыв/спаСи" . Гитхаб . Проверено 08 февраля 2021 г.
  11. ^ "взрыв/спаСи" . Гитхаб . Проверено 08 февраля 2021 г.
  12. ^ "взрыв/спаСи" . Гитхаб . Проверено 08 февраля 2021 г.
  13. ^ «Модели и языки — SpaCy» . spacy.io . Проверено 08 февраля 2021 г.
  14. ^ «Модели и языки | Документация по использованию SpaCy» . spacy.io . Проверено 8 февраля 2021 г.
  15. ^ «Бенчмарки | Документация по использованию SpaCy» . spacy.io . Проверено 08 февраля 2021 г.
  16. ^ Траск и др. (2015). sense2vec — быстрый и точный метод устранения неоднозначности смысла слов в нейронных встраиваниях слов .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8402d9c7bcf7e42b3ba45a03a9f4e182__1714057080
URL1:https://arc.ask3.ru/arc/aa/84/82/8402d9c7bcf7e42b3ba45a03a9f4e182.html
Заголовок, (Title) документа по адресу, URL1:
spaCy - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)