Jump to content

Триграммные теги

В компьютерной лингвистике триграммный теггер — это статистический метод автоматической идентификации слов как существительных, глаголов, прилагательных, наречий и т. д. на основе марковских моделей второго порядка , которые рассматривают тройки последовательных слов. Он обучается на текстовом корпусе как метод предсказания следующего слова, взяв произведение вероятностей униграммы , биграммы и триграммы . В распознавании речи алгоритмы, использующие триграммный тегер, показывают лучшие результаты, чем алгоритмы, использующие тегер IIMM, но хуже, чем Net-тегер.

Описание триграммного тегера предоставлено Бранцем (2000).

  • Кемпе Андре (1993). «Стохастический тегировщик и анализ ошибок тегирования». Внутренняя бумага. Институт компьютерной лингвистики Штутгартского университета.
  • Брантс, Т. (2000) TnT - статистическое устройство для определения частей речи , материалы 6-й конференции по прикладной обработке естественного языка, ANLP-200
[ редактировать ]


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c02a8ba41bd210dd99b8de4a742ca6dc__1715316720
URL1:https://arc.ask3.ru/arc/aa/c0/dc/c02a8ba41bd210dd99b8de4a742ca6dc.html
Заголовок, (Title) документа по адресу, URL1:
Trigram tagger - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)