~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 3E2C0DBFD9C9E34417D4C64FDAE98341__1704232920 ✰
Заголовок документа оригинал.:
✰ Deterministic acyclic finite state automaton - Wikipedia ✰
Заголовок документа перевод.:
✰ Детерминированный ациклический конечный автомат — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Deterministic_acyclic_finite_state_automaton ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/3e/41/3e2c0dbfd9c9e34417d4c64fdae98341.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/3e/41/3e2c0dbfd9c9e34417d4c64fdae98341__translat.html ✰
Дата и время сохранения документа:
✰ 15.06.2024 02:50:45 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 3 January 2024, at 01:02 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Детерминированный ациклический конечный автомат — Википедия Jump to content

Детерминированный ациклический конечный автомат

Из Википедии, бесплатной энциклопедии
Строки «tap», «taps», «top» и «tops», хранящиеся в дереве (слева) и DAFSA (справа), EOW означает «Конец слова».

В информатике детерминированный ациклический конечный автомат ( DAFSA ), [1] также называется направленным ациклическим графом слов ( DAWG ; хотя это имя также относится к связанной структуре данных , которая функционирует как суффиксный индекс [2] ) — это структура данных , которая представляет набор строк и позволяет выполнять операцию запроса, проверяющую, принадлежит ли данная строка набору за время, пропорциональное ее длине. Существуют алгоритмы для создания и обслуживания таких автоматов . [1] сохраняя при этом их минимальными .

DAFSA — это частный случай конечного распознавателя состояний , который принимает форму ориентированного ациклического графа с одной исходной вершиной (вершина без входящих ребер), в которой каждое ребро графа помечено буквой или символом, и в котором каждая вершина имеет не более одного исходящего ребра для каждой возможной буквы или символа. Строки, представленные DAFSA, формируются символами на путях графа от исходной вершины до любой вершины-приемника (вершины без исходящих ребер). Фактически, детерминированный конечный автомат является ациклическим тогда и только тогда, когда он распознает конечный набор строк . [1]

Сравнение с попытками [ править ]

Позволяя достигать одних и тех же вершин несколькими путями, DAFSA может использовать значительно меньше вершин, чем сильно связанная структура данных дерева . Рассмотрим, например, четыре английских слова «tap», «taps», «top» и «tops». Дерево для этих четырех слов будет иметь 12 вершин, по одной для каждой строки, сформированной как префикс одного из этих слов, или для одного из слов, за которым следует маркер конца строки. Однако DAFSA может представлять те же четыре слова, используя только шесть вершин v i для 0 ≤ i ≤ 5 и следующие ребра: ребро от v 0 до v 1 , помеченное как «t», два ребра от v 1 до v 2 , помеченные как «t». «a» и «o», ребро от v 2 до v 3 , помеченное как «p», ребро от v 3 до v 4 , помеченное как «s», и ребра от v 3 и v 4 до v 5 , помеченные концом -строковый маркер. Существует компромисс между памятью и функциональностью, поскольку стандартный DAFSA может сказать вам, существует ли в нем слово, но он не может указать вам вспомогательную информацию об этом слове, тогда как trie может.

Основное различие между DAFSA и trie заключается в устранении избыточности суффиксов и инфиксов при хранении строк. Дерево исключает избыточность префиксов, поскольку все общие префиксы являются общими для всех строк, например, между и докторской степенью префикс врача врачами является общим. В DAFSA также используются общие суффиксы для слов, которые имеют одинаковый набор возможных суффиксов, что и друг друга. Для словарных наборов общеупотребительных английских слов это приводит к значительному сокращению использования памяти.

Поскольку к конечным узлам DAFSA можно добраться по нескольким путям, DAFSA не может напрямую хранить вспомогательную информацию, относящуюся к каждому пути, например, частоту употребления слов в английском языке. Однако если для каждого узла мы сохраним количество уникальных путей через эту точку структуры, мы сможем использовать его для получения индекса слова или слова по его индексу. [3] Вспомогательная информация затем может быть сохранена в массиве.

Ссылки [ править ]

  1. ^ Перейти обратно: а б с Ян Дачук, Стоян Михов, Брюс Уотсон и Ричард Уотсон (2000). Инкрементальное построение минимальных ациклических конечных автоматов. Компьютерная лингвистика 26 (1):3-16.
  2. ^ Всеобщее достояние В этой статье использованы общедоступные материалы из Пол Э. Блэк. «направленный ациклический граф слов» . Словарь алгоритмов и структур данных . НИСТ .
  3. ^ Ковальтовски, Т.; С.Л. Луккези (1993). «Приложения конечных автоматов, представляющих большие словари». Программное обеспечение-практика и опыт . 1993 : 15–30. CiteSeerX   10.1.1.56.5272 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 3E2C0DBFD9C9E34417D4C64FDAE98341__1704232920
URL1:https://en.wikipedia.org/wiki/Deterministic_acyclic_finite_state_automaton
Заголовок, (Title) документа по адресу, URL1:
Deterministic acyclic finite state automaton - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)