Jump to content

Дайч – Мокотофф Soundex

Звук Дейча-Мокотоффа (D-M Soundex) — фонетический алгоритм, изобретенный в 1985 году еврейскими специалистами по генеалогии Гэри Мокотоффом и Рэнди Дейчем . Это усовершенствованная версия алгоритмов Рассела и американского Soundex , призванная обеспечить большую точность сопоставления славянских и идишских фамилий со схожим произношением , но с различиями в написании.

Soundex Дейча-Мокотоффа иногда называют «еврейским Soundex» и «восточноевропейским Soundex», хотя авторы не рекомендуют использовать эти прозвища для алгоритма, поскольку сам алгоритм не зависит от того факта, что мотивацией создания новой системы была плохой результат систем-предшественников при работе со славянскими и идишскими фамилиями.

Улучшения

[ редактировать ]

Улучшения по сравнению со старыми алгоритмами Soundex включают:

  • Кодированные имена состоят из шести цифр, что повышает точность поиска (традиционный Soundex использует четыре символа).
  • Начальный символ имени кодируется.
  • Некоторые правила алгоритма кодируют многосимвольные n-граммы как отдельные цифры (American и Russell Soundex не обрабатывают многосимвольные n-граммы).
  • Для одного имени может быть возвращено несколько возможных кодировок (традиционный Soundex возвращает только одну кодировку, даже если написание имени потенциально может иметь несколько вариантов произношения)

Некоторые примеры:

Фамилия Американский Саундекс Д – М Саундекс
Питерс P362 739400, 734000
Петерсон P362 739460, 734600
Московиц М232 645740
Московиц М213 645740
Ауэрбах А612 097500, 097400
Урбах U612 097500, 097400
Джексон Дж250 154600, 454600, 145460, 445460
Джексон-Джексон J252 154664, 454664, 145466, 445466, 154646, 454646, 145464, 445464

Алгоритм сопоставления фонетических имен Бейдера-Морса

[ редактировать ]

Чтобы справиться с большим количеством ложноположительных результатов, генерируемых DM Soundex, Стивен П. Морс и Александр Бейдер создали алгоритм сопоставления фонетических имен Бейдера-Морса . [ 1 ] Этот новый алгоритм сокращает количество ложных срабатываний за счет некоторых ложноотрицательных результатов. Ряд сайтов предлагают B-M soundex в дополнение к D-M Soundex. [ 2 ]

Примечания

[ редактировать ]
  1. ^ Фонетическое сопоставление Бейдера-Морзе: альтернатива Soundex с меньшим количеством ложных попаданий - копия Авотайну : Международный обзор еврейской генеалогии (лето 2008 г.)
  2. ^ Ну? Что нового? Том 9, номер 22 Гэри Мокотофф, редактор - Электронный журнал еврейской генеалогии от Авотайну
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e1749028176df0e89f14650036f7c94e__1699260240
URL1:https://arc.ask3.ru/arc/aa/e1/4e/e1749028176df0e89f14650036f7c94e.html
Заголовок, (Title) документа по адресу, URL1:
Daitch–Mokotoff Soundex - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)