Система идентификации и разведки штата Нью-Йорк
, Фонетический код системы идентификации и разведки штата Нью-Йорк широко известный как NYSIIS, представляет собой фонетический алгоритм, разработанный в 1970 году как часть Системы идентификации и разведки штата Нью-Йорк (ныне часть Управления служб уголовного правосудия штата Нью-Йорк). Он имеет повышение точности на 2,7% по сравнению с традиционным алгоритмом Soundex . [1]
Процедура
[ редактировать ]Алгоритм, описанный в разделе «Методы поиска имени» , [2] является:
- Если первые буквы имени
- «MAC», затем измените эти буквы на «MCC».
- «КН», затем измените эти буквы на «НН».
- «К», затем измените эту букву на «С».
- «PH», затем измените эти буквы на «FF».
- «PF», затем измените эти буквы на «FF».
- «SCH», затем измените эти буквы на «SSS».
- Если последние буквы имени [3]
- «EE», затем измените эти буквы на «Y␢».
- «IE», затем измените эти буквы на «Y␢».
- «DT», или «RT», или «RD», или «NT», или «ND», затем измените эти буквы на «D␢».
- Первый символ кода NYSIIS является первым символом имени.
- В следующих правилах проверка производится по символам имени. Это описывается в терминах программного цикла. Указатель используется для указания на текущую рассматриваемую позицию в имени. Шаг 4 — установить этот указатель на второй символ имени.
- Учитывая положение указателя, может быть выполнен только один из следующих операторов.
- Если пусто, перейдите к правилу 7.
- Если текущая позиция является гласной (AEIOU), то, если она равна «EV», измените ее на «AF», в противном случае измените текущую позицию на «A».
- Если текущая позиция — это буква
- «Q», затем измените букву на «G».
- «Z», затем измените букву на «S».
- «М», затем измените букву на «Н».
- Если текущая позиция — буква «K», то, если следующая буква — «N», замените текущую позицию на «N», в противном случае замените текущую позицию на «C».
- Если текущая позиция указывает на строку букв
- «SCH», затем замените строку на «SSS».
- «PH», затем замените строку на «FF».
- Если текущая позиция — это буква «H», а предыдущая или следующая буква не является гласной (AEIOU), замените текущую позицию предыдущей буквой.
- Если текущая позиция — буква «W», а предыдущая буква — гласная, то замените текущую позицию предыдущей позицией.
- Если ни одно из этих правил не применимо, сохраните текущее значение буквы позиции.
- Если буква текущей позиции равна последней букве, помещенной в код, установите указатель на следующую букву и перейдите к шагу 5.
Следующий символ кода NYSIIS — буква текущей позиции.
Увеличьте указатель, чтобы указать на следующую букву.
Перейдите к шагу 5. - Если последним символом кода NYSIIS является буква «S», удалите ее.
- Если последние два символа кода NYSIIS представляют собой буквы «AY», замените их одним символом «Y».
- Если последним символом кода NYSIIS является буква «А», удалите эту букву.
Ссылки
[ редактировать ]- ^ Райкович, П.; Янкович, Д. (2007), «Адаптация и применение алгоритма Soundex Дайча-Мокотова к сербским именам» (PDF) , XVII конференция по прикладной математике , Нови-Сад, Сербия, заархивировано из оригинала (PDF) 27 августа 2011 г.
{{citation}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Тафт, Р.Л. (1970), «Методы поиска имени», Система идентификации и разведки штата Нью-Йорк , Олбани, Нью-Йорк.
{{citation}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ «Символ Юникода «ПУСТОЙ СИМВОЛ» (U+2422)» .