Jump to content

Триграмма

Триграммы — это частный случай n -граммы , где n равно 3. Они часто используются при обработке естественного языка для выполнения статистического анализа текстов и в криптографии для контроля и использования шифров и кодов . См. результаты анализа « Частоты букв в английском языке ».

Частота [ править ]

Контекст очень важен: различные рейтинги анализа и процентные соотношения легко получить, используя выборки разных размеров и разных авторов; или различные типы документов: стихи, научная фантастика, технологическая документация; и уровни письма: рассказы для детей и взрослых, военные приказы и рецепты.

Типичный криптоаналитический частотный анализ показывает, что 16 наиболее распространенных триграмм уровня символов в английском языке: [1] [2]

Классифицировать [1] Триграмма Частота [3]
(Другой источник)
1 тот 1.81%
2 и 0.73%
3 Да 0.33%
4 ент 0.42%
5 в 0.72%
6 ион 0.42%
7 что 0.31%
8 для 0.34%
9 в
10 имеет
11 вверх
12 EDT
13 это
14 часто 0.22%
15 что-то 0.21%
16 мужчины

Поскольку в зашифрованных сообщениях, отправленных по телеграфу, часто отсутствуют знаки препинания и пробелы, криптографический частотный анализ таких сообщений включает триграммы, выходящие за границы слов. Это приводит к частому появлению триграмм, таких как «edt», даже если они никогда не встречаются ни в одном слове этих сообщений. [4]

Примеры [ править ]

В предложении «быстрая рыжая лиса прыгает через ленивую коричневую собаку» имеются следующие триграммы на уровне слов:

the quick red
quick red fox
red fox jumps
fox jumps over
jumps over the
over the lazy
the lazy brown
lazy brown dog

А триграмма уровня слова «быстрый красный» имеет следующие триграммы уровня символов (где подчеркивание «_» обозначает пробел):

the
he_
e_q
_qu
qui
uic
ick
ck_
k_r
_re
red

Ссылки [ править ]

  1. ^ Jump up to: Перейти обратно: а б Леванд, Роберт (2000). Криптологическая математика . Математическая ассоциация Америки . п. 37. ИСБН  978-0-88385-719-9 .
  2. ^ Линтон, Том (2001). «Относительная частота букв в обычном английском тексте» . Центральный колледж . Криптография (весеннее издание). Архивировано из оригинала 22 января 2007 года.
  3. ^ «Частота английских букв» . Практическая криптография .
  4. ^ «Голосовой поиск SEO» . Топливоонлайн .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b3b4b7308738f11932d6eef8d93a3871__1710215040
URL1:https://arc.ask3.ru/arc/aa/b3/71/b3b4b7308738f11932d6eef8d93a3871.html
Заголовок, (Title) документа по адресу, URL1:
Trigram - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)