Триграмма
Эта статья нуждается в дополнительных цитатах для проверки . ( декабрь 2009 г. ) |
Триграммы — это частный случай n -граммы , где n равно 3. Они часто используются при обработке естественного языка для выполнения статистического анализа текстов и в криптографии для контроля и использования шифров и кодов . См. результаты анализа « Частоты букв в английском языке ».
Частота [ править ]
Контекст очень важен: различные рейтинги анализа и процентные соотношения легко получить, используя выборки разных размеров и разных авторов; или различные типы документов: стихи, научная фантастика, технологическая документация; и уровни письма: рассказы для детей и взрослых, военные приказы и рецепты.
Типичный криптоаналитический частотный анализ показывает, что 16 наиболее распространенных триграмм уровня символов в английском языке: [1] [2]
Классифицировать [1] | Триграмма | Частота [3] (Другой источник) |
---|---|---|
1 | тот | 1.81% |
2 | и | 0.73% |
3 | Да | 0.33% |
4 | ент | 0.42% |
5 | в | 0.72% |
6 | ион | 0.42% |
7 | что | 0.31% |
8 | для | 0.34% |
9 | в | |
10 | имеет | |
11 | вверх | |
12 | EDT | |
13 | это | |
14 | часто | 0.22% |
15 | что-то | 0.21% |
16 | мужчины |
Поскольку в зашифрованных сообщениях, отправленных по телеграфу, часто отсутствуют знаки препинания и пробелы, криптографический частотный анализ таких сообщений включает триграммы, выходящие за границы слов. Это приводит к частому появлению триграмм, таких как «edt», даже если они никогда не встречаются ни в одном слове этих сообщений. [4]
Примеры [ править ]
В предложении «быстрая рыжая лиса прыгает через ленивую коричневую собаку» имеются следующие триграммы на уровне слов:
the quick red quick red fox red fox jumps fox jumps over jumps over the over the lazy the lazy brown lazy brown dog
А триграмма уровня слова «быстрый красный» имеет следующие триграммы уровня символов (где подчеркивание «_» обозначает пробел):
the he_ e_q _qu qui uic ick ck_ k_r _re red
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б Леванд, Роберт (2000). Криптологическая математика . Математическая ассоциация Америки . п. 37. ИСБН 978-0-88385-719-9 .
- ^ Линтон, Том (2001). «Относительная частота букв в обычном английском тексте» . Центральный колледж . Криптография (весеннее издание). Архивировано из оригинала 22 января 2007 года.
- ^ «Частота английских букв» . Практическая криптография .
- ^ «Голосовой поиск SEO» . Топливоонлайн .