НаписатьРаспечатать
Writeprint — это метод судебной лингвистики для установления личности автора через Интернет, аналогичный цифровому отпечатку пальца. Идентичность устанавливается путем сравнения отличительных стилометрических характеристик неизвестного письменного текста с известными образцами подозреваемого автора ( писательские инварианты ). Даже без подозреваемого отпечаток дает потенциальные характеристики автора, такие как национальность и образование. [ 1 ]
Существует пять основных аспектов идентификации автора в рукописных отпечатках:
- Лексические особенности – анализ лексики , авторский выбор лексики, использование символов и слов для выявления предпочтений личности;
- использование прописных и строчных букв, частота употребления определенных букв, средняя длина слова, средняя длина самого высказывания [ 2 ]
- Синтаксические особенности – анализ стиля письма автора и структуры предложения, таких как пунктуация и расстановка переносов, использование пассивного залога , сложности предложения;
- Структурные особенности – анализ авторской организации и структурного расположения произведения, включая длину абзаца, интервал и отступ.
- включая расположение предложений внутри абзацев, использование прощаний, приветствий и подписей, например, в электронной почте;
- Контентно-специфические особенности – анализ языка, контекстуально значимого для тематики письменного произведения, в том числе использование сленга или сокращений. Если быть более конкретным, эти функции определяют интересы субъекта, определяя ключевые слова, которые он использует;
- Идиосинкразические особенности - анализ ошибок и других неграмматических элементов, которые могут быть уникальными для автора, таких как неправильное написание, неправильное употребление слов и неточные глагольные формы. Поскольку это может быть трудно контролировать, в сочетании с другими функциями достигается высокая точность идентификации автора. [ 3 ]
Хотя перечисленные выше пять признаков являются традиционными методами идентификации автора, существуют особенности, уникальные для онлайн-текста. Такие функции, как выбор шрифта, использование смайлов и ссылки на другие веб-сайты, обеспечивают путь к идентификации, который отсутствует в традиционном анализе текста. [ 4 ]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Ли, Цзесюнь; Чжэн, Ронг; Чен, Синьчунь (апрель 2006 г.). «От отпечатка пальца к отпечатку пальца». Коммуникации АКМ . 49 (4): 76–82. дои : 10.1145/1121949.1121951 . S2CID 14341797 .
- ^ Икбал, Ф; Бинсалли, Х; Фунг, Б; Деббаби, М. (октябрь 2010 г.). «Извлечение отпечатков анонимных электронных писем для судебно-медицинской экспертизы» (PDF) . Цифровое расследование . 7 (1–2): 56–64. дои : 10.1016/j.diin.2010.03.003 .
- ^ Аббаси, Ахмед; Чен, Синьчунь; Нунамейкер-младший, Джей Ф. (лето 2008 г.). «Стилометрическая идентификация на электронных рынках: масштабируемость и надежность». Журнал информационных систем управления . 25 (1): 49–78. дои : 10.2753/MIS0742-1222250103 . JSTOR 40398926 . S2CID 3941985 .
- ^ Ремейер, Джули (13 января 2007 г.). «Цифровые отпечатки пальцев». Новости науки . 171 (2): 26–28. дои : 10.1002/scin.2007.5591710210 . JSTOR 3982506 .