Стилометрия
Часть серии о |
Лингвистика |
---|
Портал |
Стилометрия — это применение изучения языкового стиля , обычно к письменной речи. [1] Это также успешно применяется к музыке. [2] картины, [3] и шахматы. [4]
Стилометрия часто используется для приписывания авторства . анонимным или спорным документам [5] Он имеет как юридическое, так и академическое и литературное применение, начиная от вопроса об авторстве произведений Шекспира и заканчивая судебной лингвистикой , и имеет методологическое сходство с анализом читаемости текста .
Стилометрия может использоваться для разоблачения псевдонимных или анонимных авторов или для раскрытия некоторой информации об авторе, кроме полной идентификации. Авторы могут использовать состязательную стилометрию, чтобы противостоять этой идентификации, устраняя свои собственные стилистические характеристики, не меняя при этом значимого содержания своих сообщений. Он может опровергнуть анализы, которые не учитывают его возможность, но конечная эффективность стилометрии в состязательной среде неопределенна: стилометрическая идентификация может быть ненадежной, но и неидентификация не может быть гарантирована; Сама практика состязательной стилометрии может быть обнаружена.
История
[ редактировать ]Стилометрия выросла из более ранних методов анализа текстов на предмет их подлинности, личности автора и других вопросов.
Современная практика дисциплины получила известность благодаря изучению проблем авторства в английской драме эпохи Возрождения. Исследователи и читатели заметили, что у некоторых драматургов той эпохи были отличительные модели языковых предпочтений, и попытались использовать эти модели для идентификации авторов неопределенных или совместных произведений. Ранние усилия не всегда были успешными: в 1901 году один исследователь попытался использовать предпочтение Джона Флетчера к « 'em», сократительной форме слова «их», как маркер, позволяющий различать Флетчера и Филипа Массинджера в их сотрудничестве, но он по ошибке использовал издание работ Массинджера, в котором редактор расширил все случаи употребления слова « 'em» до «них». [6]
Основы стилометрии были заложены польским философом Винцентием Лютославским в «Принципах стилометрии» (1890). Лютославский использовал этот метод для разработки хронологии « Диалогов» Платона . [7]
Развитие компьютеров и их возможностей для анализа больших объемов данных расширило этот тип усилий на порядки. Однако большие возможности компьютеров по анализу данных не гарантировали хорошего качества результатов. В начале 1960-х годов преподобный А. К. Мортон провел компьютерный анализ четырнадцати посланий Нового Завета, приписываемых святому Павлу, который показал, что этот объем работ написали шесть разных авторов. Проверка его метода, примененная к произведениям Джеймса Джойса , дала результат, что «Улисс» , многоперспективный, многостилевой роман Джойса, был написан пятью отдельными людьми, ни один из которых, очевидно, не принимал никакого участия в создании первого романа Джойса. Роман « Портрет художника в молодости» . [8]
Однако со временем и с практикой исследователи и ученые усовершенствовали свои методы, чтобы получить лучшие результаты. Одним из заметных первых успехов стало разрешение спорного авторства двенадцати «Записок федералиста» Фредерика Мостелера и Дэвида Уоллеса. [9] Хотя вопросы относительно первоначальных предположений и методов все еще остаются (и, возможно, всегда будут), мало кто сейчас оспаривает основную предпосылку о том, что лингвистический анализ письменных текстов может дать ценную информацию и понимание. (Действительно, это было очевидно еще до появления компьютеров: успешное применение текстового/лингвистического анализа к канону Флетчера Сайрусом Хоем и другими дало четкие результаты в конце 1950-х и начале 1960-х годов.)
Приложения
[ редактировать ]Приложения стилометрии включают литературоведение, исторические исследования, социальные исследования, поиск информации, а также многие судебно-медицинские исследования и исследования. [10] [11] В последнее время благодаря его использованию получили развитие давние дебаты об анонимных средневековых исландских сагах. [12] [13] [14] Его также можно применить к компьютерному коду. [15] и внутреннее обнаружение плагиата , которое заключается в обнаружении плагиата на основе изменений стиля письма в документе. [16] Стилометрию также можно использовать, чтобы предсказать, является ли человек носителем английского языка или нет, по скорости набора текста . [17]
Стилометрия как метод уязвима к искажению текста при доработке. [18] Существует также случай, когда автор в течение своей карьеры принимал разные стили, как это было продемонстрировано в случае с Платоном , который выбрал разные стилистические политики, например, те, которые были приняты для ранних и средних диалогов, обращающихся к сократовской проблеме. [19]
Функции
[ редактировать ]Текстовые особенности, представляющие интерес для установления авторства, с одной стороны, представляют собой вычисление появления идиосинкратических выражений или конструкций (например, проверка того, как автор использует вставки или как часто автор использует безагентные пассивные конструкции), а с другой стороны, аналогичны тем, которые используются для анализа читаемости. такие как меры лексической вариации и синтаксической вариации. [20] Поскольку у авторов часто есть предпочтения к определенным темам, исследовательские эксперименты по установлению авторства в основном удаляют из набора функций такие слова, как существительные, прилагательные и глаголы, сохраняя только структурные элементы текста, чтобы избежать переподгонки своих моделей к теме, а не к характеристикам автора. [21] [22] Стилистические характеристики часто рассчитываются как средние значения по тексту или по всему собранию сочинений автора, что дает такие показатели, как средняя длина слова или средняя длина предложения. Это позволяет модели идентифицировать авторов, которые явно предпочитают многословные или краткие предложения, но скрывают вариации: у автора, сочетающего длинные и короткие предложения, будет тот же средний показатель, что и у автора с последовательными предложениями средней длины. Чтобы уловить такие вариации, в некоторых экспериментах вместо наблюдений используются последовательности или закономерности, а не средние наблюдаемые частоты, отмечая, например, что автор отдает предпочтение определенному шаблону ударения или акцента. [23] [24] или что автор склонен следовать за последовательностью длинных предложений короткими. [25] [26]
Можно сказать, что один из первых подходов к идентификации авторства, предложенный Менденхоллом, заключается в агрегировании наблюдений без их усреднения. [27]
Более поздние модели атрибуции авторства используют модели векторного пространства для автоматического определения особенностей стиля автора, но они также полагаются на разумную разработку функций по тем же причинам, что и более традиционные модели. [28] [29]
Состязательная стилометрия
[ редактировать ]Состязательная стилометрия — это практика изменения стиля письма, чтобы уменьшить вероятность стилометрии раскрыть личность автора или его характеристики. [30] Эта задача также известна как запутывание авторства или анонимизация авторства. Стилометрия представляет собой серьезную проблему конфиденциальности , поскольку она способна разоблачать анонимных авторов или связывать псевдонимы с другими личностями автора. [31] что, например, создает трудности для информаторов , [32] активисты, [33] и мистификаторы и мошенники . [34] Ожидается, что риск конфиденциальности будет расти по мере развития методов машинного обучения и текстовых корпусов . [35]
Вся состязательная стилометрия разделяет основную идею точного перефразирования исходного текста так, чтобы смысл не менялся, но стилистические сигналы были скрыты. [36] [37] Такой верный парафраз является состязательным примером для стилометрического классификатора. [38] Существует несколько широких подходов к этому, некоторые из которых частично совпадают: имитация , замена собственного стиля автора на стиль другого; перевод , применяющий машинный перевод с надеждой, что это устранит характерный стиль исходного текста; и запутывание — намеренное изменение стиля текста, чтобы он не напоминал стиль автора. [36]
Скрыть стиль вручную возможно, но трудоемко; [39] в некоторых обстоятельствах это предпочтительно или необходимо. [40] Автоматизированные инструменты, полуавтоматические или полностью автоматические, могут помочь автору. [39] Как лучше всего выполнить задачу и конструкция таких инструментов — открытый исследовательский вопрос. [41] [35] Хотя было показано, что некоторые подходы могут обойти определенные стилометрические анализы, [42] особенно те, которые не учитывают потенциал состязательности, [43] Установление безопасности перед лицом неизвестных анализов является проблемой. [44] Обеспечение достоверности пересказа — важнейшая задача для автоматизированных инструментов. [35]
Неясно, можно ли обнаружить практику состязательной стилометрии саму по себе. Некоторые исследования показали, что определенные методы создают сигналы в выходном тексте, но стилометрист, который не уверен в том, какие методы могли быть использованы, возможно, не сможет их надежно обнаружить. [35]
Текущие исследования
[ редактировать ]Современная стилометрия использует компьютеры для статистического анализа , а также искусственный интеллект и доступ к растущему корпусу текстов, доступных через Интернет . [45] Программные системы, такие как Signature [46] (бесплатное ПО, созданное Питером Милликаном из Оксфордского университета), JGAAP [47] (Программа указания авторства в графическом формате Java — бесплатное программное обеспечение, созданное доктором Патриком Юолой из Университета Дюкен), stylo [48] [49] (пакет R с открытым исходным кодом для различных стилометрических анализов, включая указание авторства, разработанный Мацеем Эдером , Яном Рыбицки и Майком Кестемонтом ) и Stylene [50] для голландского языка (бесплатное онлайн-программное обеспечение, созданное профессором Вальтером Далемансом из Университета Антверпена и доктором Вероник Хост из Университета Гента) делает его использование все более практичным даже для неспециалистов.
Академические площадки и мероприятия
[ редактировать ]Стилометрические методы используются для решения нескольких академических тем, например, в лингвистике, лексикографии или литературоведении. [1] в сочетании с обработкой естественного языка и машинным обучением и применяется для обнаружения плагиата, анализа авторства или поиска информации. [45]
Судебная лингвистика
[ редактировать ]Международная ассоциация судебных лингвистов (IAFL) организует раз в два года конференцию Международной ассоциации судебных лингвистов (13-е издание в 2016 году в Порту ) и издает «Международный журнал речи, языка и права» , в котором судебная стилистика является одной из центральных тем.
АААИ
[ редактировать ]Ассоциация по развитию искусственного интеллекта (AAAI) провела несколько мероприятий по субъективному и стилистическому анализу текста. [51] [52] [53]
КАСТРЮЛЯ
[ редактировать ]Семинары PAN (первоначально анализ плагиата, идентификация авторства и обнаружение почти дубликатов, а затем, в более широком смысле, семинар по выявлению плагиата, авторства и неправомерного использования программного обеспечения для социальных сетей), организуемые с 2007 года в основном в сочетании с конференциями по доступу к информации, такими как ACM SIGIR , FIRE и КЛЕФ . PAN формулирует общие задачи по обнаружению плагиата, [54] определение авторства, [55] гендерная идентификация автора, [56] профилирование автора , [57] обнаружение вандализма, [58] и другие связанные задачи анализа текста, многие из которых зависят от стилометрии.
Тематические исследования, представляющие интерес
[ редактировать ]- В 1439 году Лоренцо Валла показал, что Дар Константина был подделкой , и этот аргумент частично основан на сравнении латыни с той, которая используется в подлинных документах 4-го века.
- шведский священник Дик Хеландер был избран В 1952 году епископом Стренгнеса . Предвыборная кампания носила конкурентный характер, и Хеландер был обвинен в написании серии из ста анонимных клеветнических писем о других кандидатах избирателям епископства Стренгнес. Хеландер был сначала признан виновным в написании писем и потерял свой пост епископа, но позже был частично реабилитирован. Буквы изучались с использованием ряда стилометрических измерений (а также характеристик пишущей машинки), а различные судебные дела и дальнейшие исследования, многие из которых были проведены самим Хеландром в течение многих лет до его смерти в 1978 году, довольно подробно обсуждали стилометрический метод и его ценность в качестве доказательства. . [59] [60]
- В 1975 году, после того как Рональд Рейган стал губернатором Калифорнии, он начал давать еженедельные радиокомментарии, транслируемые по сотням радиостанций. После того, как его личные записи были обнародованы в день его 90-летия в 2001 году, в исследовании использовались стилистатистические методы, чтобы определить, какие из этих выступлений были написаны им, а какие - различными помощниками. [61]
- стилометрический анализ скандальной книги « Основные цвета» , написанной под псевдонимом. провел колледжа Вассар В 1996 году профессор Дональд Фостер [62] привлек к теме внимание более широкой аудитории после того, как правильно определил автора как Джо Кляйна . (Это дело разрешилось только после того, как почерковедческий анализ подтвердил авторство.)
- В 1996 году стилометрические методы были использованы для сравнения манифеста Унабомбера с письмами, написанными одним из подозреваемых, Теодором Качиньским , что привело к задержанию Качиньского, а затем и к его осуждению. [63]
- В апреле 2015 года исследователи с помощью методов стилометрии идентифицировали пьесу « Двойная ложь » как произведение Уильяма Шекспира . [64] [65] Исследователи проанализировали 54 пьесы Шекспира и Джона Флетчера , сравнили среднюю длину предложений, изучили использование необычных слов и количественно оценили сложность и психологическую валентность их языка.
- В 2016 году Макдональд П. Джексон, почетный профессор английского языка Оклендского университета (Новая Зеландия) и член Королевского общества Новой Зеландии , посвятивший всю свою академическую карьеру анализу установления авторства, написал книгу под названием «Кто написал «The Ночь перед Рождеством»?: Анализ матча Клемента Кларка Мура против. Генри Ливингстон Вопрос , [66] в котором он оценивает противоположные аргументы и впервые использует методы атрибуции автора современной компьютерной стилистики для изучения давнего противоречия. Джексон использует ряд тестов и вводит новый — статистический анализ фонем; он приходит к выводу, что Ливингстон является истинным автором классического произведения.
- В 2017 году Саймон Фуллер и Джеймс О'Салливан опубликовали исследование, в котором утверждается, что автор бестселлеров Джеймс Паттерсон не пишет никаких романов в своих романах, очевидно, в соавторстве. [67] [68] [69] По словам О'Салливана, его сотрудничество с бывшим президентом США Биллом Клинтоном « Президент пропал » является исключением из этого правила. [70]
- В 2017 году группа лингвистов, компьютерщиков и учёных проанализировала авторство Елены Ферранте . корпуса, На основе созданного в Падуанском университете содержащего 150 романов, написанных 40 авторами, они проанализировали стиль Ферранте на основе семи ее романов. Они смогли сравнить ее стиль письма со стилем 39 других писателей, использующих, например, стилус. [48] Вывод для всех был один: Доменико Старноне — тайный автор «Елены Ферранте». [71]
- В 2018 году Марк Гликман , старший преподаватель статистики Гарвардского университета, работал с Райаном Сонгом, бывшим студентом-статистиком Гарварда, и Джейсоном Брауном, профессором Университета Далхаузи в Новой Шотландии, применяя стилометрию, чтобы обнаружить, что, скорее всего , Битлз Песня « » « In My Life » была написана Джоном Ленноном, но с 50%-ной вероятностью Пол Маккартни написал среднюю восьмёрку . [72] [73]
- В 2019 году проект ETSO: Стилометрия в применении к Испанскому театру Золотого века. [74] Режиссеры Альваро Куэльяр Гонсалес и Херман Вега Гарсиа-Луэнгос (Университет Вальядолида) сумели собрать 3000 пьес Золотого века Испании. После применения стилометрического анализа была установлена атрибуция женщин и воспитателей Лопе де Вега. [75] [76] был ратифицирован, а проблема с авторством была обнаружена в «La monja alférez» пьесе , приписываемой Пересу де Монтальбану, которая, благодаря этому анализу и историческим и филологическим исследованиям, в конечном итоге была приписана Хуану Руису де Аларкону . [77] [78] [79] [80] В 2023 году тот же проект нашел Лопе де Вегу автором книги «La francesa Laura» («Француженка Лаура»), несмотря на то, что рукопись была написана спустя годы после его смерти. [81] Комедия была классифицирована как поздняя работа Лопе де Веги и датирована 1628–1630 годами, поскольку ее лестное обращение с Францией можно было объяснить кратковременными хорошими отношениями между Испанией и Францией во время Тридцатилетней войны , когда Англия была общим врагом. . [82] В данном анализе 500 наиболее частотных слов исследуемого текста сравниваются с 500 остальными произведениями. В случае с La francesa Laura обнаружение показало, что из 100 работ, к которым он был наиболее близок, почти все были написаны Лопе де Вега. Методы машинного обучения, такие как машинный анализ опорных векторов , также применялись с большим диапазоном параметров. Традиционный филологический анализ авторства произведений подтвердил исследования стилометрии и искусственного интеллекта. [83]
- В 2020 году Рэйчел Маккарти и Джеймс О'Салливан утверждали, что Эмили Бронте является истинным автором «Грозового перевала» , положив конец предположениям некоторых критиков о том, что роман мог быть написан одним из ее братьев и сестер, а именно Бранвеллом или Шарлоттой . [84]
- В 2020 году Хартмут Ильсеманн использовал Rolling Delta и Rolling Classify из пакета программ R Stylo, чтобы показать, что корпус Марлоу стилистически неоднороден и что автор двух Тамерлейнов почти не присутствовал в оставшемся официальном корпусе Марлоу. [85] [86] [87]
- В 2022 году итальянские ученые Симоне Ребора и Массимо Сальгаро показали, используя метод «Дельта-расстояния» Джона Ф. Берроуза, что Феликс Зальтен является наиболее вероятным автором анонимного романа Жозефины Мутценбахер 1906 года, за исключением последних страниц. [88]
- В 2023 году шведский журналист Лапо Лаппин заявил, что два криминальных романа шведской писательницы Камиллы Лэкберг могут быть произведением писателя-призрака, предположительно ее редактора Паскаля Энгмана . Это утверждение было сначала опровергнуто автором и ее представителем [89] но позже Лэкберг призналась, что они с Паскалем Энгманом очень тесно сотрудничают, и он редактирует ее тексты. [90]
Данные и методы
[ редактировать ]Поскольку стилометрия имеет как описательные варианты использования, используемые для характеристики содержания коллекции, так и варианты использования для идентификации, например, идентификацию авторов или категорий текстов, методы, используемые для анализа данных и функций, указанных выше, варьируются от методов, созданных для классификации элементов в наборы или распределить элементы в пространстве вариаций функций. Большинство методов носят статистический характер, такие как кластерный анализ и дискриминантный анализ , обычно основаны на филологических данных и функциях и являются плодотворными областями применения для современных методов машинного обучения .
Если раньше стилометрия подчеркивала самые редкие или наиболее яркие элементы текста, то современные методы позволяют выделить определяющие закономерности даже в обычных частях речи. Большинство систем основано на лексической статистике, т.е. использовании частотности слов и терминов в тексте для характеристики текста (или его автора). В этом контексте, в отличие от поиска информации , наблюдаемые закономерности встречаемости наиболее распространенных слов более интересны, чем тематические термины, которые встречаются реже. [91] [92]
Основным стилометрическим методом является писательский инвариант : свойство, общее для всех текстов или, по крайней мере, для всех текстов, достаточно длинных, чтобы можно было провести анализ, дающий статистически значимые результаты, написанные данным автором. Примером инварианта писателя является частота использования служебных слов, используемых автором.
В одном из таких методов текст анализируется, чтобы найти 50 наиболее распространенных слов. Затем текст делится на фрагменты по 5000 слов, и каждый из фрагментов анализируется, чтобы определить частоту встречаемости этих 50 слов в этом фрагменте. Это генерирует уникальный 50-значный идентификатор для каждого фрагмента. Эти числа помещают каждый фрагмент текста в точку в 50-мерном пространстве. Это 50-мерное пространство сплющивается в плоскость с помощью анализа главных компонентов (PCA). В результате получается отображение точек, соответствующее авторскому стилю. Если два литературных произведения поместить в одну плоскость, полученная закономерность может показать, написаны ли оба произведения одним и тем же автором или разными авторами.
Гауссова статистика
[ редактировать ]Стилометрические данные распределяются по закону Ципфа-Мандельброта . Распределение чрезвычайно резкое и лептокуртическое , поэтому исследователи не могли использовать статистику для решения, например, проблем установления авторства. Тем не менее, использование гауссовой статистики вполне возможно путем применения преобразования данных . [93]
Нейронные сети
[ редактировать ]Нейронные сети — частный случай статистических методов машинного обучения — используются для анализа авторства текстов. Тексты неоспоримого авторства используются для обучения нейронной сети с помощью таких процессов, как обратное распространение ошибки , при этом ошибка обучения рассчитывается и используется для обновления процесса для повышения точности. Благодаря процессу, похожему на нелинейную регрессию, сеть получает возможность обобщать свою способность распознавания на новые тексты, с которыми она еще не сталкивалась, классифицируя их с заданной степенью достоверности. Такие приемы были применены к давним заявлениям о сотрудничестве Шекспира с его современниками Джоном Флетчером и Кристофером Марлоу . [94] [95] и подтвердил мнение, основанное на более традиционных исследованиях, о том, что такое сотрудничество действительно имело место.
Исследование 1999 года показало, что программа нейронной сети достигла 70% точности в определении авторства стихотворений, которые она еще не проанализировала. В этом исследовании, проведенном Vrije Universiteit, изучалась идентификация стихов трех голландских авторов с использованием только последовательностей букв, таких как «ден». [96]
В исследовании использовались сети глубокого доверия (DBN) для модели проверки авторства, применимой для непрерывной аутентификации (CA). [97]
Одна из проблем этого метода анализа заключается в том, что сеть может стать предвзятой на основе своего обучающего набора, возможно, выбирая авторов, которых сеть анализирует чаще. [96]
Генетические алгоритмы
[ редактировать ]Генетический алгоритм — это еще один метод машинного обучения, используемый для стилометрии. Это включает в себя метод, который начинается с набора правил. Примером правила может быть: «Если «но» встречается более 1,7 раз в каждой тысяче слов, то текст принадлежит автору Х». Программа представлена текстом и использует правила определения авторства. Правила проверяются на наборе известных текстов, и каждому правилу присваивается балл пригодности. 50 правил с наименьшими баллами не используются. В оставшиеся 50 правил внесены небольшие изменения и введены 50 новых правил. Это повторяется до тех пор, пока разработанные правила не будут правильно атрибутировать тексты.
Редкие пары
[ редактировать ]Один из методов определения стиля называется «редкими парами» и основан на индивидуальных привычках сочетания слов . Употребление одних слов может быть для конкретного автора идиосинкразически связано с употреблением других, предсказуемых слов. [ нужна ссылка ]
Указание авторства в обмене мгновенными сообщениями
[ редактировать ]Распространение Интернета сместило внимание к установлению авторства на онлайн-тексты (веб-страницы, блоги и т. д.), электронные сообщения (электронные письма, твиты, публикации и т. д.) и другие типы письменной информации, которые намного короче, чем обычная книга, гораздо менее формальная и более разнообразная с точки зрения выразительных элементов, таких как цвета , макет , шрифты , графика , смайлы и т. д. О попытках учесть такие аспекты на уровне как структуры, так и синтаксиса сообщалось в . [98] Кроме того, были введены специфичные для содержания и идиосинкразические подсказки (например, тематические модели и инструменты проверки грамматики), чтобы раскрыть осознанный стилистический выбор. [99]
Стандартные стилометрические функции использовались для категоризации содержимого чата при обмене мгновенными сообщениями . [100] или поведение участников, [101] но попыток идентифицировать участников чата пока мало и рано. Более того, сходство между устными разговорами и взаимодействием в чате игнорировалось, хотя оно является основным различием между данными чата и любым другим типом письменной информации.
См. также
[ редактировать ]- Повторная идентификация данных
- Цифровые водяные знаки
- Лингвистика и Книга Мормона § Стилометрия
- Моше Пара
- Количественная лингвистика
- стеганография
- НаписатьРаспечатать
Примечания
[ редактировать ]- ^ Перейти обратно: а б Аргамон, Шломо , Кевин Бернс и Шломо Дубнов , ред. Структура стиля: алгоритмические подходы к пониманию образа и смысла. Springer Science & Business Media, 2010.
- ^ Уэсткотт, Ричард (15 июня 2006 г.). «Превращение хитовой музыки в науку» . Новости Би-би-си .
- ^ Сетхи, Рики (07.06.2016). «Использование компьютеров для лучшего понимания искусства» . Разговор . Проверено 1 декабря 2021 г.
- ^ Макилрой-Янг, Рид; Ван, Ю; Сен, Сиддхартха; Кляйнберг, Джон; Андерсон, Эштон (2021). Выявление индивидуального стиля принятия решений: изучение поведенческой стилометрии в шахматах . 35-я конференция по нейронным системам обработки информации.
- ^ Чен, Синьчунь; Ян, Кристофер С.; Чау, Майкл; Ли, Шу-Синг (2009). Информатика разведки и безопасности: Тихоокеанский азиатский семинар, PAISI 2009, Бангкок, Таиланд, 27 апреля 2009 г. Материалы . Берлин: Springer Science & Business Media. п. 15. ISBN 9783642013928 .
- ^ Сэмюэл Шенбаум , Внутренние доказательства и драматическое авторство елизаветинской эпохи; очерк по истории и методу литературы, с. 171.
- ^ Лютославский, В. (1898). «Принципы стилометрии в применении к хронологии произведений Платона». Журнал греческих исследований . 11 (41): 61–81. дои : 10.3406/рег.1898.5847 . ISSN 0035-2039 .
- ^ Сэмюэл Шенбаум , Внутренние доказательства и драматическое авторство елизаветинской эпохи; очерк по истории и методу литературы, с. 196.
- ^ Ф. Мостеллер и Д. Уоллес (1964). Вывод и спорное авторство: Федералист . Ридинг, Массачусетс : Аддисон-Уэсли .
- ^ Часки, Кэрол (2012). Солан, Лоуренс М; Тирсма, Питер М. (ред.). Идентификация автора в судебно-медицинской экспертизе . Издательство Оксфордского университета. doi : 10.1093/oxfordhb/9780199572120.001.0001 . ISBN 9780199572120 .
{{cite book}}
:|journal=
игнорируется ( помогите ) - ^ Часки, Кэрол (22 декабря 2005 г.). Вехт, Сирил Х.; Раго, Джон Т. (ред.). Судебная медицина и право: применение расследований в уголовном, гражданском и семейном правосудии . ЦРК Пресс. ISBN 978-1-4200-5811-6 .
- ^ Майкл Макферсон и Йоав Тирош (2020). «Стилометрический анализ саги о Льосветнинге» . Грипла . 31 : 7–41.
- ^ Хаукур Торгейрссон (2018). «Насколько похожи саги о Хеймскрингле и Эгилсе? Применение дельты Берроуза к исландским текстам» . Европейский журнал скандинавских исследований . 48 (1): 1–18. дои : 10.1515/ejss-2018-0001 .
- ^ Сигурдур Ингибергур Бьернссон, Стейнгримур Палл Карасон и Йон Карл Хельгасон (2021). « Стилометрия и выцветшие отпечатки пальцев авторов саг » . В поисках виновника: аспекты средневекового авторства, под редакцией Лукаса Рёсли и Стефани Гроппер : 97–122. дои : 10.1515/9783110725339-005 . ISBN 9783110725339 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Клэберн, Томас (16 марта 2018 г.). «К вашему сведению: инструменты искусственного интеллекта могут отличать анонимных программистов от их двоичных исполняемых файлов» . Регистр . Проверено 2 августа 2018 г.
- ^ Бенсалем, Имене; Россо, Паоло; Чихи, Салим (2019). «Об использовании символьных n-грамм как единственного доказательства плагиата». Языковые ресурсы и оценка . 53 (3): 363–396. дои : 10.1007/s10579-019-09444-w . hdl : 10251/159151 . S2CID 86630897 .
- ^ Бризан, Дэвид (октябрь 2015 г.). «Использование лингвистически улучшенной динамики нажатия клавиш для прогнозирования когнитивных способностей и демографии машинистки». Международный журнал человеко-компьютерных исследований . 82 : 57–68. дои : 10.1016/j.ijhcs.2015.04.005 .
- ^ Аликан, Неджип Фикри (2012). Переосмысление Платона: картезианский поиск настоящего Платона . Амстердам: Родопи. п. 183. ИСБН 9789042035379 .
- ^ Роу, Кристофер (2000). Кембриджская история греческой и римской политической мысли . Кембридж, Великобритания: Издательство Кембриджского университета. п. 160. ИСБН 0521481368 .
- ^ Стамататос, Эфстатиос (2009). «Обзор современных методов установления авторства». ДЖАСИСТ . 60 (3): 538–556. дои : 10.1002/asi.21001 . S2CID 6231242 .
- ^ Стамататос, Эфстатиос (2018). «Маскировка информации, связанной с темой, для повышения атрибуции авторства». ДЖАСИС . 69 (3).
- ^ Карлгрен, Юсси; Эспозито, Льюис; Граттон, Шанталь; Канерва, Пентти (2018). «Профилирование авторства без использования актуальной информации». Рабочие заметки CLEF . CEUR-WS.
- ^ Корбара, Сильвия; Морео, Алехандро; Себастьяни, Фабрицио (2022). «Слоговые объемные образцы как ритмические особенности для латинской атрибуции авторства» . ДЖАСИСТ . 74 : 128–141. arXiv : 2110.14203 . дои : 10.1002/asi.24660 . S2CID 239998537 .
- ^ Корбара, Сильвия; Чулви, Берта; Россо, Паоло; Морео, Алехандро (2022). «Ритмические и психолингвистические особенности авторских задач в испанском парламенте: оценка и анализ» . Экспериментальный МО сочетает многоязычие, мультимодальность и взаимодействие . КЛЮЧ. Спрингер. стр. 79–92. дои : 10.1007/978-3-031-13643-6_6 .
- ^ Карлгрен, Юсси; Эрикссон, Гуннар (2007). «Авторы, жанр и лингвистическая конвенция». Семинар SIGIR по анализу плагиата, выявлению авторства и обнаружению дубликатов . СИГИР. КАСТРЮЛЯ.
- ^ Эрикссон, Линда (2014). Последовательное агрегирование текстовых функций для идентификации независимого от предметной области автора (MSc). Королевский технологический институт KTH.
- ^ Менденхолл, TC (1887 г.). «Характеристические кривые состава» . Наука . 9 (214С): 237–246. дои : 10.1126/science.ns-9.214S.237 . ПМИД 17736020 .
- ^ Чен, Бэйчен (2021). Вложения для сходства книг (PDF) (MSc). Королевский технологический институт KTH.
- ^ Стамататос, Эфстатиос; Кестемонт, Майк; Креденс, Кшиштоф; Пезик, Петр; Хейни, Аннина (2022). «Обзор задачи проверки авторства на PAN 2022». В Фаджиоли; Ферро; Хэнбери; Поттаст (ред.). Лаборатории и семинары CLEF 2022, Бумаги для ноутбуков . CEUR-WS . Проверено 6 сентября 2022 г.
- ^ Нил и др. 2018 , с. 5.
- ^ Gröndahl & Asokan 2020a , с. 3.
- ^ Качмарчик и Гамон 2006 , с. 444.
- ^ Махмуд и др. 2019 , с. 54.
- ^ Афроз, Бреннан и Гринштадт, 2012 , с. 461.
- ^ Перейти обратно: а б с д Грёндаль и Асокан 2020a , с. 28.
- ^ Перейти обратно: а б Нил и др. 2018 , с. 6.
- ^ Поттаст, Хаген и Штейн, 2016 , стр. 10.
- ^ Саеди и Драс 2020 , с. 181.
- ^ Перейти обратно: а б Грёндаль и Асокан 2020a , с. 21-22.
- ^ Ван, Джуола и Ридделл, 2022 , с. 2.
- ^ Нил и др. 2018 , с. 27.
- ^ Бреннан, Афроз и Гринштадт, 2012 , стр. 2.
- ^ Чжай и др. 2022 , стр. 7373.
- ^ Эммери, Кадар и Хрупала 2021 , с. 2388-2389.
- ^ Перейти обратно: а б Аргамон, Шломо , Юсси Карлгрен и Джеймс Г. Шанахан . Стилистический анализ текста для доступа к информации. Материалы семинара, проведенного совместно с 28-я ежегодная международная конференция ACM по исследованиям и Развитие информационного поиска, 13–19 августа 2005 г., Сальвадор, Баия, Бразилия. Шведский институт информатики, 2005 г.
- ^ «Фирменная стилометрическая система» . ФилоКомп . Проверено 3 января 2014 г.
- ^ «ЯГААП» . JGAAP. 04.09.2012 . Проверено 15 октября 2012 г.
- ^ Перейти обратно: а б «Стилос для пакета R» . Группа вычислительной стилистики. 24 октября 2014 г. Архивировано из оригинала 21 декабря 2014 г. Проверено 24 октября 2014 г.
- ^ Эдер, Мацей; Рыбицкий, Ян; Кестемонт, Майк (2016). «Стилометрия с R: пакет для вычислительного анализа текста» (PDF) . Р Журнал . 8 (1): 107–121. дои : 10.32614/RJ-2016-007 .
- ^ Далеманс, Вальтер и Хосте, Вероник (2013). СТИЛЕН: среда для исследований стилометрии и читаемости для голландского языка (технический отчет). Серия технических отчетов CLiPS. ISSN 2033-3544 .
- ^ Ян Цюй , Джеймс Г. Шанахан и Дженис Вибе . «Изучение отношения и аффекта в тексте: теории и приложения». Технический отчет весеннего симпозиума AAAI SS-04-07. AAAI Press, Менло-Парк, Калифорния. 2004.
- ^ Юсси Карлгрен , Бьорн Гамбек и Пентти Канерва . «Приобретение (и использование) лингвистических (и мировых) знаний для доступа к информации». (2002). Весенний симпозиум AAAI. Технический отчет SS-02-09. AAAI Press, Менло-Парк, Калифорния. 2002.
- ^ Шломо Аргамон , Шломо Дубнов и Джули Юпп . «Стиль и значение в языке, искусстве, музыке и дизайне» (2004). Осенний симпозиум AAAI. Технический отчет ФС-04-07.
- ^ Поттаст, Мартин, Бенно Штайн, Альберто Баррон-Седеньо и Паоло Россо. «Система оценки для обнаружения плагиата». В материалах 23-й международной конференции по компьютерной лингвистике: Плакаты, стр. 997–1005. Ассоциация компьютерной лингвистики, 2010.
- ^ Стамататос, Эфстатиос, Уолтер Далеманс, Бен Верховен, Патрик Хуола, Аурелио Лопес-Лопес, Мартин Поттаст и Бенно Штайн. «Обзор задачи по идентификации автора на PAN 2014». В CLEF (Рабочие заметки), стр. 877–897. 2014.
- ^ Ранхель, Франциско, Паоло Россо, Мартин Поттаст и Бенно Штайн. «Обзор пятого задания по составлению профиля автора на Пан-2017: идентификация гендерного и языкового разнообразия в Твиттере». Рабочие заметки CLEF (2017).
- ^ Ранхель Пардо, Франсиско Мануэль, Фабио Челли, Паоло Россо, Мартин Поттаст, Бенно Штайн и Уолтер Делеманс. «Обзор третьего задания по профилированию авторов на PAN 2015». В документах рабочих заметок оценочных лабораторий и семинаров CLEF 2015, стр. 1–8. 2015.
- ^ Поттаст, Мартин, Бенно Штайн и Тереза Холфельд. «Обзор 1-го Международного конкурса по обнаружению вандализма в Википедии». В CLEF (Тетради/лабораторные работы/семинары). 2010.
- ^ Обработка текста, анализ и генерация текста - типология и атрибуция текста. Материалы Нобелевского симпозиума 51. Под редакцией Стуре Аллена . Стокгольм: Almqvist & Wiksell International, 1982. Data лингвистика, 16. Нобелевский симпозиум, 51. ISBN 91-22-00594-3
- ^ Карлгрен, Юсси (2003). «Хеландер: Дело об установлении авторства» . Проверено 4 октября 2017 г.
- ^ Айролди, Эдоардо М .; Финберг, Стивен Э.; Скиннер, Кирон К. (июль 2007 г.). «Чьи идеи? Чьи слова? Авторство радиообращений Рональда Рейгана» (PDF) . PS: Политология и политика . 40 (3): 501–506. CiteSeerX 10.1.1.190.5798 . дои : 10.1017/S1049096507070874 . S2CID 18730541 .
- ↑ Автор неизвестен , Салон Гэвина МакНетта, 2 ноября 2000 г.
- ^ Беллак, Пэм (10 апреля 1996 г.). «В деле Унабома — боль для семьи подозреваемого» . Нью-Йорк Таймс . Архивировано из оригинала 10 августа 2017 года . Проверено 5 июля 2008 г.
- ^ «Исследование показало, что спорная пьеса Шекспира несет на себе отпечаток мастера» . Лос-Анджелес Таймс . 10 апреля 2015 г. Проверено 13 апреля 2015 г.
- ^ Бойд, Райан Л.; Пеннебейкер, Джеймс В. (2015). «Написал ли Шекспир двойную ложь? Идентификация людей путем создания психологических подписей с помощью анализа текста» . Психологическая наука . 26 (5): 570–582. дои : 10.1177/0956797614566658 . ПМИД 25854277 . S2CID 13022405 .
- ^ Джексон, Макдональд П. (27 апреля 2016 г.). Кто написал «Ночь перед Рождеством»? Анализ матча Клемента Кларка Мура против. Генри Ливингстон Вопрос . МакФарланд и Ко. ISBN 978-1476664439 .
- ^ Фуллер, Саймон; О'Салливан, Джеймс (2017). «Структура важнее стиля: совместное авторство и возрождение литературного капитализма» . Ежеквартальный журнал цифровых гуманитарных наук . 11 (1) . Проверено 20 апреля 2017 г.
- ^ Лейн, Энтони (18 июня 2018 г.). «Убойное сотрудничество Билла Клинтона и Джеймса Паттерсона» . Житель Нью-Йорка . Проверено 7 июня 2018 г.
- ^ «Почему не нужно много писать, чтобы стать автором бестселлеров в мире» . Разговор . 3 апреля 2017 г. Проверено 20 апреля 2017 г.
- ^ О'Салливан, Джеймс (7 июня 2018 г.). «Билл Клинтон и Джеймс Паттерсон — соавторы, но кто написал?» . Хранитель . Проверено 7 июня 2018 г.
- ^ Савой, Жак (2018). «Действительно ли Старноне является автором Ферранте?» . Цифровая стипендия в области гуманитарных наук . 33 (4): 902–918. дои : 10.1093/llc/fqy016 .
- ^ Ройэлл, Питер: «Вы говорите Джон, я говорю Пол. Но что говорит стилометрия?»
- ^ Гликман, Марк; Браун, Джейсон; Сонг, Райан (2019). «(A) Данные из жизни: атрибуция авторства в песнях Леннона-Маккартни» . Гарвардский обзор науки о данных . 1 (1). arXiv : 1906.05427 . дои : 10.1162/99608f92.130f856e . S2CID 189762434 .
- ^ Проект ДО.
- ^ «Un monstruo de la naturaleza llamado Lope» [Чудовище природы по имени Лопе]. abc (на испанском языке). 28.11.2018 . Проверено 11 августа 2019 г.
- ^ «Цифровые трекеры в Золотой век» . Север Кастилии (на испанском языке). 23 декабря 2018 г. Проверено 11 августа 2019 г.
- ^ Реал, Трибуна де Сьюдад (09 июля 2019 г.). «Хуан Руис де Аларкон расширяет свою работу пять столетий спустя » . Трибьюн Сьюдад-Реаля (на испанском языке) . Проверено 11 августа 2019 г.
- ^ Мигеланьес, Даниэль (28 июля 2019 г.). «Холмс филологии» . PSOE Чамбери . № 6. с. 8. Архивировано из оригинала 18 июля 2020 г. Проверено 11 августа 2019 г.
- ^ «Сор Хуана Инес организовала 42-ю конференцию классического театра» . Lanza Digital (на европейском испанском языке). 14 июля 2019 г. Проверено 11 августа 2019 г.
- ^ « La monja alférez ' ya no es de Pérez de Montalbán, но de Ruiz de Alarcón». Север Кастилии (на испанском языке). 10 июля 2019 г. Проверено 11 августа 2019 г.
- ^ «Искусственный интеллект помог найти выдающегося испанского драматурга Лопе де Вегу как автора пьесы по рукописи, написанной спустя годы после его смерти» . newsendip.com . 31 января 2023 г. Проверено 8 февраля 2023 г.
- ^ Джонс, Сэм (5 февраля 2023 г.). «Искусственный интеллект обнаружил утраченную работу титана «золотого века» Испании » . Хранитель . Проверено 8 февраля 2023 г.
- ^ Моралес, Мануэль (31 января 2023 г.). «Искусственный интеллект приписывает анонимное произведение из коллекции рукописей Национальной библиотеки Лопе де Веге » . Эль Паис (на испанском языке) . Проверено 8 февраля 2023 г.
- ^ Маккарти, Рэйчел; О'Салливан, Джеймс (2020). «Кто написал «Грозовой перевал»?» . Цифровая стипендия в области гуманитарных наук . 36 (2): 383–391. дои : 10.1093/llc/fqaa031 . hdl : 10468/10194 .
- ^ Ильсеманн, Хармут (2020) «Призрак Марлоу: сдвиг парадигмы в определении авторства драмы английского Возрождения». Дюрен: Шейкер, ISBN 978-3-8440-7412-3
- ^ Ильсеманн, Хармут (2020). «Возвращение к корпусу Марлоу» . Цифровая стипендия в области гуманитарных наук . 36 (2): 333–360. дои : 10.1093/llc/fqaa010 .
- ^ Ильсеманн, Хармут (2021). «Краткое дополнение к «Возвращению к корпусу Марлоу» и «Призраку Марлоу» . Цифровая стипендия в области гуманитарных наук . 37 (2): 462–468. doi : 10.1093/llc/fqab078 .
- ^ Ребора, Симона и Сальгаро, Массимо (2022). «Является ли Феликс Зальтен автором романа Мутценбахера (1906)? И да, и нет» . Язык и литература: Международный журнал стилистики . 31 (2): 243–264. дои : 10.1177/09639470221090384 . S2CID 248135373 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ ИИ раскрывает: у Лэкберга, вероятно, есть писатели-призраки - опровергает обвинения. Hufvudstadsbladet , 27 сентября 2023 г. (на шведском языке).
- ^ «Лэкберг о слухах: «Он ковырялся в приговорах» » . Hufvudstadsbladet (на шведском языке). Хельсинки. 21 декабря 2023 г. стр. 23.
- ^ Бибер, Дуглас . Разнообразие устной и письменной речи. Издательство Кембриджского университета, 1991.
- ^ Карлгрен, Юсси ; Каттинг, Дуглас (1994). «Распознавание текстовых жанров с помощью простых показателей с использованием дискриминантного анализа». Материалы 15-й конференции по компьютерной лингвистике . Том. 2. п. 1071. arXiv : cmp-lg/9410008 . Бибкод : 1994cmp.lg...10008K . дои : 10.3115/991250.991324 . S2CID 1297432 .
- ^ Ван Дрогенброк Ф.Дж., «Существенная перефразировка закона Ципфа-Мандельброта для решения задач установления авторства с помощью статистики Гаусса» (2019).
- ^ Мэтьюз, Роберт Эй Джей; Мерриам, Томас В. Н. (1993). «Нейронные вычисления в стилометрии I: приложение к произведениям Шекспира и Флетчера». Литературно-лингвистическая информатика . 8 (4): 203–209. дои : 10.1093/llc/8.4.203 .
- ^ Мерриам, Томас В.Н.; Мэтьюз, Роберт Эй Джей (1994). «Нейронные вычисления в стилометрии II: приложение к произведениям Шекспира и Марлоу». Литературно-лингвистическая информатика . 9 (1): 1–6. дои : 10.1093/llc/9.1.1 .
- ^ Перейти обратно: а б Дж. Ф. Хорн; С.Л. Франк; В. Ковальчик; Ф ван дер Хам (3 сентября 2012 г.). «Нейросетевая идентификация поэтов по буквенным последовательностям». Литературно-лингвистическая информатика . 14 (3): 311–338. дои : 10.1093/llc/14.3.311 .
- ^ Брокардо, ML; Траоре, я; Вунганг, я; Обайдат, М.С. (2017). «Проверка авторства с использованием сетевых систем глубокого доверия». Int J Commun Syst . 30 (12): е3259. дои : 10.1002/dac.3259 . S2CID 40745740 .
- ^ де Вель, О.; Андерсон, А.; Корни, М.; Мохай, Г. (1 декабря 2001 г.). «Анализ содержимого электронной почты для криминалистики личности автора». SIGMOD Рек . 30 (4): 55–64. CiteSeerX 10.1.1.408.4231 . дои : 10.1145/604264.604272 . ISSN 0163-5808 . S2CID 1623521 .
- ^ Аргамон, Шломо; Коппель, Моше; Пеннебейкер, Джеймс В.; Шлер, Джонатан (1 февраля 2009 г.). «Автоматическое профилирование автора анонимного текста». Коммун. АКМ . 52 (2): 119–123. CiteSeerX 10.1.1.136.9952 . дои : 10.1145/1461928.1461959 . ISSN 0001-0782 . S2CID 5413411 .
- ^ «Классификация средств обмена мгновенными сообщениями для криминалистического анализа - TechRepublic» . Техреспублика . Проверено 26 января 2016 г.
- ^ Чжоу, Л.; Чжан, Дунсонг (1 января 2004 г.). «Может ли поведение в Интернете раскрыть обманщиков? - предварительное расследование обмана в сфере обмена мгновенными сообщениями». 37-я ежегодная Гавайская международная конференция по системным наукам, 2004 г. Материалы . стр. 9 стр.–. дои : 10.1109/HICSS.2004.1265079 . ISBN 978-0-7695-2056-8 . S2CID 7154702 .
Ссылки
[ редактировать ]- Афроз, Садия; Бреннан, Майкл; Гринштадт, Рэйчел (2012). «Обнаружение мистификаций, мошенничества и обмана в стиле письма в Интернете». Симпозиум IEEE 2012 по безопасности и конфиденциальности . стр. 461–475. дои : 10.1109/СП.2012.34 . ISBN 978-1-4673-1244-8 .
- Бреннан, Майкл; Афроз, Садия; Гринштадт, Рэйчел (2012). «Состязательная стилометрия: обход признания авторства для сохранения конфиденциальности и анонимности» (PDF) . Транзакции ACM по информационной и системной безопасности . 15 (3): 1–22. дои : 10.1145/2382448.2382450 . S2CID 16176436 .
- Бреннан, Майкл Роберт; Гринштадт, Рэйчел. «Практические атаки на методы признания авторства» . Инновационные применения искусственного интеллекта .
- Брокардо, Марсело Луис; Исса Траоре; Шериф Саад; Исаак Вунганг (2013). Проверка авторства коротких сообщений с помощью стилометрии . IEEE международный. Конференция по компьютерным, информационным и телекоммуникационным системам (CITS). дои : 10.1109/CITS.2013.6705711 .
- Может, Фазли; Паттон, Джон М. (2004). «Изменение стиля письма со временем». Компьютеры и гуманитарные науки . 38 (1): 61–82. CiteSeerX 10.1.1.1.8850 . дои : 10.1023/b:chum.0000009225.28847.77 . S2CID 38242388 .
- Эммери, Крис; Кадар, Акос; Хрупала, Гжегож (2021). «Состязательная стилометрия в дикой природе: атаки переносимой лексической замены на профилирование авторов». Материалы 16-й конференции Европейского отделения Ассоциации компьютерной лингвистики: основной том . стр. 2388–2402. arXiv : 2101.11310 . doi : 10.18653/v1/2021.eacl-main.203 . S2CID 231719026 .
- Грёндаль, Томми; Асокан, Н. (2020a). «Анализ текста в состязательных условиях: оставляет ли обман стилистический след?». Обзоры вычислительной техники ACM . 52 (3): 1–36. arXiv : 1902.08939 . дои : 10.1145/3310331 . S2CID 67856540 .
- Надежда, Джонатан (1994). Авторство пьес Шекспира . Кембридж: Издательство Кембриджского университета. ISBN 9780521417372 .
- Хой, Сайрус (1956–1962). «Акции Флетчера и его сотрудников в каноне Бомонта и Флетчера (I-VII)». Исследования по библиографии . 7–15 .
- Юола, Патрик (2006). «Указание авторства» (PDF) . Основы и тенденции в области информационного поиска . 1 (3): 3. CiteSeerX 10.1.1.219.1605 . дои : 10.1561/1500000005 . Архивировано из оригинала (PDF) 24 октября 2020 г. Проверено 13 ноября 2008 г.
- Качмарчик, Гэри; Гамон, Майкл (17 июля 2006 г.). «Запутывание стилометрии документа для сохранения анонимности автора» . Материалы стендовых докладов основной конференции COLING/ACL 2006 . стр. 444–451.
- Кенни, Энтони (1982). Вычисление стиля: введение в статистику для студентов, изучающих литературу и гуманитарные науки . Оксфорд: Пергамон Пресс.
- Махмуд, Асад; Ахмад, Файзан; Шафик, Зубайр; Шринивасан, Падмини; Заффар, Фарид (2019). «У девушки нет имени: автоматическое запутывание авторства с помощью Mutant-X» . Труды по технологиям повышения конфиденциальности . 2019 (4): 54–71. дои : 10.2478/popets-2019-0058 . S2CID 197621394 .
- Нил, Темпестт; Сундарараджан, Калаивани; Фатима, Аниз; Ян, Имин; Сян, Инфэй; Вудард, Дэймон (2018). «Обзор методов и приложений стилометрии». Обзоры вычислительной техники ACM . 50 (6): 1–36. дои : 10.1145/3132039 . S2CID 21360798 .
- Поттаст, Мартин; Хаген, Матиас; Штейн, Бенно (2016). Запутывание автора: атака на современное состояние проверки авторства (PDF) . Конференция и лаборатории Оценочного форума.
- Ромейн, Сюзанна (1982). Социально-историческая лингвистика . Кембридж: Издательство Кембриджского университета.
- Саеди, Чакаве; Драс, Марк (декабрь 2020 г.). «Крупномасштабное запутывание автора с использованием сиамского вариационного автокодировщика: система SiamAO» . Материалы девятой совместной конференции по лексической и вычислительной семантике . стр. 179–189.
- Сэмюэлс, МЛ (1972). Лингвистическая эволюция: с особым упором на английский язык . Кембридж: Издательство Кембриджского университета.
- Шенбаум, Сэмюэл (1966). Внутренние доказательства и драматическое авторство елизаветинской эпохи: очерк истории и метода литературы . Эванстон, Иллинойс, США: Издательство Северо-Западного университета.
- Ван Дрогенброк, Франс Дж. (2016) « Обработка распределения Zipf при компьютеризированном установлении авторства »
- Ван Дрогенбрук, Франс Дж. (2019) « Существенная перефразировка закона Ципфа-Мандельброта для решения задач установления авторства с помощью статистики Гаусса »
- Ван, Хайнин; Юола, Патрик ; Ридделл, Аллен (2022). «Воспроизведение и репликация эксперимента по состязательной стилометрии». arXiv : 2208.07395 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - Зенков, Андрей В. (2018). «Метод атрибуции текста на основе статистики цифр». Журнал количественной лингвистики . 25 (3): 256–270. дои : 10.1080/09296174.2017.1371915 . S2CID 49692378 .
- Чжай, Ваньюэ; Русерт, Джонатан; Шафик, Зубайр; Шринивасан, Падмини (2022). «У девушки есть имя, и это… состязательное указание авторства для деобфускации». Материалы 60-го ежегодного собрания Ассоциации компьютерной лингвистики (Том 1: Длинные статьи) . стр. 7372–7384. arXiv : 2203.11849 . doi : 10.18653/v1/2022.acl-long.509 . S2CID 248780012 .
Дальнейшее чтение
[ редактировать ]См. также академический журнал Literary and Linguistic Computing , ныне Digital Scholarship in the Humanities (издается Оксфордским университетом ), и журнал Language Resources and Evaluation (ранее Computers and the Humanities ).