Jump to content

Гапакс легоменон

(Перенаправлено с Hapax legomena )
График частотности рангов слов в романе «Моби Дик» . Около 44% отдельного набора слов в этом романе, например «брачный», встречаются только один раз, как и hapax legomena (красный). Около 17%, например «ловкость», появляются дважды (так называемые дис легомены , выделены синим цветом). Закон Ципфа предсказывает, что слова на этом графике должны приближаться к прямой линии с наклоном -1.

В лингвистике hapax легомен ( / ˈ h æ p ə k s l ɪ ˈ ɡ ɒ m ɪ n ɒ n / также / ˈ h æ p æ ks / k или / ˈ h æ p æ s / корпусной ; [ 1 ] [ 2 ] пл. гапакс легомена ; иногда сокращается до hapax , множественное число hapaxes ) — слово или выражение , встречающееся только один раз в контексте: либо в письменных источниках целого языка , либо в произведениях автора, либо в отдельном тексте. Этот термин иногда неправильно используется для описания слова, которое встречается только в одном из произведений автора, но более одного раза в этом конкретном произведении. Hapax legomenon это транслитерация греческого ἅπαξ λεγόμενον , что означает «сказанное однажды». [ 3 ]

Связанные термины dis legomenon , tris legomenon и тетракис legomenon соответственно ( / ˈ d ɪ s / , / ˈ t r ɪ s / , / ˈ t ɛ t r ə k ɪ s / ) относятся к двойным, тройным или четверным вхождениям. , но используются гораздо реже.

Hapax legomena довольно распространены, как и предсказывает закон Ципфа . [ 4 ] который гласит, что частота любого слова в корпусе обратно пропорциональна его рангу в таблице частот. В больших корпусах от 40% до 60% слов составляют hapax legomena , а еще от 10% до 15% — dis legomena . [ 5 ] Таким образом, в Коричневом корпусе американского английского языка около половины из 50 000 отдельных слов являются hapax legomena внутри этого корпуса. [ 6 ]

Hapax legomenon относится к появлению слова или выражения в тексте, а не к его происхождению или распространенности в речи. Таким образом, оно отличается от одноразового слова , которое может никогда не быть записано, может найти распространение и может широко записываться или может появляться несколько раз в произведении, в котором оно создано , и так далее.

Значение

[ редактировать ]

Hapax legomena в древних текстах обычно трудно расшифровать, поскольку легче вывести значение из нескольких контекстов, чем из одного. Например, многие из оставшихся нерасшифрованных символов майя представляют собой hapax legomena , а библейские (особенно ивритские ; см. § Иврит ) hapax legomena иногда создают проблемы при переводе. Hapax legomena также создает проблемы при обработке естественного языка . [ 7 ]

Некоторые ученые считают Hapax legomena полезным для определения авторства письменных произведений. П. Н. Харрисон , в книге «Проблема пастырских посланий» (1921). [ 8 ] сделал hapax legomena популярным среди исследователей Библии их значительно больше , когда утверждал, что в трёх пастырских посланиях , чем в других посланиях Павла . Он утверждал, что количество hapax legomena в корпусе предполагаемого автора указывает на его словарный запас и характеризует автора как личность.

Теория Харрисона потеряла свое значение из-за ряда проблем, поднятых другими учеными. Например, в 1896 году У. П. Уоркман следующее количество hapax legomena обнаружил в каждом послании Павла :

Послание Полины Гапакс легомена
Послание к римлянам 113
Первое послание к Коринфянам 110
Второе послание к Коринфянам 99
Послание к Галатам 34
Послание к Ефесянам 43
Послание к Филиппийцам 41
Послание к Колоссянам 38
Первое послание к Фессалоникийцам 23
Второе послание к Фессалоникийцам 11
Первое послание к Тимофею 82
Второе послание к Тимофею 53
Послание к Титу 33
Послание к Филимону 5

На первый взгляд, последние три суммы (по пастырским посланиям) не отличаются от остальных. [ 9 ] Чтобы принять во внимание разную длину посланий, Уоркман также подсчитал среднее количество hapax legomena на странице греческого текста , которое колебалось от 3,6 до 13, как показано на диаграмме справа. [ 9 ] Хотя в пастырских посланиях больше hapax legomena на странице, Уоркман обнаружил, что различия умеренные по сравнению с различиями среди других посланий. Это подтвердилось, когда Уоркман просмотрел несколько , в пьес Шекспира которых были обнаружены схожие вариации (от 3,4 до 10,4 на страницу однотомного издания Ирвинга), как показано на второй диаграмме справа. [ 9 ]

Помимо личности автора, есть еще несколько факторов, которые могут объяснить количество hapax legomena в произведении: [ 10 ]

  • длина текста: это напрямую влияет на ожидаемое количество и процент гапакс легомен ; Краткость пастырских посланий также делает проблематичным любой статистический анализ.
  • тема текста: если автор пишет на разные темы, конечно, многие предметно-специфичные слова будут встречаться только в ограниченном контексте.
  • текстовая аудитория: если автор пишет сверстнику, а не студенту, или его супругу, а не работодателю, снова появится совершенно другой словарный запас.
  • время: с течением времени изменится как язык, так и знание и использование языка автором.

В конкретном случае пастырских посланий все эти переменные сильно отличаются от переменных в остальной части корпуса Павла, и hapax legomena больше не широко воспринимаются как убедительные индикаторы авторства; те, кто отвергает авторство Павла в Пасторалях, опираются на другие аргументы. [ 11 ]

Существуют также субъективные вопросы относительно того, являются ли две формы «одним и тем же словом»: собака против собак, подсказка против невежественной, знак против подписи; возникают и многие другие серые случаи. Еврейская энциклопедия указывает, что, хотя 1500 гапаксов в еврейской Библии , только около 400 явно не связаны с другими подтвержденными словоформами. [ 12 ]

Последняя трудность с использованием hapax legomena для определения авторства заключается в том, что среди произведений, о которых известно, что они принадлежат одному автору, существуют значительные различия, и разные авторы часто демонстрируют схожие значения. Другими словами, hapax legomena не является надежным индикатором. Исследования авторства теперь обычно используют широкий спектр показателей для поиска закономерностей, а не полагаются на отдельные измерения.

Информатика

[ редактировать ]

В области компьютерной лингвистики и обработки естественного языка (НЛП), особенно. В корпусной лингвистике и НЛП с машинным обучением принято игнорировать hapax legomena (а иногда и другие нечастые слова), поскольку они, скорее всего, не будут иметь особой ценности для вычислительных методов. Такое игнорирование имеет дополнительное преимущество, заключающееся в значительном сокращении использования памяти приложением, поскольку по закону Ципфа многие слова являются hapax legomena. [ 13 ]

Ниже приведены некоторые примеры hapax legomena в языках или корпусах .

арабский

[ редактировать ]

В Коране :

Китайский и японский

[ редактировать ]

Классическая китайская и японская литература содержит множество китайских иероглифов , которые встречаются в корпусе только один раз, и их значение и произношение часто теряются. Известные на японском языке как кого ( 孤語 ) , буквально «одинокие персонажи», их можно считать разновидностью хапакс легоменона . [ 15 ] Например, « Классик поэзии » ( ок. 1000 г. до н. э. ) использует иероглиф ровно один раз в стихе 「伯氏吹塤, 仲氏吹篪」 , и то только благодаря открытию описания Го Пу (276–276–276–276 гг.). 324 г. н.э.), что этот персонаж мог быть связан с определенным типом древней флейты.

Английский

[ редактировать ]
Слово « honorificabilitudinitatibus » в первом издании Уильяма Шекспира пьесы «Бесплодные усилия любви ».

Авторы довольно часто «выдумывают» новые слова, чтобы передать определенное значение или ради развлечения, без какого-либо предположения, что это «правильные» слова. Например, П.Г. Вудхауз и Льюис Кэрролл часто придумывали новые слова. Indexy ниже, по-видимому, является примером этого.

немецкий

[ редактировать ]
Муспилли, строка 57: «dar nimac denne mak andremo helpan uora demo muspille» ( Баварская государственная библиотека, Clm 14098, ф. 121r)

Древнегреческий

[ редактировать ]

По словам исследователя-классика Клайда Фарра , « В «Илиаде» 1097 hapax legomena , а в «Одиссее» — 868». [ 19 ] Однако другие определили этот термин по-другому и насчитали всего 303 в « Илиаде» и 191 в «Одиссее» . [ 20 ]

  • panaōrios ( παναώριος ), древнегреческое слово только один раз , означающее «очень несвоевременно», — одно из многих слов, которые встречаются в « Илиаде» . [ 21 ]
  • Греческий Новый Завет содержит 686 местных гапаксов легомен , которые иногда называют «новозаветными гапаксами». [ 22 ] 62 из них встречаются в 1 Петра и 54 — во 2 Петра . [ 23 ]
  • Эпиозион , который часто переводится на английский как «ежедневный» в Молитве Господней в Матфея 6:11 и Луки 11:3 , больше нигде не встречается во всей известной древнегреческой литературе.
  • Слово афедрон (ἀφεδρών) «уборная» в греческом Новом Завете встречается только дважды, в Матфея 15:17 и Марка 7:19, но поскольку широко распространено мнение, что автор Евангелия от Матфея использовал Евангелие от Марка как источника, его можно рассматривать как hapax legomenon . Его ошибочно переводили как «кишечник», пока надпись из Lex de astynomis Pergamenorum («Закон городских клерков Пергама ») не подтвердила, что это означает «уборная». [ 24 ] [ 25 ]

Число различных hapax legomena в еврейской Библии составляет 1480 (из 8679 использованных различных слов). [ 26 ] : 112  Однако из-за еврейских корней , суффиксов и префиксов только 400 являются «истинными» hapax legomena . [ 12 ] Полный список можно увидеть в » Еврейской энциклопедии статье « Hapax Legomena . [ 12 ]

Вот некоторые примеры:

  • Акут (אקוט – сражался) появляется в еврейской Библии только один раз, в Псалме 95:10.
  • Ацей Суслик (עֲצֵי-גֹפֶר – Дерево суслика ) упоминается один раз в Библии, в Бытии 6:14, в указании сделать Ноев ковчег «из дерева суслика». Из-за его единственного внешнего вида его буквальное значение теряется. Гофер – это просто транслитерация , хотя ученые предполагают, что подразумеваемое дерево – кипарис . [ 27 ]
  • Гвина (גבינה — сыр ) — hapax legomenon библейского иврита , встречающийся только в Иов 10:10. Это слово стало чрезвычайно распространенным в современном иврите .
  • Зехухит (זכוכית) — это hapax legomenon библейского иврита, встречающийся только в Иов 28:17. Слово происходит от корня זכה z-ch-h , что означает чистый/прозрачный, и относится к стеклу или кристаллу . В современном иврите оно означает «стекло».
  • Лилит (לילית) встречается один раз в еврейской Библии , в Исаии 34:14, где описывается запустение Эдома . Оно переводится несколькими способами. Следующий стих, Исаия 34:15, содержит еще один hapax legomenon , слово qippoz переводится как сова , стрела-змея и песчаная куропатка . (קִפוֹז), которое в разных версиях текста [ 28 ]

венгерский

[ редактировать ]
  • Слово ímés также упоминается в книге Иштвана Секели 1559 года под названием Chronica ez vilagnac ieles dolgairol . [ 29 ] Согласно теории историка литературы Сабо Гезы Сентмартони, это слово означает «полусонный». [ 30 ]

ирландский

[ редактировать ]

итальянский

[ редактировать ]

латинский

[ редактировать ]
  • Deproeliantis , причастие от слова deproelior , которое означает «яростно сражаться» или «яростно бороться», появляется только в 11 строке Оды Горация 1.9 .
  • Мактату , аблатив единственного числа от mactatus , что означает «из-за убийства». Оно встречается только в «De rerum natura Лукреция » .
  • Mnemosynus , предположительно означающий подарок на память или памятную записку , появляется только в стихотворении 12 « Катулла » Кармины .
  • Scortillum , уменьшительная форма, означающая «маленькая проститутка», встречается только в стихотворении 10 « Катулла » Кармины , строка 3.
  • Террикрепо , прилагательное, очевидно, относящееся к громовому ораторскому методу, встречается только в восьмой книге « Августина » Исповеди .
  • Romanitas , существительное, означающее «романизм», «римский образ жизни» или «римский образ жизни», появляется только в « Де Паллионе » Тертуллиана . [ 33 ] [ 34 ]
  • Арепо — потенциальное имя собственное, встречающееся только на площади Сатор . Его можно получить, написав оперу наоборот.
  • Эойгена — прилагательное, относящееся к солнцу и означающее «тот, кто родился на востоке». [ 35 ] [ 36 ] появляется только в эпиграфе, найденном в Кастелламмаре-ди-Стабия (древние Стабии ).

славянский

[ редактировать ]
  • Вытол (вытол) — hapax legomenon известного корпуса средневековых русских берестяных рукописей . Это слово встречается в надписи №. 600 из Новгорода , датировано ок. 1220–1240, в контексте « вытол пойман» (вытоло изловили, вытоло изловили ). По словам Андрея Зализняка , это слово больше нигде не встречается, и его значение неизвестно. [ 37 ] Предлагались различные интерпретации, например, личного имени или социального статуса человека. [ 38 ]

испанский

[ редактировать ]
  • Атафея — это hapax legomenon, появляющийся в пословице Бласко де Гарай в 16 веке ( «uno muere de atafea y otro la desea» ). Значение этого слова не было известно, и первоначально оно интерпретировалось как сытость. Современные этимологи связывают его с североафриканским арабским термином тафайя/аттатфиха, который означает рагу из лука и кориандра. [ 39 ]
  • Esi , которое, как полагают, происходит от латинского союза etsi «хотя», появляется только один раз в » Альваро де Луны ( « Virtuosas e claras mugeres 1446). [ 40 ]
[ редактировать ]

См. также

[ редактировать ]
  1. ^ «гапакс легоменон» . Оксфордский словарь английского языка (онлайн-изд.). Издательство Оксфордского университета . (Требуется подписка или членство участвующей организации .)
  2. ^ «гапакс легоменон» . Dictionary.com Полный (онлайн). nd
  3. ^ ἅπαξ . Лидделл, Генри Джордж ; Скотт, Роберт ; Греко-английский лексикон в проекте «Персей»
  4. ^ Пол Бейкер, Эндрю Харди и Тони МакЭнери, Глоссарий корпусной лингвистики , Издательство Эдинбургского университета, 2006, стр. 81, ISBN   0-7486-2018-4 .
  5. ^ Андраш Корнаи, Математическая лингвистика , Springer, 2008, стр. 72, ISBN   1-84628-985-8 .
  6. ^ Кирстен Мальмкьер, Лингвистическая энциклопедия. Архивировано 1 января 2020 г. в Wayback Machine , 2-е изд., Routledge, 2002 г., ISBN   0-415-22210-9 , с. 87.
  7. ^ Кристофер Д. Мэннинг и Хинрих Шютце, Основы статистической обработки естественного языка , MIT Press, 1999, стр. 22, ISBN   0-262-13360-1 .
  8. ^ П.Н. Харрисон. Проблема пастырских посланий . Издательство Оксфордского университета, 1921.
  9. ^ Перейти обратно: а б с Уоркман, «Hapax Legomena Святого Павла», Expository Times , 7 (1896:418), отмечено в Католической энциклопедии , св. «Послания к Тимофею и Титу» . Архивировано 8 апреля 2011 г. в Wayback Machine .
  10. ^ Стивен Дж. ДеРоуз. «Статистический анализ некоторых лингвистических аргументов относительно авторства пастырских посланий». Диссертация с отличием, Университет Брауна, 1982 г.; Терри Л. Уайлдер. «Краткая защита подлинности пастырских посланий». Среднезападный богословский журнал 2.1 (осень 2003 г.), 38–4. ( онлайн )
  11. ^ Марк Хардинг. Что говорят о пастырских посланиях? , Паулист Пресс, 2001, стр. 12. ISBN   0-8091-3975-8 , ISBN   978-0-8091-3975-0 .
  12. ^ Перейти обратно: а б с Статья о Hapax Legomena. Архивировано 19 октября 2012 г. в Wayback Machine в Еврейской энциклопедии . Включает список всех ветхозаветных hapax legomena по книгам.
  13. ^ Д. Джурафски и Дж. Х. Мартин (2009). Речевая и языковая обработка . Прентис Холл.
  14. ^ Орхан Даймонд. «История интерпретации Корана Хапакслегомены». Докторская диссертация, Венский университет, 2008 г., стр. 29.
  15. ^ Керр, Алекс (3 сентября 2015 г.). Потерянная Япония . Пингвин Великобритания. ISBN  9780141979755 . Архивировано из оригинала 1 июня 2022 г. Проверено 15 мая 2021 г.
  16. ^ «флотер» . Оксфордский словарь английского языка (онлайн-изд.). Издательство Оксфордского университета . (Требуется подписка или членство участвующей организации .)
  17. ^ «Исторический тезаурус::Поиск» . Historicalthesaurus.arts.gla.ac.uk . Архивировано из оригинала 28 октября 2017 г. Проверено 28 октября 2017 г.
  18. ^ Перейти обратно: а б «Странный мир гапакс-легоменона | Зритель» . Архивировано из оригинала 1 июня 2022 г. Проверено 4 ноября 2020 г.
  19. ^ Фарр, Клайд (1920). Гомеровский греческий, книга для начинающих . DC Heath & Co., Издательство. п. XXII.
  20. ^ Рис, Стив. «Hapax Legomena», в Маргалит Финкельберг (редактор), Энциклопедия Гомера (Оксфорд: Блэквелл, 2011) 330–331. Hapax Legomena в Homer. Архивировано 1 января 2020 г. в Wayback Machine.
  21. ^ ( Ил . 24.540)
  22. ^ например, Ричард Бокэм Еврейский мир вокруг Нового Завета: сборник эссе I, стр. 431, 2008 г.: «Новый Заветный хапакс, который встречается в Герме 19 раз...»
  23. ^ Джон Ф. Уолворд и Рой Б. Зак, Комментарий к познанию Библии: издание Нового Завета , Дэвид К. Кук, 1983, стр. 860, ISBN   0-88207-812-7 .
  24. ^ Г. Клаффенбах, Lex de astynomes Pergamenorum (1954).
  25. ^ Природа и функции воды, ванн, купания и гигиены из ... - Страница 252 Синтия Коссо, Энн Скотт - 2009 « Гюнтер Клаффенбах , «Астиноменская надпись Пергама», Трактаты Немецкой академии наук в Берлине. Класс языков, литературы и искусства 6 (1953), 3–25 взял на себя ответственность за предоставление полных, но строго филологических комментариев».
  26. ^ Цукерманн, Гилад (2020). Возрождение: от возникновения израильского языка к возрождению языка в Австралии и за ее пределами . Нью-Йорк: Издательство Оксфордского университета. ISBN  9780199812790 . Архивировано из оригинала 5 мая 2020 г. Проверено 30 апреля 2020 г.
  27. ^ «Ковчег, дизайн и размер»: Помощь в понимании Библии , Общество Сторожевой Башни, Библий и трактатов, 1971.
  28. ^ Блэр, Юдит М. (2009). Дедемонизация Ветхого Завета: исследование Азазеля, Лилит, Дебера, Кетеба и Решефа в еврейской Библии . Тюбинген, Германия: Мор Зибек. стр. 92–95. ISBN  9783161501319 .
  29. ^ Этюды к шестидесятилетию Гезы Сабо Сентмартони (на венгерском языке)
  30. ^ Тибор, Сёч. «Текстовые связи сказки о туруле в нашей средневековой письменной традиции. В: Исследования средневековья 6. Ред.: Петер Г. Тот, Пал Сабо. Сегед, 2010. 249-259» .
  31. ^ «Триады Ирландии» . www.smo.uhi.ac.uk. Архивировано из оригинала 9 апреля 2016 г. Проверено 28 января 2019 г.
  32. ^ "attuare в "Энциклопедии Дантески" " . www.treccani.it (на итальянском языке). Архивировано из оригинала 17 ноября 2018 г. Проверено 28 января 2019 г.
  33. ^ Льюис, Коннектикут и Шорт, К. (1879) Латинский словарь, Оксфордский университет, Clarendon Press, стр.1599.
  34. ^ «Тертуллиан: Де Паллио» . Архивировано из оригинала 4 марта 2016 г. Проверено 28 ноября 2015 г.
  35. ^ Глер, PGW (1968). Оксфордский латинский словарь. Оксфорд: Кларендон П., с. 611.
  36. ^ Sblendorio Cugusi MT CLE 428 с лат. Эогена Валентинианские филологические исследования, 2008, т. 1, с. 11, с. 327–350. (на итальянском языке).
  37. ^ Andrey Zaliznyak, Новгородская Русь по берестяным грамотам: взгляд из 2012 г. Archived 2018-11-03 at the Wayback Machine (The Novgorod Rus' according to its birch bark manuscripts: a view from 2012), transcript of a lecture.
  38. ^ А. Л. Шилов (A.L. Shilov), ЭТНОНИМЫ И НЕСЛАВЯНСКИЕ АНТРОПОНИМЫ БЕРЕСТЯНЫХ ГРАМОТ Archived 2017-11-07 at the Wayback Machine (Ethnonyms and non-Slavic anthroponyms in birch bark manuscripts)
  39. ^ «ГАПАКС» .
  40. ^ Родригес, Лола Понс. «Лингвистическая частота и грамматическая новизна. Предложения по гапаксу и изолированным формам с примерами из 15-го кастильского языка». Ибероромания 2013, вып. 78 (2013): 222–245.
  41. ^ «Холлис Фрэмптон в IMDB» . IMDB . Архивировано из оригинала 6 июня 2014 г. Проверено 14 апреля 2014 г.
  42. ^ «Победитель University Challenge Тед Лавдей: ответы я нашел в Википедии» . 15 апреля 2015 г. Архивировано из оригинала 29 октября 2020 г. Проверено 27 января 2020 г.
  43. ^ «Этот парень только что выиграл университетский конкурс с одним нелепым ответом» . 14 апреля 2015 года. Архивировано из оригинала 8 мая 2017 года . Проверено 26 апреля 2017 г. .
  44. ^ « Лучший участник университетского конкурса получил высокую оценку за сверхбыстрые ответы» . Ежедневное зеркало . 14 апреля 2015 г. Архивировано из оригинала 27 января 2020 г. . Проверено 27 января 2020 г.
  45. ^ sabotagetimes.com. Архивировано 15 октября 2015 г. в Wayback Machine ; youtube.com. Архивировано 11 апреля 2017 г. на Wayback Machine.
  46. ^ Архивировано в Ghostarchive и Wayback Machine : Всаусе; Стивенс, Майкл (15 сентября 2015 г.). «Тайна Зипфа» . Ютуб . Проверено 3 августа 2020 г.
  47. ^ «Происхождение прокрутки — NetHack Wiki» . Архивировано из оригинала 08 февраля 2021 г. Проверено 1 февраля 2021 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 96910a8c123afb98079158a8a59e9d97__1718467080
URL1:https://arc.ask3.ru/arc/aa/96/97/96910a8c123afb98079158a8a59e9d97.html
Заголовок, (Title) документа по адресу, URL1:
Hapax legomenon - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)