Корпуса древних текстов

Корпуса древних текстов — это вся совокупность текстов периода древней истории , определяемого в данной статье как период от начала письменности до 300 г. н.э. Эти корпуса важны для изучения литературы , истории , лингвистики и других областей и являются фундаментальным компонентом мирового культурного наследия .
Китайский , латынь и греческий являются примерами древних языков со значительными текстовыми корпусами, хотя большая часть этих корпусов известна нам посредством передачи (часто через средневековые рукописные копии), а не в их оригинальной форме . Эти тексты – как переданные, так и оригинальные – дают ценную информацию об истории и культуре различных регионов мира и веками изучались учеными и исследователями. Другие древние тексты – особенно каменные надписи и свитки папируса – были опубликованы после археологических исследований, в частности, клинописный корпус ок. 10 миллионов слов и c. 5 миллионов слов на древнеегипетском языке .
Благодаря достижениям в области технологий и оцифровки корпуса древних текстов стали более доступными, чем когда-либо прежде. Такие инструменты, как цифровая библиотека Персея и цифровой корпус санскрита. [1] облегчили исследователям доступ и анализ этих текстов.
Количественная оценка корпусов
[ редактировать ]Современным ученым известны два типа древних текстов — те, которые сохранились лишь в более молодых рукописях, но чей большой возраст не подлежит сомнению (это относится к основной массе китайской, брахмийской , греческой, латинской, еврейской и авестийской традиции), и те, которые известен по оригинальным надписям, папирусам и другим рукописям. [2]
Подсчет слов в каждом корпусе представляет собой значительные методические проблемы – в принципе каждое отдельное появление слова в тексте учитывается отдельно, но в случае параллельной передачи художественных текстов учитывается только одна передача. Подобно тому, как Книга Мертвых и гробовые тексты включаются в число, данное для египетских, только один раз, так и греческие и латинские литературные произведения следует учитывать только по одной рукописи. С другой стороны, если гробницы, царские надписи или экономические документы на некоторых древних языках часто имеют более или менее идентичную форму, это не оценивается как чисто «параллельная традиция». Присоединенные предлоги считаются отдельными словами, за исключением определенного артикля на иврите, арамейском и греческом языках, поскольку он не имеет эквивалента в большинстве языков, поэтому его частота существенно повлияет на сопоставимость чисел. [2]
Языки с известными оценками размера
[ редактировать ]Скрипт | Язык | Использованные даты | Количество текстов до 300 г. н. э. | Количество слов до 300 г. н.э. | Ссылка. | ||
---|---|---|---|---|---|---|---|
Археологический | Передача инфекции | Общий | |||||
Египетские иероглифы / Иератика | Египетский | 5,000,000 | никто | 5,000,000 | [3] [4] | ||
Демотический | 1,000,000 | никто | 1,000,000 | [5] | |||
Греческий ( Древнегреческая литература , Новый Завет , Отцы Церкви и др.) | 57,000,000 | [6] [7] | |||||
латинский | 10,000,000 | [8] [7] | |||||
клинопись | аккадский | 144,000 [9] | 9,900,000 [9] | никто | 9,900,000 | [10] | |
шумерский | 102,300 [11] | 3,076,000 [11] | никто | 3,076,000 | [12] | ||
хурритский | 12,500 | никто | 12,500 | [13] | |||
Урартский | 400 | 10,000 | никто | 10,000 | |||
хеттский | 700,000 | никто | 700,000 | [14] | |||
Хаттик | 500 | никто | 500 | [15] | |||
Клинопись лувийский | 3000 | никто | 3000 | [16] | |||
Эламит | 2,087 | 100,000 | никто | 100,000 | [17] | ||
Прото-эламский | 1,435 | 20,000 | никто | 20,000 | [18] | ||
Эблаите | 16,000 | 300,000 | никто | 300,000 | [19] | ||
аморей | 7,000 | 11,600 | никто | 11,600 | [20] | ||
Угаритовый | 40,000 | никто | 40,000 | [21] | |||
Старый персидский | 7,000 | 100,000 | 107,000 | [22] | |||
Ханаанский и арамейский | Древний иврит (включая еврейскую Библию ) | 35,000 | 265,000 | 300,000 | [23] [24] | ||
Арамейский (древний, имперский, библейский, хасмонейский, набатейский, пальмиренский) | 100,000 | [25] | |||||
финикийский/пунический | 10,000 | 68 [26] | [27] [28] [29] | ||||
Старый южноаравийский | 10,500 | 112,500 | никто | 112,500 | [30] [31] | ||
Этрусский | 25,000 | 25,000 | [32] [33] |
Южная Азия
[ редактировать ]- Санскрит ( ведический санскрит и классический санскрит )
- Индское письмо (3800 элементов, около 20 000 символов) [34]
- сценарий Брахми
- Старый тамильский
- Ранняя индийская эпиграфика и индийская эпическая поэзия
- Харости [35]
- Палийская литература [36]
- Список исторических индийских текстов
Мезоамериканский
[ редактировать ]Восточноазиатский
[ редактировать ]- Старый китайский
- Китайская классика
- Корпус до Цинь: собрание древних китайских текстов, написанных до династии Цинь (221 г. до н.э.). Корпус включает в себя тексты конфуцианства , даосизма , легизма и других школ мысли .
- Доханьский корпус: собрание древних китайских текстов, написанных до династии Хань (202 г. до н.э.). Корпус включает тексты конфуцианства, даосизма, легизма и других школ мысли.
- См. проект китайского текста.
- Китайские бронзовые надписи , письмо оракула на костях , письмо печати , канцелярское письмо
Центральноиранские языки
[ редактировать ]- До 300 г. н.э. центральноиранские языки представлены в основном в форме сасанидских каменных надписей на двух тесно связанных идиомах среднеперсидского языка ( скрипты Пехлеви и письменный парфянский язык ), [37] В корпусе среднеперсидского языка (в основном III, но также и в IV/V веках) насчитывается 5000 слов, а в корпусе парфянского языка (III век) — 3000 слов. Трудно оценить , в какой степени некоторые манихейские среднеперсидские литературные тексты могут быть датированы III веком; Говорят, что Мани лично написал Шабураган. [38] всего около 5000 слов. В любом случае, если объединить среднеперсидский и парфянский языки, мы получим более 10 000 слов. [39]
Протосинайский
[ редактировать ]- Протосинайское письмо насчитывает не более 400 букв (количество слов неизвестно, поскольку письмо не полностью интерпретировано). [40] В аналогичной степени, вероятно, существуют примерно одновременные протоханаанские надписи (там же). [41]
Анатолийский
[ редактировать ]- Лувийская клинопись , [42] ок. 3000 слов [43]
- палайский язык [44] несколько сотен слов. [43]
- Иероглифический лувийский [45] [43]
- Ликийский алфавит (наиболее подтвержденный анатолийский язык-преемник, написанный алфавитным письмом) [46] около 5000 слов [43]
- Лидийский алфавит [47] 109 надписей объемом около 1500 слов. [43]
- Фригийский алфавит и надгробные надписи II и III веков нашей эры. [48] (ок. 1000 слов) и в так называемых «старых фригийских» надписях [49] менее 300 слов [43]
- Карийские алфавиты [50] чьи тексты, в основном из Египта, содержат около 600 слов. [43]
Старый курсив
[ редактировать ]- умбрийский язык [51] в основном засвидетельствовано жертвенными инструкциями Таблиц Игувина, состоящими из 5000 слов. [52]
- осканский язык (там же) с 2000 словами [52]
- мессапический язык [53] вероятно, около 1000 слов (оценка затруднительна, поскольку в большинстве текстов на этом труднопонятном языке не используются разделители слов) [52]
- Венетический язык [54] несколько сотен слов [52]
- Фалисканский язык [55] несколько сотен слов [52]
- Цизальпийские кельтские надписи насчитывают около 2000 слов, к которым добавлен ряд толкований классических авторов. [56] [52]
Иберия
[ редактировать ]- Иберийское письмо , реже написанное греческой или латинской графикой, ок. 2500 слов [52] [57]
- Кельтиберийское письмо , которое относится к свидетельствам кельтского языка на иберийском языке, а также к латинскому алфавиту из Испании (около 1000 слов). [52] [57]
- Юго-западное палеоиспанское письмо , 78 надписей, несколько сотен слов. [52] [57]
- Лузитанский язык , три памятника латинской графикой, ок. 60 слов [52] [57]
Германская Северная Европа
[ редактировать ]- Рунические надписи, датированные до IV века, насчитывают около 30 штук, которые содержат в общей сложности не более 50 слов. [58] [59]
Африка
[ редактировать ]- Сценарий геэз : сравнительно небольшое количество надписей общим объемом около 1000 слов до 300 г. н.э. [60] После христианизации в IV веке стали известны более обширные тексты. [59]
- Либико-берберский алфавит : более 1000 надписей из Магриба , [61] которые датируются римскими временами . В большинстве текстов не используется разделитель слов; По оценкам Пеуста, общее количество слов может составлять около 5000. [59]
- Мероитское письмо (древний нубийский ): известно около 900 текстов, которые, по оценкам Пейста, могут содержать примерно 10 000 слов, хотя и с неопределенностью из-за того, что разделитель слов не используется последовательно в мероитском письме. [62] [59]
Эгейское море
[ редактировать ]- Критские надписи линейного письма А, которые до сих пор не расшифрованы [63] доступны примерно в 2500 текстах, которые содержат в общей сложности около 20 000 символов. Общее количество слов определить практически невозможно; Пеуст ориентировочно отнес его к тому же порядку, что и в меройском. [59]
- Помимо текстов линейного письма А, встречаются также надписи критскими иероглифами в несколько сотен знаков. [64] и тексты, написанные греческим алфавитом, но не на греческом, состоящие из нескольких десятков слов. [65] [59]
- Кипрское слоговое письмо первого тысячелетия до нашей эры, в котором записывались преимущественно греческие тексты. [66] Соответствующие тексты содержат от 100 до 200 слов. [59]
Микрокорпорации
[ редактировать ]Существует значительное количество древних микрокорпусных языков. Оценить общее количество засвидетельствованных древних языков может быть так же сложно, как и оценить размер их корпуса. Например, греческие и латинские источники передают огромное количество иноязычных толкований, серьезность которых не всегда очевидна. [59]
Сохранение и курирование
[ редактировать ]Историческое сохранение и поддержание корпусов древних текстов сопряжено с рядом проблем, включая проблемы с сохранением, переводом и оцифровкой. Многие древние тексты со временем были утеряны, а те, что сохранились, могут быть повреждены или фрагментированы. Перевод древних языков и письменностей требует специальных знаний, а оцифровка текстов может занять много времени и ресурсов.
Корпусная лингвистика
[ редактировать ]Область корпусной лингвистики изучает язык, выраженный в текстовых корпусах. Это включает в себя анализ частоты слов, словосочетаний, грамматики и семантики. Корпуса древних текстов представляют собой ценный ресурс для исследований в области корпусной лингвистики, позволяя ученым изучать эволюцию языка и культуры с течением времени.
См. также
[ редактировать ]- Список языков по первому письменному сообщению
- Список корпусов текстов
- Список самых старых документов
- Древняя литература
Ссылки
[ редактировать ]- ^ «Цифровой корпус санскрита (DCS) — онлайн-словарь санскрита и аннотированный корпус» . www.sanskrit-linguistics.org . Архивировано из оригинала 3 июня 2023 г. Проверено 3 июня 2023 г.
- ^ Jump up to: а б Пеуст 2000 , стр. 252–253.
- ^ Карстен Пеуст, « О египетской лексикографии. 1: О лексиконе Птолемея Пенелопы Уилсон; 2: Попытка количественного сравнения текстовых корпусов древних языков. Архивировано 16 апреля 2023 г. в Wayback Machine », в Lingua Aegyptia. 7, 2000: 245-260: «Согласно оценке В. Шенкеля, опубликованной В. Ф. Рейнеке в S. Grunert & L Hafemann (ред.), Textcorpus and Dictionary (Problemeder Egyptology 14), Leiden 1999, p.xiii, число текстов во всех известных египетских (т. е. иероглифических и иератических) текстах насчитывает около 5 миллионов, а если считать случаи многократной передачи «Книги Мертвых» и гробовых текстов по отдельности, то стремится к 10 миллионам Берлинского карточного архива; словарь египетского языка А. Эрмана и Х. Грапова (ВБ), который в то время стремился к полноте, включает «всего» 1,7 миллиона (по другим данным: 1,5 миллиона) листов бумаги». (стр.246)
- ^ В. Шенкель (1995). «Лексикография древнеегипетско-коптского языка». Лексикография древних ближневосточных языков (PDF) . Верона: Эсседу. п. 197. ИСБН 88-85697-43-7 . ОСЛК 34816015 . Архивировано (PDF) из оригинала 30 апреля 2023 г. Проверено 5 мая 2023 г.
- ^ Чикагский демотический словарь , в котором демотические тексты были опубликованы в период с 1955 по 1979 год, за исключением определенного и неопределенного артиклей и суффиксальных местоимений (JH Johnson в S. Grunert & L Hafemann, Textcorpus und Handbuch, Leiden 1999, p. . 243), произвел более 200 000 опечаток (Р. К. Ритнер у С. П. Влиминга, Аспекты демотической лексикографии, Левен, 1987, стр. 145). Пеуст утверждает, что это представляет собой лишь часть от общего числа известных демотических текстов, которые могут содержать около миллиона слов.
- ^ Словарь греческого языка полностью записан в Thesaurus Linguae Graecae , который ранее был опубликован на CDRom Калифорнийским университетом в Ирвайне . Доступная в настоящее время версия E, в которую полностью включены все тексты до 600 г. н. э. и избранные византийские тексты следующей эпохи, в общей сложности составляет около 76 миллионов текстовых слов. В 1985 году, когда авторы до 400 г. н. э. были в основном разбросаны (2700 авторов), но только 200 авторов периода после 400 г. Авторы и труды, Нью-Йорк, 1986, стр. xii f.). Даже если словарный запас текстов до 300 г. н.э. все же должен быть несколько меньшим, и мы также хотим вычесть многочисленные примеры греческого определенного артикля, мы все равно можем четко заявить, что греческий язык является наиболее сохранившимся древним языком в рамках наших спецификаций. . Этот корпус также содержит сочинения отцов церкви, написанные на греческом языке.
- ^ Jump up to: а б Ди, Джеймс Х. (2002). «Первая загружаемая база данных частотных слов классической и средневековой латыни» . Классический журнал . 98 (1). Классическая ассоциация Ближнего Запада и Юга: 59–67. ISSN 0009-8353 . JSTOR 3298278 . Архивировано из оригинала 5 мая 2023 г. Проверено 5 мая 2023 г.
Все эти частотные подсчеты взяты из гораздо более широкого разнообразия тем и стилей, чем существует для классической или средневековой латыни, и поскольку объем печатной и устной продукции на любом современном языке ошеломляюще огромен, их авторы прилагают большие усилия, чтобы выбрать «репрезентативного» языка. корпусов в поисках статистически значимых данных. Совсем иначе обстоят дела на латыни, где для классического периода сохранилась масса литературы, оцениваемая не более чем в 9 миллионов слов, тогда как корпус классической греческой литературы обычно оценивается «всего лишь» в десять раз больше».
- ^ Пеуст утверждает, что Thesaurus Linguae Latinae содержит от 9 до 10 миллионов слов. В Thesaurus Linguae Latinae есть все тексты до 150 г. н.э. полностью, а более поздние тексты до 600 г. н.э. выборочно (W. Ehlers, Der Thesaurus Linguae Latinae, in Antiquity and Occident 14, 1968, 172ff.) с девятью (по другим источникам: десять ) миллион промахов. Даже если словарь латыни до 300 года нашей эры еще точно не определен, должно быть ясно, что он превосходит египетский, но уступает греческому. Однако эмпирическое правило, часто слышимое среди филологов-классиков, о том, что греческих текстов в десять раз больше, чем латинских, преувеличено, по крайней мере, если принять за основу наш временной предел — 300 г. н.э.
- ^ Jump up to: а б Стрек 2010 , с. 54.
- ^ По оценкам Пеуста > 10 000 000, заявив, что оценить разрозненный опубликованный корпус этого языка чрезвычайно сложно. Как и Thesaurus Linguae Latinae и Египетский словарь, Чикагский ассирийский словарь («ассирийский» означает аккадский язык в целом, а не только его ассирийский диалект) начался с систематической фрагментации текста. Когда в 1948 году было достигнуто 1 249 000 ошибок, систематическая возня была прекращена и индекс был расширен только за счет включения избранных ошибок, так что к 1964 году от 1 500 000 до 1 750 000 записей собрались вместе (IJ Gelb в CAD Vol. А 7, Чикаго, 1964, стр. xvi). Однако, по моему мнению, это должна быть лишь часть всего аккадского материала. Говорят, что ассириолог С. Н. Крамер подсчитал, что существовало 500 000 клинописных табличек (большая часть клинописных текстов написана на аккадском языке). Также представляет интерес оценка А.Л. Оппенгеймса, Ancient Mesopotamia, Chicago 21977, p. 17f., что найденная в Ниневии частная библиотека Ассура Банипалса содержала от 1200 до 1500 табличек, число строк которых «вероятно достигало бы, если не превосходило бы по объему, даже размера Махабхараты с ее 190 000 стихами». Сохранилось и опубликовано гораздо меньше половины этой библиотеки, но с другой стороны, текстов, конечно, гораздо больше, чем в библиотеке Ашшурбанипала. Вместо конкретного числа я хотел бы в заключение предположить, что корпус аккадского языка может быть порядка латинского.
- ^ Jump up to: а б Стрек 2010 , с. 53.
- ^ Шумерский корпус трудно оценить. Согласно В. Саллабергеру и А. Вестенхольцу, Месопотамия: период Аккаде и период Ура III, приближения 3, Фрайбург/Шв. 1999 (ОБО 160/3), с. 128, чуть менее 40 000 административных и юридических документов периода Ура III, опубликованных на сегодняшний день, каждый из которых может содержать в среднем от 20 до 30 слов, что составляет миллион словоформ. Однако общий объем, вероятно, останется ниже, чем у египетских текстов.
- ^ «Наиболее засвидетельствованным из этих языков является хурритский, который не имеет отношения к хеттскому. Ранее опубликованные тома (1,2, 4, 5, 7, 9) корпуса памятников хурритского языка, опубликованные В. Хаасом, содержат хорошие 10 000 хурритских слов MitannikönigsTusrattaanAmenophisITI (изд.Й.Фридрих, Памятники азиатского языка, Берлин 1932, стр. 8 и след.) с ок. рассматриваться как преемник хурритского языка.
- ^ "1980 г. 600 000 слов = 90% текстового материала, потраченного впустую на chD. Среди клинописных языков хеттский, известный по большей части благодаря текстам из Богазкоя, старой столицы Хеттской империи, занимает третье место. Индекс коробки Чикагского хеттского словаря содержали более 600 000 учетных карточек в 1980 году, когда в них полностью увязло «более 90 процентов» текстов, опубликованных к тому моменту (HG Güterbock & HA Hoffner, The Hittite Dictionary, Vol. 3/1 [ L ], Chicago 1980, p. xv). В текстовом материале из Богазкой также засвидетельствовано несколько региональных языков из хеттской сферы влияния, в основном в виде хеттских иностранных языков-билингвов религиозного содержания или в форме ино- языковые отрывки перемежаются с хеттскими ритуальными текстами.
- ^ «Еще один богазкойский язык, который до сих пор почти не понятен, — хаттский. Общая масса известного хаттского текстового материала не должна превышать нескольких тысяч слов (тексты под редакцией Дж. Клингера, Studien zur Reconstruction of the Hattic Cult Layer, Wiesbaden 1996 содержат около 500 слов); это число будет легче определить, как только будет опубликован объявленный сборник текстов на хаттском языке Х. Оттена и Ч. Рюстера (StBo 37).
- ^ несколько сотен « глоссальных слов», см. В хеттских текстах вкраплено Гютербок, Х.Г. (1956). «Заметки о лувийских исследованиях (A propos Book B. Rosenkranz') . Orientalia . 25 (2). GBPress-Gregorian Biblical Press: 120ff. ISSN 0030-5367 . JSTOR 43581480. Проверено Архивировано из оригинала 01 мая 2023 г. 01.05.2023 .
- ^ 2087 табличек Персеполя + королевские надписи и т. д. Это число разделил Ричард Хэллок в своей публикации «Таблеты укрепления Персеполя» . Многие другие панели до сих пор не опубликованы. См. Мэтью Столпера, архивированные 14 февраля 2007 г. в Wayback Machine : «Там было от 15 000 до 30 000 или более табличек и фрагментов. Большинство (тысячи табличек и десятки тысяч фрагментов) были написаны на эламском языке клинописью. " Это малоизвестный, но сравнительно хорошо изученный клинописный язык эламитов, используемый в Персии. Подсчет наиболее важных публикаций дает следующий результат: RT Hailock, Persepolis Fortification Tables, Chicago 1969, 2087 г., глиняные таблички, содержащие около 50 000 слов (кроме того, многие таблички остались неопубликованными); FW King, [sc. доахеменидские] Эламские королевские надписи, Грац, 1965 г., ок. 10000 слов; Ф. Х. Вайсбах, Die Keilinschriften der Achaemeniden, Лейпциг, 1911 г., ок. 5000 слов; Дж. К. Кэмерон, Казначейские таблички Персеполя, Чикаго, 1948 г., около 5000 слов. Если учесть все эламские материалы, опубликованные на данный момент, то получится около 100 000 слов.
- ^ "c после Englund 1998, примечание 22. 8: 1450 опубликованных текстов из Суз и 146 неопубликованных текстов. Сюда не входят 1435 известных текстов, написанных прото-эламским письмом, которые были расшифрованы лишь частично. Панели Бенена третьего тысячелетия (изд. .P.Meriggi, Lascrituraproto-elamica, 3 тома, Roma 1971/4), которые содержат около 20 000 знаков, большинство из которых можно прочитать логографически.
- ^ 2436 полных панелей, 13947 фрагментов разного размера. По И.Самиру, разбивку фрагментов по размерам см. в приложении 1 ниже к Национальному музею Сирии, Идлиб. Пеуст предполагал наличие 1800 табличек и 15 000 фрагментов. Самый древний из известных семитских языков — эблаитский, относящийся к третьему тысячелетию, открытый только в 1970-х годах, из которых было найдено 1800 неповрежденных, часто довольно обширных глиняных табличек и около 15 000 фрагментов (G.Pettinato, Catalogo dei testi cuneiformi di Tell Mardikh-Ebla, Неаполь 1979, стр. xvi f. ( ASIN B004HZDL5K )). Примерно 3000 статей, опубликованных на сегодняшний день (Г. Конти, Индекс опубликованных или цитируемых эблаитских текстов, Firenze 1992), должны содержать около 300 000 слов.
- ^ 7000 личных имен + 90 безопасных заимствований, согласно Стрек, член парламента (2000). Амурритский ономастикон древневавилонского периода . Древний Ближний Восток и Ветхий Завет (на немецком языке). Издательство «Угарит». п. 135. ИСБН 978-3-927120-87-7 . Архивировано из оригинала 14 мая 2023 г. Проверено 14 мая 2023 г.
- ^ «Угаритские клинописные алфавитные тексты, собранные в книге М. Дитриха и др., The Cuneiform Alphabetic Texts, Munster 21995, содержат около 40 000 слов. Существует также незначительное количество угаритских глосс, написанных слоговой клинописью.
- ^ Древнеперсидские клинописные надписи (изд. Р.Г.Кент, Древнеперсидский, Нью-Хейвен, 1953) содержат около 7000 слов; лингвистически близкие тексты Авесты (под ред. К. Ф. Гельднера, Авеста, 3 тома, Штутгарт, 1896), сохранившиеся лишь в недавних рукописях, содержат около 100 000 слов.
- ^ Пеуст следует оценкам Клинса (см. следующую ссылку), согласно которым общее количество древнееврейских слов составляет 353 396, исходя из суммы 305 500 слов еврейской Библии , плюс 38 349 слов из свитков Мертвого моря , 7 020 слов из апокрифической книги. Сираха и 2528 слов из надписей . Затем Пеуст вычитает 34 622 экземпляра определенного артикля ה־ ha- и отмечает, что можно также спорить о 62 760 падежах ו «и», которое грамматически грамматически выражено в иврите особым образом , и приходит к выводу, что с поправкой на эти цифры корпус древнееврейского языка составляет порядка 300 000 слов.
- ^ Клайнс, DJA (1993). Словарь классического иврита: Алеф . Шеффилд Академик Пресс. п. 28. ISBN 978-1-905048-75-5 . Архивировано из оригинала 14 мая 2023 г. Проверено 14 мая 2023 г.
[Таблица: Библейские: BHS 305500; Небиблейские: Бен Сир 7020, Кумран 38349, Инскр 2528; Всего 353396] Приведенная выше статистика размера различных корпусов еврейских текстов была получена следующим образом. Из итоговых данных в таблице «Слова, начинающиеся с алеф в порядке частоты» видно, что мы выявили 61 883 вхождения слов в еврейской Библии (Biblia hebraica stuttgartensia), начинающихся с алеф. Зная, что в еврейской Библии около 305 500 слов (цифра взята из работы Фрэнсиса И. Андерсена и А. Дина Форбса, Словарь Ветхого Завета [Рим: Папский библейский институт, 1989], стр. 23), мы можем предположить, что что, грубо говоря, 1422 появления слов Алеф в Бен Сира подразумевают текст ок. 7020 слов (т.е. 1422, разделенные на 61833 и умноженные на 305500). Точно так же общее количество 7768 случаев в Кумране и связанных с ним материалах предполагает корпус ок. 38 300 слов (то есть в уже опубликованных небиблейских текстах).
- ^ Пеуст пишет, что корпус арамейского языка разбит на множество диалектов:
- Старые арамейские надписи первой половины первого тысячелетия до нашей эры ( Kanaanäische und Aramäische Inschriften ), содержащие около 4000 слов.
- Основные императорские арамейские документы происходят из Египта ( Учебник арамейских документов Древнего Египта ; первые три тома содержат около 20 000 слов), но они также сохранились во многих других надписях и документах. Имперский арамейский язык также включает арамейский текст Папируса Амхерста 63 , написанный египетско-демотическим письмом, который должен содержать около 3000 слов.
- Арамейские отрывки Ветхого Завета («библейский арамейский язык», особенно Книги Даниила, главы 2–7 и Книга Ездры 1: 2–4, 4: 8–16, 4: 17–22, 5: 7–17). , 6:3–5, 6:6–12, 7:12–26) тесно связаны с императорским арамейским языком и содержат добрых 5000 слов.
- Хасмонея, который встречается прежде всего в апокрифах и Таргуме в свитках Мертвого моря , но также засвидетельствован в иудейских документах ( Бейер, Клаус (1984). Арамейские тексты Мертвого моря (на немецком языке). Ванденхук и Рупрехт. стр. 157–318. ISBN 978-3-525-53571-4 . ); Всего 15 000 слов.
- Набатейцы и Пальмирены засвидетельствованы примерно в 1000 могильных и вотивных надписях каждая.
- ^ Грей, Луи Х. (1923). «Пунические отрывки в «Поэнуле» Плавта» . Американский журнал семитских языков и литератур . 39 (2). Издательство Чикагского университета: 73–88. дои : 10.1086/369974 . ISSN 1062-0516 . JSTOR 528483 . S2CID 170454820 . Архивировано из оригинала 5 мая 2023 г. Проверено 5 мая 2023 г.
- ^ Пеуст утверждает, что корпус финикийского языка, включая пунический per Kanaanäische und Aramäische Inschriften (KAI), составляет около 10 000 слов, но это противоречит другим оценкам в 10 000 текстов во всем корпусе. КАИ содержит подборку текстов, а не полный корпус.
- ^ Доук, Брайан Р. (26 августа 2019 г.). Оксфордский справочник по финикийскому и пуническому Средиземноморью . Издательство Оксфордского университета. п. 223. ИСБН 978-0-19-049934-1 .
По большинству оценок, это около десяти тысяч текстов. Подавляющее большинство доказательств составляют тексты, которые либо шаблонны, либо чрезвычайно кратки.
- ^ Леманн, Рейнхард Г. (2013). «Вильгельм Гезениус и подъем финикийской филологии». Библейская экзегеза и еврейская лексикография . стр. 209–266. дои : 10.1515/9783110267044.209 . ISBN 978-3-11-026612-2 . Цитата: «Почти двести лет спустя репертуар финикийско-пунической эпиграфики насчитывает около 10 000 надписей со всего Средиземноморья и его окрестностей».
- ^ Корпус староарабских языков опубликован в разрозненных публикациях, и его трудно исследовать. Старые компиляции Corpus Inscriptionum Semiticarum (и RES) содержат около 3000 текстов, содержащих более 50 000 слов, хотя (небольшая) часть этих текстов датируется после 300 г. н.э. Таким образом, теперь можно предположить, что запас слов превышает 100 000 слов. Старые южноарабские тексты в основном написаны на сабейском языке, но также и на других языках, таких как письменный на минейском, катабанском и хадрамаутском языках, хотя атрибуция некоторых более коротких памятников остается неопределенной.П. Штейн заявил в 2007 году, что было 10 500 надписей, в то время как Пеуст заявил о 8 000 надписей в 2000 году. По словам Штейна, тексты разделены следующим образом: сабейские: 5 300 текстов; Катабан: 2000; Минейцы: 1200, Хадрамитяне: 1500; другое/неопределенно: 500. Корпус будет пополняться за счет палочек для еды, которые будут публиковаться постепенно. П. Штайн в 2007 году также оценил количество слов в 112 500 по сравнению с оценкой Пеуста в 100 000 слов. По словам Штейна, слова делятся следующим образом: сабейский: 85 000 слов; Катабан: 11 000; Минейцы: 11 000; Хадрамиты: 5000; другое: 500.
- ^ Рикманс, Дж.; Мюллер, WW; Аллах, YMA (1994). Тексты из Древнего Йемена. Надпись на дереве . Institut Orientaliste Louvain: Публикации Института востоковедения Лувена (на французском языке). Католический университет Лувена, Институт востоковедения. ISBN 978-2-87723-104-6 . Архивировано из оригинала 5 мая 2023 г. Проверено 5 мая 2023 г.
Но основные данные дают более 8000 монументальных надписей, текст которых тщательно выгравирован на камне или отлит в бронзе.
- ^ Количественно наиболее подтвержденный язык древней Италии после латыни - этрусский. Корпус, составленный Гельмутом Риксом, насчитывал несколько тысяч, почти все очень короткие тексты общим объемом около 25 000 слов.
- ^ Рикс, Хельмут (1991). Этрусские тексты: Editio Minor (на немецком языке). Тюбинген: Г. Нарр. ISBN 3-8233-4240-1 . ОСЛК 25336064 .
- ^ Рао, Раджеш П.Н.; Ядав, Ниша; Вахия, Маянк Н.; Джоглекар, Хришикеш; Адхикари, Р.; Махадеван, Ираватам (18 августа 2009 г.). «Марковская модель индийского письма» . Труды Национальной академии наук . 106 (33): 13685–13690. Бибкод : 2009PNAS..10613685R . дои : 10.1073/pnas.0906237106 . ISSN 0027-8424 . ПМК 2721819 . ПМИД 19666571 .
- ^ Лексикография языка гандхари. Архивировано 8 апреля 2023 г. в Wayback Machine , Akademie Aktuell, том 2013 - выпуск № 44, 44-47: «С момента публикации статьи Бейли материальная основа для Гандха-ри - Лексикография многократно выросла благодаря обширным новым открытиям рукописей, а также надписей, административных документов и монет: Созданный нами каталог текстов Га-ндха-ри ( http://gandhari.org/. Архивировано 5 декабря 2013 г.). в каталоге Wayback Machine ) в настоящее время насчитывает 77 обширных свитков, 330 фрагментов рукописей, 834 надписи, 792 документа ния и 335 различных легенд о монетах с оценочным общим текстовым запасом в 120 000 слов».
- ^ Кингсбери, П. (2002). Хронология Палийского канона: случай аористов . Пенсильванский университет. ISBN 978-0-493-92911-8 . Проверено 03 мая 2023 г.
Ранний буддийский канон, написанный на пали, включает около 4 миллионов слов текста, написанного на протяжении нескольких столетий в ранней Индии. Таким образом, он представляет интерес не только для исследователей буддизма, но также для лингвистов и историков, поскольку дает представление о социальной, языковой и религиозной культуре того времени.
- ^ Жиньу, П. (1972). Corpus Inscriptionum Ираникарум: Словарь надписей pehlevies et parthes (на французском языке). Школа восточных и африканских исследований. Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г.
- ^ Маккензи, Д.Н. и Мани. «Шабухраган Мани». Бюллетень Школы восточных и африканских исследований Лондонского университета 42, вып. 3 (1979): 500–534. http://www.jstor.org/stable/615572. Архивировано 5 мая 2023 г. в Wayback Machine .; и «Шабухраган Мани-II». Бюллетень Школы восточных и африканских исследований Лондонского университета 43, вып. 2 (1980): 288–310. http://www.jstor.org/stable/616043. Архивировано 8 октября 2022 г. в Wayback Machine и Хаттер, М. (1992). Космогонические тексты Шабухрагана Мани: Издание, комментарии и литературно-историческая классификация манихейско-среднеперсидских рукописей M 98/99 I и M 7980-7984 . Исследования восточных религий (на немецком языке). Отто Харрасовиц. ISBN 978-3-447-03227-8 . Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г.
- ^ Пеуст 2000 , стр. 257–258.
- ^ Сасс, Бенджамин (1988). Генезис алфавита и его развитие во втором тысячелетии до нашей эры . Висбаден: В комиссии О. Харрасовица. ISBN 3-447-02860-2 . OCLC 21033775 .
- ^ Пеуст 2000 , стр. 257.
- ^ Старк, Фрэнк (1985). Клинописные лувийские тексты в транскрипции (на немецком языке). Висбаден: О. Харрасовиц. ISBN 3-447-02349-Х . ОСЛК 12170509 .
- ^ Jump up to: а б с д и ж г Пеуст 2000 , стр. 255.
- ^ Карруба, О. (1970). Палайский . Исследования по Богазкойским текстам; ред. из Комиссии по Древнему Востоку Академии наук и литературы, выпуск 10 (на немецком языке). Харрасовиц. ISBN 978-3-447-01283-6 . Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г.
- ↑ Соответствующий корпус иероглифических лувийских надписей был опубликован Х. Камбелем после статьи Пеуста.
- ^ Титулы Малой Азии: Титулы Ликии, написанные на ликийском языке . РМ Рорер. 1901 г. и Нойманн, Г. (1979). Новые открытия ликийских надписей с 1901 года . Меморандумы (Австрийская академия наук. Философско-исторический класс) (на немецком языке). Издательство Австрийской академии наук. ISBN 978-3-7001-0283-0 . Архивировано из оригинала 13 мая 2023 г. Проверено 1 мая 2023 г.
- ^ Роберто Гусмани (1980–1986). Лидийский словарь. С грамматическим очерком и сборником надписей (на немецком языке). Дополнительные тома 1-3, Гейдельберг . и Гусмани, Роберто (1964). Лидийский словарь (на немецком языке). С. Зима. OCLC 582362214 .
- ^ Хаас, О. (1966). Die Phrygischen Sprachdenkmäler . Болгарская академия балканских лингвистических наук (на немецком языке). Болгарская академия наук. Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г.
- ^ Брикше, К.; Лежен, М. (1984). Корпус палеофригийских надписей (на французском языке). Издания Исследования цивилизаций. ISBN 978-2-86538-089-3 . Проверено 1 мая 2023 г.
- ^ Лахара, IJA; Нойманн, Г. (1993). Studia carica: исследования Священных Писаний и языковых карий (на испанском языке). ППУ. ISBN 978-84-477-0236-7 . Архивировано из оригинала 13 мая 2023 г. Проверено 1 мая 2023 г.
- ^ Веттер, Э. (1953). Справочник итальянских диалектов . 1-й ряд: Инструкции и пособия (на немецком языке). С. Зима. ISBN 978-3-8253-5952-2 . Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г.
- ^ Jump up to: а б с д и ж г час я дж Пеуст 2000 , стр. 258.
- ^ О. Хаас, Messapische Studien, Гейдельберг, 1962 г. и К. Санторо, Nuovi studimessapici, 2 тома, Lecce 1982/3 и приложение 1984 г.
- ^ Лежен, М. (1974). Мануэль де ла венецианский язык . Индоевропейская библиотека/учебники и справочники (на французском языке). Зима. ISBN 978-3-533-02353-1 .
- ^ Джакомелли, Дж. (1963). Фалисканский язык . Библиотека «Этрусских исследований» (на итальянском языке). Л.С. Ольшки.
- ^ Что, Джошуа (1969). Диалекты Древней Галлии . Кембридж: HUP. ISBN 978-0-674-86413-9 . OCLC 935283757 .
- ^ Jump up to: а б с д Унтерманн, Дж. (1975). Monumenta linguarum Hispanicarum (на немецком языке). Людвиг Райхерт Верлаг. Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г.
- ^ Краузе, В.; Янкун, Х. (1966). Рунические надписи в древнем Футарке . Трактаты Академии наук в Геттингене, Филолого-исторический класс (на немецком языке). Ванденхук и Рупрехт. Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г. и М. Стоклунд, Новые рунические находки в Иллерупе и Вимосе, Германия, 64, 1986, 75 и далее.
- ^ Jump up to: а б с д и ж г час Пеуст 2000 , стр. 259.
- ^ Бернанд, Э.; Древес, Эй Джей; Шнайдер, Р. (1991). Коллекция надписей Эфиопии доаксумского и аксумского периодов . Публикация Фонда Де Гойже (на французском языке). Академия надписей и изящной словесности. ISBN 978-3-447-11316-8 . Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г.
- ^ Шабо, ЖБ (1940). Коллекция ливийских надписей . Генеральное правительство Алжира (на французском языке). Национальная типография. и Галанд, Л. (1966). Древние надписи из Марокко . Исследования африканских древностей (на французском языке). Издания Национального центра научных исследований. Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г.
- ^ Тёрёк, Л. (1997). Королевство Куш: Справочник напатанско-мероитской цивилизации . Справочник востоковедения / 1: Ближний и Средний Восток. Брилл. п. 64. ИСБН 978-90-04-10448-8 .
- ^ Годарт, Л.; Оливье, JP (1976–85). Сбор регистраций линейным письмом А (на французском языке). П. Гютнер. ISBN 978-2-86958-470-9 . Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г.
- ^ Пурса, Дж. К.; Годарт, Л.; Оливье, JP (1978). Квартал Му: Общее введение. Критская иероглифическая письменность / Луи Годар и Жан-Пьер Оливье. 1 . Раскопки в Маллии (на французском языке). П. Гютнер. Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г.
- ^ Дюу, Ю. (1982). Этеокрит: тексты, язык (на французском языке). Дж. К. Гибен. ISBN 978-90-70265-05-2 . Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г.
- ^ Массон, О. (1961). Кипрские слоговые надписи: критический и комментированный сборник . Французская школа в Афинах: кипрские исследования (на французском языке). Э. де Боккар. Архивировано из оригинала 1 мая 2023 г. Проверено 1 мая 2023 г.
Библиография
[ редактировать ]- Пеуст, Карстен (2000). «О египетской лексикографии. 1: О лексиконе Птолемея Пенелопы Уилсон; 2: Попытка количественного сравнения корпусов текстов древних языков». Lingua Aegyptia 7 (PDF) . стр. 245–260.
- Стрек, Майкл П. (2010). «Основной предмет древнего востоковедения. Объем корпуса клинописных текстов». Объявления Немецкого восточного общества 142 (PDF) . стр. 35–58.