Модель дерева

В исторической лингвистике модель дерева (также Штаммбаума , генетическая или кладистическая модель эволюции языков, аналогичной концепции генеалогического древа , в частности филогенетического дерева в биологической эволюции видов ) является моделью . Как и в случае с видами, предполагается, что каждый язык произошел от одного родительского или «материнского» языка, при этом языки имеют общего предка, принадлежащего к одной и той же языковой семье .

Популяризированный немецким лингвистом Августом Шлейхером в 1853 году. ^{[ 1 ]}^{[ 2 ]} древовидная модель всегда была распространенным методом описания генетических отношений между языками с момента первых попыток это сделать. Это занимает центральное место в области сравнительной лингвистики , которая включает использование данных из известных языков и наблюдаемых правил эволюции языковых особенностей для идентификации и описания гипотетических протоязыков, предков каждой языковой семьи, таких как протоиндоевропейский и индоевропейский. Европейские языки . Однако это в основном теоретическое, качественное исследование, и лингвисты всегда подчеркивали присущие древовидной модели ограничения из-за большой роли, которую играет горизонтальная передача в эволюции языка, начиная от заимствованных слов и заканчивая креольскими языками , имеющими несколько родных языков. ^{[ 1 ]} Волновая модель была разработана в 1872 году учеником Шлейхера Йоханнесом Шмидтом как альтернатива древовидной модели, включающей горизонтальную передачу. ^{[ 3 ]}

Древовидная модель также имеет те же ограничения, что и биологическая таксономия, в отношении проблемы видов , связанной с квантованием непрерывного явления, которое включает в себя исключения, такие как кольцевые виды в биологии и диалектные континуумы в языке. Концепция связи была разработана в ответ и относится к группе языков, которые развились из диалектного континуума, а не из лингвистически изолированных дочерних языков одного языка. ^{[ 2 ]}

История

Ветхий Завет и Святой Августин

Августин Гиппопотамский предполагал, что каждый из потомков Ноя основал нацию и что каждому народу был дан свой язык: ассирийский для Ассура , еврейский для Хевера и так далее. ^{[ 4 ]} Всего он выделил 72 нации, основателей племен и языков. Смешение и рассеяние произошли во времена Фалека , сына Хевера, сына Сима , сына Ноя. ^{[ 5 ]}^{[ 6 ]} Августин выдвинул гипотезу, мало чем отличающуюся от гипотез более поздних лингвистов-историков, о том, что семья Гебера «сохранила этот язык, который небезосновательно считался общим языком расы… с тех пор названным ивритом». Однако большинство из 72 языков возникли спустя много поколений после Гебера. Св. Августин решает эту первую проблему, предполагая, что Хебер, проживший 430 лет, был еще жив, когда Бог назначил 72 года. ^{[ 7 ]}^: 123

Ursprache, язык рая

Гипотеза святого Августина не вызывала серьезных сомнений более тысячи лет. Затем в серии трактатов, опубликованных в 1684 году, выражающих скептицизм в отношении различных верований, особенно библейских, сэр Томас Браун писал: ^{[ 8 ]}

«Хотя до потопа земля была широко заселена... тем не менее, сохраняли ли люди после большого расселения и на протяжении шестнадцати столетий столь единообразный язык во всех частях... вполне можно сомневаться».

К тому времени открытие Нового Света и исследование Дальнего Востока принесли знание о количестве новых языков, намного превышающем 72, рассчитанные Св. Августином. Ссылаясь на языки коренных американцев, Браун предполагает, что «смешение языков сначала коснулось только тех, кто присутствовал на Синааре при работе Вавилона…». примитивный язык со временем может распространиться на несколько частей Европы и Азии…». ^{[ 9 ]} Это намек на дерево. По мнению Брауна, различия в языке могут быть объяснены упрощением языка аборигенов, более крупного, чем иврит. Он предполагает, что древние китайцы произошли от остальных в результате «путаницы, смешения и коррупции». ^{[ 10 ]} Позже он говорит о «смешении и изменении». ^{[ 11 ]}

Браун сообщает о ряде реконструктивных действий ученых того времени: ^{[ 12 ]}

«Учёный Казобон полагает, что диалог может быть составлен на саксонском языке только из таких слов, которые произошли от греческого... Верстеган не сомневался, что он мог бы придумать письмо, которое могло бы быть понято англичанами, голландцами и жителями Восточной Фрисландии. ... И если, как утверждает ученый Буксгорний , скифский язык как родной язык распространен среди народов Европы и даже до Персии, то многословная общность между столь многими народами имела более разумный перевод и была скорее происходит от общего языка, распространенного среди них всех, чем от какой-либо отдельной нации, которая также заимствовала и держит только из вторых рук».

Таким образом, беспорядок у Вавилонской башни был устранен как препятствие, отложив его в сторону. Попытки найти сходства во всех языках привели к постепенному открытию древнего основного языка, от которого произошли все остальные языки. Браун, несомненно, писал и размышлял задолго до 1684 года. В том же революционном столетии в Британии Джеймс Хауэлл опубликовал второй том « Epistolae Ho-Elianae» , квазивымышленных писем различным важным лицам в королевстве, содержащих достоверную историческую информацию. В Письме LVIII метафора дерева языков кажется полностью развитой, если не считать точку зрения профессионального лингвиста: ^{[ 13 ]}

«Теперь я подниму паруса в Нидерланды, чей язык является тем же диалектом, что и английский, и был таковым с самого начала, поскольку оба они произошли от верхнеголландского [Хауэлл здесь ошибается]: Датский также является всего лишь ветвью одного и того же дерева... Ныне верхнеголландский или тевтонский язык является одним из основных и самых обширных материнских языков Европы... это был язык готов и вандалов , и он до сих пор продолжает существовать на большей части Польши и Венгрия , у которой есть свой диалект вместо их вульгарного языка... Некоторые из ее писателей заставят этот мир поверить, что на ее языке говорят в раю».

Поиски «языка рая» шли среди всех лингвистов Европы. Те, кто писал на латыни, называли его lingua prima , lingua primaeva или lingua primigenia. В английском языке это был адамический язык; по-немецки — Ursprache или hebräische Ursprache, если кто-то считает, что это иврит. Этот таинственный язык имел ауру чистоты и непорочности, и эти качества были стандартами, используемыми при выборе кандидатов. Эта концепция Ursprache вошла в употребление задолго до того, как неограмматики приняли ее для своих протоязыков. Разрыв между широко расходящимися языковыми семьями оставался неликвидным. ^{[ нужна ссылка ]}

Индоевропейская модель

2 февраля 1786 года сэр Уильям Джонс выступил с речью, посвященной третьей годовщине Азиатского общества в качестве его президента, на тему индусов . В ней он применил логику древовидной модели к трем языкам — греческому, латинскому и санскриту, но впервые в истории на чисто лингвистических основаниях, отметив «более сильное родство как в корнях глаголов, так и в формах». грамматики, чем могло возникнуть случайно...» Далее он постулировал, что они произошли из «некоего общего источника, которого, возможно, больше не существует». К ним он добавил готский, кельтский и персидский языки как «одну семью». ^{[ 14 ]}

Джонс не назвал свой «общий источник» и не развил эту идею дальше, но ее подхватили лингвисты того времени. В (лондонском) Ежеквартальном обзоре конца 1813–1814 годов Томас Янг опубликовал рецензию на книгу Иоганна Кристофа Аделунга « Митридат, oder allgemeine Sprachenkunde» («Митридат, или Всеобщая история языков»), первый том которой вышел в 1806 г., а также тома II и III, 1809–1812 гг ., продолженные Иоганном Северином Фатером. В работе Аделунга описано около 500 «языков и диалектов» и выдвинута гипотеза об универсальном происхождении от языка рая, расположенного в Кашмире , центральном среди всего ареала 500. Янг начинает с указания на то, что Аделунг обязан книге Конрада Геснера . «Митридат, de Differentiis Linguarum» 1555 г. и другие последующие каталоги языков и алфавитов. ^{[ 15 ]}

Кашмир (красный), местонахождение Эдема Аделунгом.

Янг обязуется представить классификацию Аделунга. Односложный тип — наиболее древний и примитивный, на нем говорят в Азии, к востоку от Эдема, в направлении выхода Адама из Эдема. Затем следует группа Джонса, все еще без названия, но приписываемая Джонсу: «Еще один древний и обширный класс языков, объединенных большим количеством сходств, чем это может быть совершенно случайно». Для этого класса он предлагает имя, ^{[ 16 ]} «Индоевропейский» — первое известное лингвистическое использование этого слова, но не первое его известное использование. Британская Ост-Индская компания использовала термин «индоевропейская торговля» для обозначения торговли товарами между Индией и Европой. ^{[ 17 ]} Все свидетельства, которые приводит Янг в отношении предковой группы, — это максимально похожие слова: мать, отец и т. д.

Дополнительными классами Аделунга были татарский (который позже будет известен как спорная семья алтайских ), африканский и американский, которые зависят от географии и предполагаемого происхождения из Эдема. Янг не разделяет энтузиазма Аделунга по поводу языка рая и называет его преимущественно спекулятивным. ^{[ нужна ссылка ]}

Обозначение Янга, успешное на английском языке, было лишь одним из нескольких кандидатов, предложенных между 1810 и 1867 годами: индо-германский ( Конрад Малте-Брун , 1810), япетиск ( Расмус Кристиан Раск , 1815), индо-германский ( Юлиус Клапрот , 1823), индийско-немецкий (Ф. Шмиттеннер, 1826), санскритский ( Вильгельм фон Гумбольдт , 1827), индокельтский (А. Ф. Потт, 1840), ариоевропейский ( Грациадио Исайя Асколи , 1854), арийский ( Макс Мюллер , 1861) и арьякский (Х. Шаве) , 1867). Все эти люди были полиглотами и вундеркиндами в языках. (Клапрот, например, автор успешного немецкоязычного кандидата Indo-Deutschenisch, критиковавшего Джонса за его некритический метод, знал китайский, японский, тибетский и ряд других языков с их письменностью.) Концепция библейского текста Урспрахе обратился к их воображению. Поскольку надежда найти его постепенно угасла, они обратились к растущей концепции общего индоевропейского языка, на котором говорят кочевые племена на равнинах Евразии, и хотя они представили убедительные доказательства того, что этот язык можно вывести методами сравнительной лингвистики, в факт, что они получили это не так. Это был единственный случай, когда их попытки найти Ursprache увенчались успехом. ^{[ нужна ссылка ]}

Neogrammarian model

В своей самой строгой формулировке эта модель принадлежит неограмматикам . Модель опирается на более ранние концепции Уильяма Джонса , Франца Боппа и Августа Шлейхера , добавляя исключительную чистоту правильных законов и регулярность процесса. Лингвистом, возможно, наиболее ответственным за установление связи с дарвинизмом, был Август Шлейхер.

То, что он сравнивал свой Stammbaum , или генеалогическое древо языков, с дарвиновским представлением эволюции вскоре после этого представления, подтверждается открытым письмом, которое он написал в 1863 году Эрнсту Геккелю , опубликованному, однако, посмертно. В 1869 году Геккель предложил ему прочитать «Происхождение видов» . ^{[ нужна ссылка ]}

Прочитав ее, Шлейхер написал «Теорию Дарвина и лингвистику» : «Дарвинизм, проверенный наукой о языке». ^{[ 18 ]} В сценарии, напоминающем сценарий между Дарвином и Уоллесом по поводу открытия эволюции (оба открыли ее независимо), Шлейхер одобрил презентацию Дарвина, но раскритиковал ее за то, что она не включила ни один вид. Затем он представил Stammbaum языков, который, однако, был не первым, что он опубликовал. ^{[ нужна ссылка ]}

Эволюция языков не была источником теории эволюции Дарвина. Он основывал это на изменчивости видов, которую он наблюдал у вьюрков на Галапагосских островах , которые оказались модификациями общего предка. Выбор домашних видов для создания нового сорта также сыграл роль в его выводах. В первом издании « Происхождения видов» 1859 года языковое дерево обсуждается как бы de novo в рамках темы классификации. Дарвин критикует синхронный метод, разработанный Линнеем , предлагая заменить его «естественным устройством», основанным на эволюции. ^{[ нужна ссылка ]} Он говорит: ^{[ 19 ]}

«Возможно, стоит проиллюстрировать этот взгляд на классификацию на примере языков. Если бы мы обладали совершенной родословной человечества, генеалогическое расположение человеческих рас позволило бы лучше классифицировать различные языки, на которых сейчас говорят на протяжении всего человечества. мира, и если бы пришлось включить все вымершие языки и все промежуточные и медленно меняющиеся диалекты, такое расположение было бы, я думаю, единственно возможным. Однако вполне возможно, что какой-то очень древний язык мало изменился и изменился. породило несколько новых языков, в то время как другие (из-за распространения и последующей изоляции и состояний цивилизации нескольких рас, произошедших от общей расы) сильно изменились и дали начало множеству новых языков и диалектов различных степеней. различия в языках одного и того же происхождения должны были бы выражаться группами, подчиненными группам, но правильное или даже единственно возможное расположение все же было бы генеалогическим, и это было бы совершенно естественно, так как оно связывало бы воедино все вымершие языки; и современный, по самому близкому родству, и указывает на происхождение и происхождение каждого языка».

Шлейхер никогда не слышал о Дарвине до того, как Геккель привлек к нему внимание Шлейхера. Он опубликовал свою собственную работу о Stammbaum в статье 1853 года, за шесть лет до первого издания « Происхождения видов» в 1859 году. Концепция происхождения языков ни в коем случае не была новой. Томас Джефферсон , сам ярый лингвист, предположил, что постоянная необходимость в неологизмах подразумевает, что языки должны «прогрессировать» или «прогрессировать». ^{[ 20 ]} Эти идеи предвещают эволюцию либо биологических видов, либо языков, но после контакта Шлейхера с идеями Дарвина и, возможно, контакта Дарвина с историческими лингвистами, эволюция и изменение языка оказались неразрывно связаны и стали основой для классификации. Сейчас, как и тогда, основными проблемами будут доказательство конкретных линий происхождения и определение точек ветвления. ^{[ нужна ссылка ]}

Филогенетическое дерево

Старая метафора получила совершенно новое значение под старым именем Джозефом Гарольдом Гринбергом в серии эссе, начиная примерно с 1950 года. С момента принятия лингвистами метафоры генеалогического древа концепция эволюции была предложена Чарльзом Дарвином и была общепринятое в биологии. Таксономия , классификация живых существ, была изобретена еще Карлом Линнеем . Он использовал биномиальную номенклатуру для присвоения названия вида и названия рода каждому известному живому организму. Они были организованы в биологическую иерархию в рамках нескольких типов или наиболее общих групп, разветвляющихся в конечном итоге на различные виды. В основу этой биологической классификации легли наблюдаемые общие физические особенности видов. ^{[ нужна ссылка ]}

Дарвин, однако, возрождая другую древнюю метафору — древо жизни , выдвинул гипотезу, что группы линнеевской классификации (сегодняшние таксоны ) с течением времени спускались по древовидной структуре от простейших к наиболее сложным. Иерархическое дерево Линнея было синхронным; Дарвин предвидел диахронический процесс общего происхождения . где Линней придумал ранги , которые соответствовали великой цепи принятия рационалистов Там , , Дарвин придумал линии передачи . Спустя десятилетия после Дарвина стало ясно, что ранги иерархии Линнея не совсем соответствовали линиям происхождения. Главной целью таксономии стало обнаружение линий и изменение классификации, чтобы отразить их, что она и делала под общим руководством Номенклатурных кодексов , сводов правил, которые ведутся международными организациями для утверждения и публикации предложений по реклассификации видов и других таксонов. Новый подход получил название филогения , «поколение типов», в рамках которого была разработана новая метафора дерева — филогенетическое дерево. . Одна единица дерева и все ее потомки были кладами , и открытие кладов было кладистикой . ^{[ нужна ссылка ]}

Гринберг начал писать в то время, когда филогенетической систематике не хватало инструментов, доступных ей позже: компьютера (вычислительная систематика) и секвенирования ДНК ( молекулярная систематика ). Чтобы обнаружить кладистические отношения, исследователи полагались на максимальное количество морфологических сходств между видами, которые можно было определить и свести в таблицы. По статистике, чем больше сходств, тем больше вероятность того, что виды будут принадлежать к одной кладе. Этот подход понравился Гринбергу, который был заинтересован в открытии лингвистических универсалий . Изменив модель дерева, чтобы сделать генеалогическое древо филогенетическим, он сказал: ^{[ 21 ]}

«Любой язык состоит из тысяч форм, имеющих как звучание, так и значение... любой звук, какой бы он ни был, может выражать любое значение, какое бы оно ни было. Следовательно, если два языка совпадают в значительном числе таких элементов... мы обязательно делаем вывод об общем историческом происхождении. Такие генетические классификации не произвольны... аналогия здесь с биологической классификацией чрезвычайно близка... точно так же, как в биологии мы относим виды к одному и тому же роду или высшей единице, поскольку сходства таковы, что предполагают гипотезу общего происхождения, то же самое можно сказать и о генетических гипотезах в языке».

В этой аналогии языковая семья подобна кладе , языки подобны видам , протоязык подобен таксону- предку , языковое дерево похоже на филогенетическое дерево , а языки и диалекты подобны видам и разновидностям. Гринберг составил большие таблицы характеристик до сих пор забытых языков Африки, Америки, Индонезии и Северной Евразии и типизировал их по сходству. Он назвал этот подход « типологической классификацией», разработанной скорее описательной лингвистикой , чем сравнительной лингвистикой . ^{[ 22 ]}

Даты и глоттохронология

Сравнительный метод использовался историческими лингвистами для объединения древовидных моделей с использованием дискретных лексических, морфологических и фонологических данных. Хронологию можно найти, но с использованием этой системы нет абсолютных оценок дат.

Глоттохронология позволяет оценить абсолютные даты. Общие родственные слова (родственные слова, означающие иметь общее историческое происхождение) вычисляют время расхождения. Однако позже выяснилось, что метод дискредитирован из-за недостоверности данных. Из-за этого у исторических лингвистов возникают проблемы с точной оценкой возраста индоевропейской языковой семьи. Согласно Диксону, полученному на основании данных о расцвете и упадке языка (Cambridge University Press), оно могло варьироваться от 4000 до 40 000 лет назад или где-то между этими датами. ^{[ 23 ]} Как видно из статьи здесь. ^{[ 24 ]}

Возможные решения глоттохронологии появятся благодаря вычислительным филогенетическим методам. Такие методы, как использование моделей эволюции, повышают точность определения длины и топологии ветвей дерева. Таким образом, использование вычислительных филогенетических методов позволяет исследователям анализировать лингвистические данные эволюционной биологии. Это также помогает сравнивать теории друг с другом, такие как курганская теория и анатолийская теория , обе из которых заявляют о происхождении инфоевропейских языков. ^{[ 24 ]}

Компьютерная филогенетика в исторической лингвистике

Сравнительный метод сравнивает особенности различных языков, чтобы оценить, насколько один язык похож на другой. Результаты такой оценки ориентированы на данные; то есть результаты зависят от количества функций и количества сравниваемых языков. До появления компьютера на исторической лингвистике цифры в обоих случаях были обязательно небольшими. Эффект заключался в попытке изобразить фотографию, используя небольшое количество больших пикселей или единиц изображения. Ограничения Древовидной модели были слишком очевидны, что привело к жалобам со стороны крупнейших лингвистов-историков. ^{[ нужна ссылка ]}

В конце 20 века лингвисты начали использовать программное обеспечение, предназначенное для биологической классификации, для классификации языков. Программы и методы становились все более изощренными. В начале 21 века проект «Вычислительная филогенетика в исторической лингвистике» (CPHL), консорциум лингвистов-историков, получил финансирование от Национального научного фонда для изучения филогений. ^{[ 25 ]} Индоевропейская семья является основной темой изучения. По состоянию на январь 2012 года они собрали и закодировали «проверенную» базу данных, содержащую «22 фонологических символа, 13 морфологических символов и 259 лексических символов», а также еще одну непроверенную базу данных. Включены списки слов 24 индоевропейских языков. Большее количество функций и языков повышает точность при условии, что они соответствуют определенным критериям. Используя специализированное компьютерное программное обеспечение, они проверяют различные филогенетические гипотезы на предмет их способности объяснять признаки по генетическому происхождению. ^{[ нужна ссылка ]}

Ограничения модели

Одним из характерных ограничений древовидной модели является сама основополагающая презумпция, на которой она основана: она требует классификации, основанной на языках или, в более общем плане, на языковых разновидностях . Поскольку разновидность представляет собой абстракцию от совокупности языковых признаков , существует вероятность потери информации при переводе данных (из карты изоглосс ) в дерево. Например, существует проблема диалектных континуумов . Они предоставляют разновидности, которые не являются однозначно тем или иным языком, но содержат черты, характерные для более чем одного языка. Вопрос о том, как их классифицировать, аналогичен вопросу, связанному с кольцевыми видами , в концепции классификации видов в биологии. ^{[ нужна ссылка ]}

Ограничения древовидной модели, в частности ее неспособность справиться с недискретным распределением общих инноваций в диалектных континуумах , были устранены посредством разработки некладистических (неоснованных на древовидных) методологий. Они включают модель Wave ; и, в последнее время, концепция связи . ^{[ 3 ]}

Дополнительное ограничение древовидной модели касается смешанных и гибридных языков, а также смешения языков в целом, поскольку древовидная модель допускает только расхождения. Например, по словам Цукермана (2009:63), ^{[ 26 ]} «Израильский», его термин для обозначения современного иврита , который он считает полутоевропейским гибридом, «демонстрирует, что реальность лингвистического происхождения гораздо сложнее, чем позволяет простая система генеалогического древа. «Возрожденные» языки вряд ли будут иметь единый родитель».

Совершенные филогении

Целью филогенетического программного обеспечения является создание кладограмм — особого вида дерева, в котором связи только раздваиваются; то есть в любом узле в одном направлении предлагаются только две ветви. Входные данные представляют собой набор символов, которым могут быть присвоены состояния на разных языках, например, присутствует (1) или отсутствует (0). Таким образом, язык можно описать уникальным набором координат, состоящим из значений состояний всех рассматриваемых символов. Эти координаты могут быть похожи друг на друга или меньше. Языки, которые имеют наибольшее количество состояний, больше всего похожи друг на друга. ^{[ нужна ссылка ]}

Программное обеспечение анализирует все состояния всех символов всех языков с помощью одного из нескольких математических методов, чтобы выполнить попарное сравнение каждого языка со всеми остальными. Затем он строит кладограмму на основе степени сходства; например, предполагается, что гипотетические языки a и b, которые наиболее близки друг к другу, имеют общего предка ab. Предполагается, что следующий ближайший язык c имеет общего предка с ab и так далее. Результатом является спроецированная серия исторических путей, ведущих от общего предка (корня) к языкам (листьям). Каждый путь уникален. Связей между путями нет. Каждый лист и узел имеют одного и только одного предка. Все штаты происходят от других штатов. Кладограмма, соответствующая этим требованиям, представляет собой совершенную филогению. ^{[ 27 ]}

Поначалу казалось, что в исследованиях, в которых изменялись факторы, предположительно значимые, результаты были малопоследовательными. В результате любого изменения возникла новая кладограмма, которая предполагала, что метод не отражает основную эволюцию языков, а лишь отражает импровизированные суждения исследователей. Чтобы найти факторы, действительно влияющие на филогению, исследователям необходимо было иметь некоторую степень точности своих результатов; т. е. результаты необходимо было сопоставить с известными филогениями. Они провели эксперимент, используя различные предположения, пытаясь найти те, которые наиболее точно соответствуют наиболее безопасным индоевропейским филогениям. Эти предположения можно было бы с большей уверенностью использовать в проблемных областях индоевропейской филогении. ^{[ нужна ссылка ]}

Чтобы получить достаточно достоверную филогению, исследователи обнаружили, что им необходимо ввести в качестве входных данных все три типа символов: фонологические, лексические и морфологические, которые необходимы для представления достаточно подробной картины для расчета филогении. Только качественные персонажи давали значимые результаты. Повторяющиеся состояния были слишком неоднозначными, чтобы их могло правильно интерпретировать программное обеспечение; поэтому персонажи, которые подвергались обратному формированию и параллельному развитию, которые возвращали персонажа к предыдущему состоянию или принимали состояние, которое развилось в другом персонаже, соответственно, были исключены из входного набора данных. ^{[ 28 ]}

Совершенные филогенетические сети

Несмотря на их стремление закодировать лучшие качественные признаки в достаточном количестве, исследователи не смогли получить точную филогению для некоторых групп, таких как германские и албанские внутри индоевропейских групп. Они рассудили, что значительное количество признаков, которые нельзя объяснить генетическим происхождением от вычисленного предка группы, было заимствовано. По-видимому, если бы волновая модель , объясняющая заимствования, была полным объяснением особенностей группы, для нее вообще не удалось бы найти никакой филогении. Если бы обе модели были частично эффективными, то дерево существовало бы, но его нужно было бы дополнять негенетическими объяснениями. Поэтому исследователи модифицировали программное обеспечение и метод, включив в них возможность заимствования. ^{[ 29 ]}

Исследователи ввели в эксперимент концепцию интерфейса или разрешенной границы, через которую могут течь состояния персонажа. Между родителем и дочерним элементом существовал односторонний интерфейс, или граница. Если бы только односторонних ребер было достаточно, чтобы объяснить наличие всех состояний в языке, тогда не было бы необходимости выходить за рамки идеальной филогении. Если нет, то к филогении можно добавить одно или несколько контактных краев или двунаправленных интерфейсов. Таким образом, язык может иметь более одного источника состояний: родительский или контактный язык. ^{[ нужна ссылка ]}

Измененное таким образом дерево больше не было деревом как таковым: от корня к листу могло существовать более одного пути. Исследователи назвали эту структуру сетью. Состояния персонажа по-прежнему развивались по уникальному пути от корня к листу, но его источником мог быть либо рассматриваемый корень, либо контактный язык. Если бы сеть могла объяснить все состояния эксперимента, ее называли идеальной филогенетической сетью. ^{[ 30 ]}

Совместимость и осуществимость

Создание сетей потребовало двух этапов. На первом этапе исследователи разработали ряд филогений, называемых деревьями-кандидатами, для проверки совместимости. Символ является совместимым, если его происхождение объясняется созданной филогенией. ^{[ 31 ]} В идеальной филогении все признаки совместимы, и совместимость дерева составляет 100%. Согласно принципу бережливости, или бритве Оккама , никакие сети не гарантируются. Деревья-кандидаты были получены путем первого запуска программного обеспечения для генерации филогении с использованием индоевропейского набора данных (строки состояний символов) в качестве входных данных, а затем изменения полученного дерева в другие гипотезы, которые необходимо проверить. ^{[ нужна ссылка ]}

Ни одно из исходных деревьев-кандидатов не было идеальной филогенией, хотя некоторые из поддеревьев внутри них были таковыми. Следующим этапом было создание сетей из деревьев с наивысшими показателями совместимости путем добавления интерфейсов по одному и выбора интерфейса с наивысшей совместимостью до тех пор, пока не будет получена достаточность; то есть совместимость сети была самой высокой. Как оказалось, количество созданных совместимых сетей могло варьироваться от нуля до более дюжины. Однако не все возможные интерфейсы были исторически осуществимы. Интерфейсы между некоторыми языками были географически и хронологически маловероятными. Проверяя результаты, исследователи исключали невозможные интерфейсы до тех пор, пока не оставался список только возможных сетей, который можно было расположить в порядке оценки совместимости. ^{[ нужна ссылка ]}

Наиболее осуществимая сеть для индоевропейцев

Исследователи начали с пяти деревьев-кандидатов на индоевропейский язык, обозначенных буквой AE, одно из которых было создано с помощью филогенетического программного обеспечения, двух его модификаций и двух, предложенных Крейгом Мелчертом , историческим лингвистом и индоевропейистом. Деревья различались главным образом размещением самой неоднозначной группы — германских языков и албанских, у которых не было достаточного количества отличительных знаков, чтобы точно ее разместить. Дерево А содержало 14 несовместимых символов; Б, 19; С, 17; Д, 21; Е, 18. Деревья A и C имели лучшие показатели совместимости. Все несовместимости были лексическими, а А были подмножеством С. ^{[ 32 ]}

Последующее поколение сетей показало, что все несовместимости могут быть решены с использованием как минимум трех контактных ребер, за исключением дерева E. Поскольку оно не обладало высокой совместимостью, оно было исключено. В дереве А было 16 возможных сетей, но в ходе технико-экономического обоснования их количество сократилось до трех. Дерево C имело одну сеть, но, поскольку для него требовался интерфейс с балтийским, а не славянским языком, это было неосуществимо. ^{[ 33 ]}

Дерево А, наиболее совместимое и осуществимое дерево, предполагает наличие семи групп, отделившихся от протоиндоевропейских групп примерно между 4000 и 2250 годами до нашей эры, как показано ниже. ^{[ 34 ]}

Первым отделившимся был Анатолий, около 4000 г. до н. э.
Тохарян последовал за ним примерно в 3500 г. до н.э.
Вскоре после этого, около 3250 г., прото-итало-кельтский (западный индоевропейский) отделился, став прото-курсивным и прото-кельтским примерно в 2500 г. до н.э.
Примерно в 3000 году протоалбано-германский язык отделился, став албанским и протогерманским примерно в 2000 году.
Примерно в 3000 году протогрекоармянские (южные индоевропейцы) разделились, став протогреческими и протоармянскими примерно в 1800 году.
Балтославянский язык появился около 2500 г., разделившись на прабалтийский и праславянский около 1000 г.
Наконец, примерно в 2250 году протоиндоевропейский язык стал протоиндоиранским (восточным индоевропейским).

Деревья B и E предлагают альтернативу протогермано-балто-славянскому (северному индоевропейскому языку), что делает албанский язык независимой ветвью. Единственная дата, за которую ручаются авторы, — последняя, исходя из преемственности ямной культуры , андроновской культуры и известных индоарийскоязычных культур. Все остальные описываются как «точный расчет». ^{[ 35 ]}

Учитывая филогению наилучшей совместимости A, для завершения совместимости необходимы три контактных ребра. Это группа ребер с наименьшим количеством событий заимствования: ^{[ 35 ]}

Во-первых, граница между прото-курсивом и прото-германским языком, которая, согласно приведенной схеме датировки, должна была начаться после 2000 года.
Второй край контакта был между прото-курсивным и прото-греко-армянским языками, который, должно быть, начался после 2500 года.
Третий край контакта находится между протогерманским и протобалтийским языками, который, должно быть, начался после 1000 г.

Дерево А с описанными выше ребрами авторы описывают как «наш лучший PPN». ^{[ 36 ]} Во всех ППН ясно, что, хотя исходные дочерние языки стали обособляться в относительной изоляции, последующую эволюцию групп можно объяснить только эволюцией в близости к другим языкам, с которыми происходит обмен по волновой модели.

См. также

Примечания

^ Перейти обратно: ^а ^б Лист, Иоганн-Маттис; Нельсон-Сати, Шиджулал; Гейслер, Ганс; Мартин, Уильям (2014). «Сети лексического заимствования и латерального переноса генов в эволюции языка и генома» . Биоэссе . 36 (2): 141–150. doi : 10.1002/bies.201300096 . ISSN 0265-9247 . ПМЦ 3910147 . ПМИД 24375688 .
^ Перейти обратно: ^а ^б Фрэнсис (2014) .
^ Перейти обратно: ^а ^б См. Bloomfield 1933 , с. 311; Хеггарти и др. (2010) ; Франсуа (2014) .
^ Святой Августин (1948). «XVI:9–11» . Город Божий .
^ Бытие 10:25
^ 1 Паралипоменон 1:19.
^ Святой Августин (епископ Гиппона) (1871 г.). Произведения Аврелия Августина: новый перевод . Т. и Т. Кларк – через Google Книги .
^ Браун 1684 , стр. 223–241.
^ Браун 1684 , с. 224.
^ Браун 1684 , с. 225.
^ Браун 1684 , с. 228.
^ Браун 1684 , стр. 226–228.
^ Хауэлл, Джеймс (1688) [1645]. «Письмо LVIII досточтимому графу Р.». Epistolae Ho-Elianae, Знакомые письма, внутренние и Форрен, разделенные на четыре книги: частично исторические, политические, философские и по особым случаям . Том. II (6-е изд.). Лондон: Томас Гай. п. 356.
^ Джонс, Уильям (1807) [1786], «Рассуждение об индусах к третьей годовщине», в книге Лорда Тинмута (редактор), « Сочинения сэра Уильяма Джонса с жизнью автора», в тринадцати томах , том. III, Лондон: Джон Стокдейл и Джон Уокер, с. 34
^ Янг 1813 , с. 251
^ Янг 1813 , с. 255
^ Грант, Роберт (1813). Очерк истории Ост-Индской компании от ее первого образования до принятия Уставного акта 1773 года; с кратким обзором изменений, произошедших с этого периода во внутреннем управлении Британской Индии . Лондон: Блэк, Парри и Ко [и т. д.], стр. xxxiv – xxxv.
^ Уильямс, DM; Эбах, Мальте К.; Нельсон, Гарет Дж. (2008). Основы систематики и биогеографии . Нью-Йорк, штат Нью-Йорк: Спрингер. п. 45 . ISBN 9780387727288 .
^ Дарвин, Чарльз (1860). О происхождении видов путем естественного отбора, или О сохранении избранных рас в борьбе за жизнь . Лондон: Дж. Мюррей. п. 422 . возможно, стоит проиллюстрировать этот взгляд на классификацию на примере языков Дарвина.
^ Пост, Дэвид Г. (2009). В поисках лося Джефферсона: заметки о состоянии киберпространства . Оксфорд; Нью-Йорк: Издательство Оксфордского университета . п. 125 . ISBN 978-0-19-534289-5 .
^ Гринберг, Джозеф Х. (1990) [1954], «Количественный подход к типологической морфологии языка», Деннинг, Кейт М.; Кеммер, Сюзанна (ред.), О языке: избранные произведения Джозефа Х. Гринберга , Стэнфорд: Stanford University Press , стр. 3–4.
^ Гринберг, Джозеф Гарольд (1971). Язык, культура и общение . Стэнфорд: Издательство Стэнфордского университета . п. 113 . ISBN 9780804707817 .
^ Диксон, RMW (1997). Р. У. Диксон «Взлет и падение языков» . Кембриджское ядро. дои : 10.1017/CBO9780511612060 . ISBN 9780511612060 . Проверено 26 сентября 2017 г.
^ Перейти обратно: ^а ^б Грей, Рассел Д.; Аткинсон, Квентин Д. (27 ноября 2003 г.). «Времена расхождения языковых деревьев подтверждают анатолийскую теорию индоевропейского происхождения» . Природа . 426 (6965). Издательская группа «Природа»: 435–9. Бибкод : 2003Natur.426..435G . дои : 10.1038/nature02029 . ПМИД 14647380 . S2CID 42340 – через Google Книги .
^ «CPHL: Вычислительная филогенетика в исторической лингвистике» . 2004–2012 гг.
^ Цукерманн, Гилад. 2009. «Гибридность против возможности возрождения: множественная причинность, формы и закономерности». Журнал языкового контакта , вариант 2:40–67.
^ Нахле 2005 , с. 383.
^ Нахле 2005 , стр. 384–385.
^ Технические подробности используемых алгоритмов изложены в Nakhleh 2005 , Приложение A. Подробности набора данных изложены в Приложении B.
^ Нахле 2005 , стр. 388–391.
^ Нахле 2005 , с. 387.
^ Нахле 2005 , с. 396.
^ Нахле 2005 , с. 400.
^ Нахле 2005 , с. 398.
^ Перейти обратно: ^а ^б Нахле 2005 , с. 401.
^ Нахле 2005 , с. 407.

Библиография

Блумфилд, Леонард (1984) [1933]. Язык . Чикаго и Лондон: Издательство Чикагского университета .
Браун, Томас (1852) [1684], «Сборники трактатов; Сборники; Трактат 8, О языках и особенно саксонском языке», в Тенисон, Томас (ред.), Работы сэра Томаса Брауна , Антикварная библиотека Бона, том. III, Lincoln's Inn Fields: Кокс (Братья) и Вайман, стр. 223–241 .
Франсуа, Александр (2014), «Деревья, волны и связи: модели языковой диверсификации» (PDF) , в Бауэрне, Клэр; Эванс, Бетвин (ред.), Справочник по исторической лингвистике Routledge , Лондон: Routledge , стр. 161–189, ISBN 978-0-41552-789-7 .
Хеггарти, Пол; Магуайр, Уоррен; МакМахон, апрель (2010 г.). «Расколы или волны? Деревья или сети? Как меры дивергенции и сетевой анализ могут раскрыть историю языков» . Философские труды Королевского общества Б. 365 (1559): 3829–3843. дои : 10.1098/rstb.2010.0099 . ПМК 2981917 . ПМИД 21041208 .
Нахле, Луай; Ринге, Дон; Варнау, Тэнди (2005). «Совершенные филогенетические сети: новая методология реконструкции эволюционной истории естественных языков» (PDF) . Язык . 81 (2): 382–420. CiteSeerX 10.1.1.65.1791 . дои : 10.1353/lan.2005.0078 . S2CID 162958 .
Янг, Томас (октябрь 1813 г.). «Всеобщая история языков Адлунга». Ежеквартальный обзор . X (XIX статья XII). Лондон: Джон Мюррей: 250–292.

Внешние ссылки

Лабов, Уильям (2010). «15. Распространение языка с места на место» . Принципы лингвистических изменений . Том. 3: Познание и культурные факторы. Великобритания: Уайли-Блэквелл – через Scribd. ^{[ постоянная мертвая ссылка ]}
Санторини, Беатрис; Крок, Энтони (2007). «Узловые отношения» . Синтаксис естественного языка: онлайн-введение с использованием программы Trees . Пенсильванский университет .

[ListNelson-Sathi2014-1] Перейти обратно: ^а ^б Лист, Иоганн-Маттис; Нельсон-Сати, Шиджулал; Гейслер, Ганс; Мартин, Уильям (2014). «Сети лексического заимствования и латерального переноса генов в эволюции языка и генома» . Биоэссе . 36 (2): 141–150. doi : 10.1002/bies.201300096 . ISSN 0265-9247 . ПМЦ 3910147 . ПМИД 24375688 .

[AF-2] Перейти обратно: ^а ^б Фрэнсис (2014) .

[waves-3] Перейти обратно: ^а ^б См. Bloomfield 1933 , с. 311; Хеггарти и др. (2010) ; Франсуа (2014) .

[4] Святой Августин (1948). «XVI:9–11» . Город Божий .

[5] Бытие 10:25

[6] 1 Паралипоменон 1:19.

[augustine-7] Святой Августин (епископ Гиппона) (1871 г.). Произведения Аврелия Августина: новый перевод . Т. и Т. Кларк – через Google Книги .

[8] Браун 1684 , стр. 223–241.

[FOOTNOTEBrowne1684224-9] Браун 1684 , с. 224.

[FOOTNOTEBrowne1684225-10] Браун 1684 , с. 225.

[FOOTNOTEBrowne1684228-11] Браун 1684 , с. 228.

[FOOTNOTEBrowne1684226–228-12] Браун 1684 , стр. 226–228.

[13] Хауэлл, Джеймс (1688) [1645]. «Письмо LVIII досточтимому графу Р.». Epistolae Ho-Elianae, Знакомые письма, внутренние и Форрен, разделенные на четыре книги: частично исторические, политические, философские и по особым случаям . Том. II (6-е изд.). Лондон: Томас Гай. п. 356.

[14] Джонс, Уильям (1807) [1786], «Рассуждение об индусах к третьей годовщине», в книге Лорда Тинмута (редактор), « Сочинения сэра Уильяма Джонса с жизнью автора», в тринадцати томах , том. III, Лондон: Джон Стокдейл и Джон Уокер, с. 34

[15] Янг 1813 , с. 251

[16] Янг 1813 , с. 255

[17] Грант, Роберт (1813). Очерк истории Ост-Индской компании от ее первого образования до принятия Уставного акта 1773 года; с кратким обзором изменений, произошедших с этого периода во внутреннем управлении Британской Индии . Лондон: Блэк, Парри и Ко [и т. д.], стр. xxxiv – xxxv.

[18] Уильямс, DM; Эбах, Мальте К.; Нельсон, Гарет Дж. (2008). Основы систематики и биогеографии . Нью-Йорк, штат Нью-Йорк: Спрингер. п. 45 . ISBN 9780387727288 .

[19] Дарвин, Чарльз (1860). О происхождении видов путем естественного отбора, или О сохранении избранных рас в борьбе за жизнь . Лондон: Дж. Мюррей. п. 422 . возможно, стоит проиллюстрировать этот взгляд на классификацию на примере языков Дарвина.

[20] Пост, Дэвид Г. (2009). В поисках лося Джефферсона: заметки о состоянии киберпространства . Оксфорд; Нью-Йорк: Издательство Оксфордского университета . п. 125 . ISBN 978-0-19-534289-5 .

[21] Гринберг, Джозеф Х. (1990) [1954], «Количественный подход к типологической морфологии языка», Деннинг, Кейт М.; Кеммер, Сюзанна (ред.), О языке: избранные произведения Джозефа Х. Гринберга , Стэнфорд: Stanford University Press , стр. 3–4.

[22] Гринберг, Джозеф Гарольд (1971). Язык, культура и общение . Стэнфорд: Издательство Стэнфордского университета . п. 113 . ISBN 9780804707817 .

[23] Диксон, RMW (1997). Р. У. Диксон «Взлет и падение языков» . Кембриджское ядро. дои : 10.1017/CBO9780511612060 . ISBN 9780511612060 . Проверено 26 сентября 2017 г.

[Nature_Publishing_Group-24] Перейти обратно: ^а ^б Грей, Рассел Д.; Аткинсон, Квентин Д. (27 ноября 2003 г.). «Времена расхождения языковых деревьев подтверждают анатолийскую теорию индоевропейского происхождения» . Природа . 426 (6965). Издательская группа «Природа»: 435–9. Бибкод : 2003Natur.426..435G . дои : 10.1038/nature02029 . ПМИД 14647380 . S2CID 42340 – через Google Книги .

[25] «CPHL: Вычислительная филогенетика в исторической лингвистике» . 2004–2012 гг.

[26] Цукерманн, Гилад. 2009. «Гибридность против возможности возрождения: множественная причинность, формы и закономерности». Журнал языкового контакта , вариант 2:40–67.

[FOOTNOTENakhleh2005383-27] Нахле 2005 , с. 383.

[FOOTNOTENakhleh2005384–385-28] Нахле 2005 , стр. 384–385.

[29] Технические подробности используемых алгоритмов изложены в Nakhleh 2005 , Приложение A. Подробности набора данных изложены в Приложении B.

[FOOTNOTENakhleh2005388–391-30] Нахле 2005 , стр. 388–391.

[FOOTNOTENakhleh2005387-31] Нахле 2005 , с. 387.

[FOOTNOTENakhleh2005396-32] Нахле 2005 , с. 396.

[FOOTNOTENakhleh2005400-33] Нахле 2005 , с. 400.

[FOOTNOTENakhleh2005398-34] Нахле 2005 , с. 398.

[FOOTNOTENakhleh2005401-35] Перейти обратно: ^а ^б Нахле 2005 , с. 401.

[FOOTNOTENakhleh2005407-36] Нахле 2005 , с. 407.

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

[ 33 ]

[ 34 ]

[ 35 ]

[ 36 ]