Jump to content

Филогенетическая автокорреляция

(Перенаправлено с задачи Гальтона )

Филогенетическая автокорреляция, также известная как проблема Гальтона , в честь описавшего ее сэра Фрэнсиса Гальтона , представляет собой проблему получения выводов на основе межкультурных данных из-за статистического явления, которое теперь называется автокорреляцией . В настоящее время эта проблема признана общей и применимой ко всем неэкспериментальным исследованиям, а к некоторым экспериментальным планам также . Проще всего ее можно описать как проблему внешних зависимостей при проведении статистических оценок, когда элементы выборки не являются статистически независимыми . Например, вопрос двух членов одной семьи, смотрят ли они телевизор, не даст статистически независимых ответов. Размер выборки n для независимых наблюдений в этом случае равен одному, а не двум. Как только будут сделаны надлежащие корректировки, касающиеся внешних зависимостей, тогда будут применяться аксиомы теории вероятностей, касающиеся статистической независимости. Эти аксиомы важны для получения показателей дисперсии , например, или тестов статистической значимости .

Источник

[ редактировать ]

В 1888 году Гальтон присутствовал, когда сэр Эдвард Тайлор представлял доклад в Королевском антропологическом институте . Тейлор собрал информацию об институтах брака и происхождения для 350 культур и исследовал связи между этими институтами и показателями социальной сложности. Тейлор интерпретировал свои результаты как признаки общей эволюционной последовательности, в которой институты меняют фокус с материнской линии на отцовскую по мере того, как общества становятся все более сложными. Гальтон не согласился, указав, что сходство между культурами может быть связано с заимствованиями, общим происхождением или эволюционным развитием; он утверждал, что без учета заимствований и общего происхождения нельзя делать достоверные выводы относительно эволюционного развития. Критика Гальтона стала одноименной проблемой Гальтона . [ 1 ] : 175  по имени Рауля Наролла , [ 2 ] [ 3 ] который предложил первые статистические решения.

К началу 20 века от однолинейного эволюционизма отказались, а вместе с ним и от прямых выводов из корреляций к эволюционным последовательностям. Однако критика Гальтона оказалась одинаково обоснованной и в отношении вывода функциональных отношений из корреляций. Проблема автокорреляции осталась.

Статистик Уильям С. Госсет в 1914 году разработал методы устранения ложной корреляции, связанной с тем, как положение во времени или пространстве влияет на сходство. Сегодняшние предвыборные опросы сталкиваются с аналогичной проблемой: чем ближе опрос к выборам, тем меньше людей принимают самостоятельное решение и тем выше ненадежность результатов опросов, особенно предел погрешности или доверительные пределы . Эффективное n независимых дел из их выборки падает по мере приближения выборов. Статистическая значимость падает с меньшим эффективным размером выборки.

Проблема возникает в выборочных опросах, когда социологи хотят сократить время в пути для проведения интервью и, следовательно, делят население на локальные кластеры и выбирают кластеры случайным образом, а затем снова выбирают внутри кластеров. Если они опрашивают n человек в кластерах размером m, эффективный размер выборки (efs) будет иметь нижний предел 1 + ( n − 1) / m , если бы все в каждом кластере были идентичны. Если внутри кластеров имеется лишь частичное сходство, то m в этой формуле необходимо соответственно уменьшить. Формула такого типа: 1 + d ( n − 1) , где d внутриклассовая корреляция рассматриваемой статистики. [ 4 ] В общем, оценка подходящего EFs зависит от оцениваемой статистики , например, среднего значения , хи-квадрата , корреляции , коэффициента регрессии и их дисперсий .

В области межкультурных исследований Мердок и Уайт [ 5 ] оценили размер участков сходства в своей выборке из 186 обществ. Четыре переменные, которые они тестировали – язык, экономика, политическая интеграция и происхождение – имели участки сходства, которые варьировались от третьего до десятого размера. Очень грубое эмпирическое правило могло бы заключаться в том, чтобы разделить квадратный корень из размеров участков сходства на n так, чтобы эффективные размеры выборки для этих участков были равны 58 и 107 соответственно. Опять же, статистическая значимость падает с меньшим эффективным размером выборки.

В современном анализе пространственные лаги моделируются для оценки степени глобализации современных обществ. [ 6 ]

Пространственная зависимость или автокорреляция — фундаментальная концепция географии. Методы, разработанные географами для измерения и контроля пространственной автокорреляции. [ 7 ] [ 8 ] сделать гораздо больше, чем просто уменьшить эффективное n для проверки значимости корреляции. Одним из примеров является сложная гипотеза о том, что «наличие азартных игр в обществе прямо пропорционально наличию коммерческих денег и наличию значительных социально-экономических различий и обратно пропорционально тому, является ли это общество кочевым или пастушеским обществом». [ 9 ] Проверка этой гипотезы на выборке из 60 обществ не смогла отвергнуть нулевую гипотезу. Однако автокорреляционный анализ показал значительный эффект социально-экономических различий. [ 10 ]

Насколько распространена автокорреляция между переменными, изучаемыми в межкультурных исследованиях? Тест Антона Эффа на 1700 переменных в совокупной базе данных для стандартной межкультурной выборки , опубликованный в журнале World Cultures , измерял I Морана для пространственной автокорреляции (расстояние), языковой автокорреляции (общее происхождение) и автокорреляции в культурной сложности (основная эволюция). ). «Результаты показывают, что... было бы разумно проверить пространственную и филогенетическую автокорреляцию при проведении регрессионного анализа со стандартной межкультурной выборкой». [ 11 ] Проиллюстрировано использование автокорреляционных тестов в исследовательском анализе данных, показывающее, как все переменные в данном исследовании могут быть оценены на предмет независимости случаев с точки зрения расстояния, языка и культурной сложности. Затем объясняются и иллюстрируются методы оценки этих эффектов автокорреляции для обычной регрессии наименьших квадратов с использованием снова меры значимости автокорреляции Морана I.

Когда присутствует автокорреляция, ее часто можно удалить, чтобы получить несмещенные оценки коэффициентов регрессии и их дисперсий, создав переопределенную зависимую переменную, которая «отстает» от взвешиваний зависимой переменной в других местах, где веса представляют собой степень связи. Эта лагированная зависимая переменная является эндогенной, и для ее оценки требуются либо двухэтапные методы наименьших квадратов , либо методы максимального правдоподобия . [ 12 ]

Публичный сервер, если он используется внешне по адресу http://SocSciCompute.ss.uci.edu. Архивировано 20 февраля 2016 г. на Wayback Machine , предлагает этнографические данные, переменные и инструменты для вывода с помощью сценариев R Доу (2007) и Eff и Доу (2009) в рамках поддерживаемой NSF платформы Galaxy ( http://getgalaxy.org ) ( https://www.xsede.org ) для Преподаватели, студенты и исследователи будут проводить моделирование межкультурных исследований «CoSSci Galaxy». Архивировано 20 февраля 2016 г. в Wayback Machine с элементами управления для проблемы Гальтона с использованием стандартных переменных межкультурной выборки на https://web.archive.org/web. /20160402201432/https://dl.dropboxusercontent.com/u/9256203/SCCScodebook.txt .

Возможности

[ редактировать ]

В антропологии, где проблема Тайлора была впервые признана статистиком Гальтоном в 1889 году, до сих пор широко не признано, что существуют стандартные статистические поправки к проблеме участков сходства в наблюдаемых случаях и возможностей для новых открытий с использованием методов автокорреляции. Некоторые кросс-культурные исследователи (см., например, Коротаев и де Мунк 2003) [ 13 ] начали понимать, что доказательства распространения, исторического происхождения и другие источники сходства между родственными обществами или отдельными людьми должны быть переименованы в «Возможности Гальтона» и «Актив Гальтона», а не в «Проблему Гальтона». В настоящее время исследователи регулярно используют лонгитюдный, межкультурный и региональный анализ вариаций для анализа всех конкурирующих гипотез: функциональные отношения, диффузия , общее историческое происхождение, многолинейная эволюция , совместная адаптация с окружающей средой и сложная динамика социального взаимодействия . [ 14 ]

В антропологии проблема филогенетической ауокореляции часто рассматривается как причина полного отказа от сравнительных исследований. Поскольку проблема является общей, общей для науки и статистических выводов в целом, эта конкретная критика кросс-культурных или сравнительных исследований (а их много) является, логически говоря, равнозначной полному отказу от науки и статистики. Любые данные, собранные и проанализированные, например, этнографами, в равной степени подвержены автокорреляции, понимаемой в самом общем смысле. Критика антисравнительной критики не ограничивается статистическим сравнением, поскольку она применима также и к анализу текста. То есть анализ и использование текста в аргументации подвергаются критике с точки зрения доказательной основы вывода. Опора исключительно на риторику не является защитой от критики обоснованности аргументов и их доказательной базы.

Однако нет никаких сомнений в том, что сообщество кросс-культурных исследователей упустило возможность игнорировать автокорреляцию. Экспертное исследование этого вопроса показывает результаты, которые «убедительно свидетельствуют о том, что обширные сообщения о наивных тестах независимости хи-квадрат с использованием межкультурных наборов данных за последние несколько десятилетий привели к неправильному отклонению нулевых гипотез на уровнях, намного превышающих ожидаемые 5%». ставка." [ 15 ] : 247  Исследователь заключает, что «неправильные теории, которые были «спасены» с помощью наивных тестов хи-квадрат со сравнительными данными, могут быть еще более тщательно проверены в другой день». [ 15 ] : 270  Еще раз скорректированная дисперсия выборки кластера дается как единица, умноженная на 1 + d ( k + 1), где k - средний размер кластера, а более сложная поправка дается для дисперсии корреляций таблицы сопряженности с r. строк и c столбцов. С тех пор, как эта критика была опубликована в 1993 году, как и другие подобные ей, все больше авторов начали принимать поправки к проблеме Гальтона, но большинство специалистов в межкультурной сфере этого не сделали. Следовательно, большая часть опубликованных результатов, основанных на наивных критериях значимости и использующих стандарт P < 0,05, а не стандарт P < 0,005, скорее всего, будет ошибочным, поскольку они более подвержены ошибкам типа I , которые заключаются в отклонении нулевого значения. гипотезу, когда она верна.

Некоторые кросс-культурные исследователи отвергают серьезность проблемы автокорреляции, поскольку, по их мнению, оценки корреляций и средних могут быть объективными, даже если автокорреляция, слабая или сильная, присутствует. Однако, не исследуя автокорреляцию, они все равно могут неправильно оценить статистику, касающуюся взаимосвязей между переменными. Например, в регрессионном анализе изучение закономерностей автокоррелированных остатков может дать важные подсказки о третьих факторах, которые могут влиять на отношения между переменными, но не были включены в регрессионную модель. Во-вторых, если в выборке присутствуют кластеры схожих и родственных обществ, показатели дисперсии будут недооценены, что приведет к ложным статистическим выводам. например, преувеличение статистической значимости корреляций. В-третьих, недооценка дисперсии затрудняет проверку повторения результатов из двух разных выборок, поскольку результаты чаще отклоняются как схожие.

См. также

[ редактировать ]
  1. ^ Стокинг, Джордж Младший (1968). «Эдвард Бернетт Тайлор». Международная энциклопедия социальных наук. Дэвид Л. Силлс, редактор, Нью-Йорк, Mcmillan Company: т. 16, стр. 170–177.
  2. ^ Рауль Наролл (1961). «Два решения проблемы Гальтона». Философия науки . 28 : 15–29. дои : 10.1086/287778 . S2CID   121671403 .
  3. ^ Рауль Наролл (1965). «Проблема Гальтона: логика межкультурных исследований». Социальные исследования . 32 : 428–451.
  4. ^ «Размер выборки и эффект дизайна» (PDF) . Архивировано из оригинала (PDF) 14 апреля 2006 г. Проверено 1 ноября 2006 г.
  5. ^ Джордж П. Мердок и Дуглас Р. Уайт (1969). «Стандартный межкультурный образец» . Этнология . 9 : 329–369.
  6. ^ Ян, Детлеф (2006). «Глобализация как проблема Гальтона : недостающее звено в анализе моделей распространения в развитии государства всеобщего благосостояния» (PDF) . Международная организация . 60 (2): 401–431. дои : 10.1017/s0020818306060127 . S2CID   154976704 . абстрактный
  7. ^ Клифф, А.Д. и Дж.К. Орд. 1973. Пространственная автокорреляция . Лондон: Пион Пресс.
  8. ^ Клифф, А.Д. и Дж.К. Орд. 1981. Пространственные процессы . Лондон: Пион Пресс.
  9. ^ Прайор, Фредерик (1976). «Метод возможности диффузии: более общее и простое решение проблемы Гальтона». Американский этнолог . 3 (4). Американская антропологическая ассоциация: 731–749. дои : 10.1525/ae.1976.3.4.02a00100 .
  10. ^ Малкольм М. Доу, Майкл Л. Бертон, Дуглас Р. Уайт и Карл П. Рейтц (1984). «Проблема Гальтона как сетевая автокорреляция» . Американский этнолог . 11 (4): 754–770. дои : 10.1525/ae.1984.11.4.02a00080 . S2CID   143111431 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  11. ^ Э. Антон Эфф (2004). «Есть ли у г-на Гальтона еще проблема? Автокорреляция в стандартной межкультурной выборке» (PDF) . Мировые культуры . 15 (2): 153–170.
  12. ^ Анселин, Люк. 1988. Пространственная эконометрика: методы и модели. Дордрехт: Kluwer Academic Publishers.
  13. ^ Андрей Коротаев и Виктор де Мунк (2003). « Актив Гальтона и проблема цветка : культурные сети и культурные единицы в межкультурных исследованиях» . Американский антрополог . 105 (2): 353–358. дои : 10.1525/aa.2003.105.2.353 .
  14. ^ Мейс, Рут; Пейгель, Марк (1994). «Сравнительный метод в антропологии». Современная антропология . 35 (5): 549–564. дои : 10.1086/204317 . S2CID   146297584 .
  15. ^ Перейти обратно: а б Малкольм М. Доу (1993). «Сохранение теории: тесты хи-квадрат с данными межкультурных исследований». Межкультурные исследования . 27 (3–4): 247–276. дои : 10.1177/106939719302700305 . S2CID   122509821 .

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 225a231aca98e246fdbf1c12956edef9__1719363600
URL1:https://arc.ask3.ru/arc/aa/22/f9/225a231aca98e246fdbf1c12956edef9.html
Заголовок, (Title) документа по адресу, URL1:
Phylogenetic autocorrelation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)