Филогенетическая автокорреляция
Филогенетическая автокорреляция, также известная как проблема Гальтона , в честь описавшего ее сэра Фрэнсиса Гальтона , представляет собой проблему получения выводов на основе межкультурных данных из-за статистического явления, которое теперь называется автокорреляцией . В настоящее время эта проблема признана общей и применимой ко всем неэкспериментальным исследованиям, а к некоторым экспериментальным планам также . Проще всего ее можно описать как проблему внешних зависимостей при проведении статистических оценок, когда элементы выборки не являются статистически независимыми . Например, вопрос двух членов одной семьи, смотрят ли они телевизор, не даст статистически независимых ответов. Размер выборки n для независимых наблюдений в этом случае равен одному, а не двум. Как только будут сделаны надлежащие корректировки, касающиеся внешних зависимостей, тогда будут применяться аксиомы теории вероятностей, касающиеся статистической независимости. Эти аксиомы важны для получения показателей дисперсии , например, или тестов статистической значимости .
Источник
[ редактировать ]В 1888 году Гальтон присутствовал, когда сэр Эдвард Тайлор представлял доклад в Королевском антропологическом институте . Тейлор собрал информацию об институтах брака и происхождения для 350 культур и исследовал связи между этими институтами и показателями социальной сложности. Тейлор интерпретировал свои результаты как признаки общей эволюционной последовательности, в которой институты меняют фокус с материнской линии на отцовскую по мере того, как общества становятся все более сложными. Гальтон не согласился, указав, что сходство между культурами может быть связано с заимствованиями, общим происхождением или эволюционным развитием; он утверждал, что без учета заимствований и общего происхождения нельзя делать достоверные выводы относительно эволюционного развития. Критика Гальтона стала одноименной проблемой Гальтона . [ 1 ] : 175 по имени Рауля Наролла , [ 2 ] [ 3 ] который предложил первые статистические решения.
К началу 20 века от однолинейного эволюционизма отказались, а вместе с ним и от прямых выводов из корреляций к эволюционным последовательностям. Однако критика Гальтона оказалась одинаково обоснованной и в отношении вывода функциональных отношений из корреляций. Проблема автокорреляции осталась.
Решения
[ редактировать ]Статистик Уильям С. Госсет в 1914 году разработал методы устранения ложной корреляции, связанной с тем, как положение во времени или пространстве влияет на сходство. Сегодняшние предвыборные опросы сталкиваются с аналогичной проблемой: чем ближе опрос к выборам, тем меньше людей принимают самостоятельное решение и тем выше ненадежность результатов опросов, особенно предел погрешности или доверительные пределы . Эффективное n независимых дел из их выборки падает по мере приближения выборов. Статистическая значимость падает с меньшим эффективным размером выборки.
Проблема возникает в выборочных опросах, когда социологи хотят сократить время в пути для проведения интервью и, следовательно, делят население на локальные кластеры и выбирают кластеры случайным образом, а затем снова выбирают внутри кластеров. Если они опрашивают n человек в кластерах размером m, эффективный размер выборки (efs) будет иметь нижний предел 1 + ( n − 1) / m , если бы все в каждом кластере были идентичны. Если внутри кластеров имеется лишь частичное сходство, то m в этой формуле необходимо соответственно уменьшить. Формула такого типа: 1 + d ( n − 1) , где d — внутриклассовая корреляция рассматриваемой статистики. [ 4 ] В общем, оценка подходящего EFs зависит от оцениваемой статистики , например, среднего значения , хи-квадрата , корреляции , коэффициента регрессии и их дисперсий .
В области межкультурных исследований Мердок и Уайт [ 5 ] оценили размер участков сходства в своей выборке из 186 обществ. Четыре переменные, которые они тестировали – язык, экономика, политическая интеграция и происхождение – имели участки сходства, которые варьировались от третьего до десятого размера. Очень грубое эмпирическое правило могло бы заключаться в том, чтобы разделить квадратный корень из размеров участков сходства на n так, чтобы эффективные размеры выборки для этих участков были равны 58 и 107 соответственно. Опять же, статистическая значимость падает с меньшим эффективным размером выборки.
В современном анализе пространственные лаги моделируются для оценки степени глобализации современных обществ. [ 6 ]
Пространственная зависимость или автокорреляция — фундаментальная концепция географии. Методы, разработанные географами для измерения и контроля пространственной автокорреляции. [ 7 ] [ 8 ] сделать гораздо больше, чем просто уменьшить эффективное n для проверки значимости корреляции. Одним из примеров является сложная гипотеза о том, что «наличие азартных игр в обществе прямо пропорционально наличию коммерческих денег и наличию значительных социально-экономических различий и обратно пропорционально тому, является ли это общество кочевым или пастушеским обществом». [ 9 ] Проверка этой гипотезы на выборке из 60 обществ не смогла отвергнуть нулевую гипотезу. Однако автокорреляционный анализ показал значительный эффект социально-экономических различий. [ 10 ]
Насколько распространена автокорреляция между переменными, изучаемыми в межкультурных исследованиях? Тест Антона Эффа на 1700 переменных в совокупной базе данных для стандартной межкультурной выборки , опубликованный в журнале World Cultures , измерял I Морана для пространственной автокорреляции (расстояние), языковой автокорреляции (общее происхождение) и автокорреляции в культурной сложности (основная эволюция). ). «Результаты показывают, что... было бы разумно проверить пространственную и филогенетическую автокорреляцию при проведении регрессионного анализа со стандартной межкультурной выборкой». [ 11 ] Проиллюстрировано использование автокорреляционных тестов в исследовательском анализе данных, показывающее, как все переменные в данном исследовании могут быть оценены на предмет независимости случаев с точки зрения расстояния, языка и культурной сложности. Затем объясняются и иллюстрируются методы оценки этих эффектов автокорреляции для обычной регрессии наименьших квадратов с использованием снова меры значимости автокорреляции Морана I.
Когда присутствует автокорреляция, ее часто можно удалить, чтобы получить несмещенные оценки коэффициентов регрессии и их дисперсий, создав переопределенную зависимую переменную, которая «отстает» от взвешиваний зависимой переменной в других местах, где веса представляют собой степень связи. Эта лагированная зависимая переменная является эндогенной, и для ее оценки требуются либо двухэтапные методы наименьших квадратов , либо методы максимального правдоподобия . [ 12 ]
Ресурсы
[ редактировать ]Публичный сервер, если он используется внешне по адресу http://SocSciCompute.ss.uci.edu. Архивировано 20 февраля 2016 г. на Wayback Machine , предлагает этнографические данные, переменные и инструменты для вывода с помощью сценариев R Доу (2007) и Eff и Доу (2009) в рамках поддерживаемой NSF платформы Galaxy ( http://getgalaxy.org ) ( https://www.xsede.org ) для Преподаватели, студенты и исследователи будут проводить моделирование межкультурных исследований «CoSSci Galaxy». Архивировано 20 февраля 2016 г. в Wayback Machine с элементами управления для проблемы Гальтона с использованием стандартных переменных межкультурной выборки на https://web.archive.org/web. /20160402201432/https://dl.dropboxusercontent.com/u/9256203/SCCScodebook.txt .
Возможности
[ редактировать ]В антропологии, где проблема Тайлора была впервые признана статистиком Гальтоном в 1889 году, до сих пор широко не признано, что существуют стандартные статистические поправки к проблеме участков сходства в наблюдаемых случаях и возможностей для новых открытий с использованием методов автокорреляции. Некоторые кросс-культурные исследователи (см., например, Коротаев и де Мунк 2003) [ 13 ] начали понимать, что доказательства распространения, исторического происхождения и другие источники сходства между родственными обществами или отдельными людьми должны быть переименованы в «Возможности Гальтона» и «Актив Гальтона», а не в «Проблему Гальтона». В настоящее время исследователи регулярно используют лонгитюдный, межкультурный и региональный анализ вариаций для анализа всех конкурирующих гипотез: функциональные отношения, диффузия , общее историческое происхождение, многолинейная эволюция , совместная адаптация с окружающей средой и сложная динамика социального взаимодействия . [ 14 ]
Споры
[ редактировать ]![]() |
В антропологии проблема филогенетической ауокореляции часто рассматривается как причина полного отказа от сравнительных исследований. Поскольку проблема является общей, общей для науки и статистических выводов в целом, эта конкретная критика кросс-культурных или сравнительных исследований (а их много) является, логически говоря, равнозначной полному отказу от науки и статистики. Любые данные, собранные и проанализированные, например, этнографами, в равной степени подвержены автокорреляции, понимаемой в самом общем смысле. Критика антисравнительной критики не ограничивается статистическим сравнением, поскольку она применима также и к анализу текста. То есть анализ и использование текста в аргументации подвергаются критике с точки зрения доказательной основы вывода. Опора исключительно на риторику не является защитой от критики обоснованности аргументов и их доказательной базы.
Однако нет никаких сомнений в том, что сообщество кросс-культурных исследователей упустило возможность игнорировать автокорреляцию. Экспертное исследование этого вопроса показывает результаты, которые «убедительно свидетельствуют о том, что обширные сообщения о наивных тестах независимости хи-квадрат с использованием межкультурных наборов данных за последние несколько десятилетий привели к неправильному отклонению нулевых гипотез на уровнях, намного превышающих ожидаемые 5%». ставка." [ 15 ] : 247 Исследователь заключает, что «неправильные теории, которые были «спасены» с помощью наивных тестов хи-квадрат со сравнительными данными, могут быть еще более тщательно проверены в другой день». [ 15 ] : 270 Еще раз скорректированная дисперсия выборки кластера дается как единица, умноженная на 1 + d ( k + 1), где k - средний размер кластера, а более сложная поправка дается для дисперсии корреляций таблицы сопряженности с r. строк и c столбцов. С тех пор, как эта критика была опубликована в 1993 году, как и другие подобные ей, все больше авторов начали принимать поправки к проблеме Гальтона, но большинство специалистов в межкультурной сфере этого не сделали. Следовательно, большая часть опубликованных результатов, основанных на наивных критериях значимости и использующих стандарт P < 0,05, а не стандарт P < 0,005, скорее всего, будет ошибочным, поскольку они более подвержены ошибкам типа I , которые заключаются в отклонении нулевого значения. гипотезу, когда она верна.
Некоторые кросс-культурные исследователи отвергают серьезность проблемы автокорреляции, поскольку, по их мнению, оценки корреляций и средних могут быть объективными, даже если автокорреляция, слабая или сильная, присутствует. Однако, не исследуя автокорреляцию, они все равно могут неправильно оценить статистику, касающуюся взаимосвязей между переменными. Например, в регрессионном анализе изучение закономерностей автокоррелированных остатков может дать важные подсказки о третьих факторах, которые могут влиять на отношения между переменными, но не были включены в регрессионную модель. Во-вторых, если в выборке присутствуют кластеры схожих и родственных обществ, показатели дисперсии будут недооценены, что приведет к ложным статистическим выводам. например, преувеличение статистической значимости корреляций. В-третьих, недооценка дисперсии затрудняет проверку повторения результатов из двух разных выборок, поскольку результаты чаще отклоняются как схожие.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Стокинг, Джордж Младший (1968). «Эдвард Бернетт Тайлор». Международная энциклопедия социальных наук. Дэвид Л. Силлс, редактор, Нью-Йорк, Mcmillan Company: т. 16, стр. 170–177.
- ^ Рауль Наролл (1961). «Два решения проблемы Гальтона». Философия науки . 28 : 15–29. дои : 10.1086/287778 . S2CID 121671403 .
- ^ Рауль Наролл (1965). «Проблема Гальтона: логика межкультурных исследований». Социальные исследования . 32 : 428–451.
- ^ «Размер выборки и эффект дизайна» (PDF) . Архивировано из оригинала (PDF) 14 апреля 2006 г. Проверено 1 ноября 2006 г.
- ^ Джордж П. Мердок и Дуглас Р. Уайт (1969). «Стандартный межкультурный образец» . Этнология . 9 : 329–369.
- ^ Ян, Детлеф (2006). «Глобализация как проблема Гальтона : недостающее звено в анализе моделей распространения в развитии государства всеобщего благосостояния» (PDF) . Международная организация . 60 (2): 401–431. дои : 10.1017/s0020818306060127 . S2CID 154976704 . абстрактный
- ^ Клифф, А.Д. и Дж.К. Орд. 1973. Пространственная автокорреляция . Лондон: Пион Пресс.
- ^ Клифф, А.Д. и Дж.К. Орд. 1981. Пространственные процессы . Лондон: Пион Пресс.
- ^ Прайор, Фредерик (1976). «Метод возможности диффузии: более общее и простое решение проблемы Гальтона». Американский этнолог . 3 (4). Американская антропологическая ассоциация: 731–749. дои : 10.1525/ae.1976.3.4.02a00100 .
- ^ Малкольм М. Доу, Майкл Л. Бертон, Дуглас Р. Уайт и Карл П. Рейтц (1984). «Проблема Гальтона как сетевая автокорреляция» . Американский этнолог . 11 (4): 754–770. дои : 10.1525/ae.1984.11.4.02a00080 . S2CID 143111431 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Э. Антон Эфф (2004). «Есть ли у г-на Гальтона еще проблема? Автокорреляция в стандартной межкультурной выборке» (PDF) . Мировые культуры . 15 (2): 153–170.
- ^ Анселин, Люк. 1988. Пространственная эконометрика: методы и модели. Дордрехт: Kluwer Academic Publishers.
- ^ Андрей Коротаев и Виктор де Мунк (2003). « Актив Гальтона и проблема цветка : культурные сети и культурные единицы в межкультурных исследованиях» . Американский антрополог . 105 (2): 353–358. дои : 10.1525/aa.2003.105.2.353 .
- ^ Мейс, Рут; Пейгель, Марк (1994). «Сравнительный метод в антропологии». Современная антропология . 35 (5): 549–564. дои : 10.1086/204317 . S2CID 146297584 .
- ^ Перейти обратно: а б Малкольм М. Доу (1993). «Сохранение теории: тесты хи-квадрат с данными межкультурных исследований». Межкультурные исследования . 27 (3–4): 247–276. дои : 10.1177/106939719302700305 . S2CID 122509821 .
Дальнейшее чтение
[ редактировать ]- Доу, ММ (2007). «Проблема Гальтона как эффекты множественной сетевой автокорреляции» (PDF) . Межкультурные исследования . 41 (4): 336–363. дои : 10.1177/1069397107305452 . S2CID 143230639 .
- Эфф, Э. Антон и Малкольм М. Доу. 2009. «Как справиться с недостающими данными и проблемой Гальтона в межкультурных исследованиях: учебник для R». Структура и динамика: электронный журнал антропологических и смежных наук 3 (3): 223–252. https://escholarship.org/uc/item/7cm1f10b
- Озтан, Б. Толга. 2016. Эволюция сотрудничества: сравнительное исследование родственного поведения. Докторская диссертация, Калифорнийский университет в Ирвайне. Математические поведенческие науки. http://intersci.ss.uci.edu/wiki/pdf/latest/thesisJan2Tolga2015.pdf (обширное рассмотрение решения Доу-Эффа проблемы Гальтона).
- Интерскивики. 2007. Использование автокорреляции в спецификации модели (включая программное обеспечение и учебное пособие).
- Интерскивики. 2009. Проблема Гальтона и автокорреляция (библиография).
- Студент (У.С. Госсет) (1914). «Устранение ложной корреляции, обусловленной положением во времени или пространстве» . Биометрика . 10 (1): 179–181. дои : 10.2307/2331746 . JSTOR 2331746 .
- Тайлор, Эдвард Э. (1889). «О методе исследования развития институтов, применимых к законам о браке и происхождении». Журнал Королевского антропологического института . 18 (3): 245–72. дои : 10.2307/2842423 . hdl : 2027/hvd.32044097779680 . JSTOR 2842423 .
- Витковски, Стэнли (1974). «Возможность Гальтона - гологеистическое исследование исторических процессов». Научные исследования поведения . 9 (1): 11–15. дои : 10.1177/106939717400900105 . S2CID 144398651 .