Индекс Линкольна
Индекс Линкольна — это статистический показатель, используемый в нескольких областях для оценки размера популяции вида животных. Описанный Фредериком Чарльзом Линкольном в 1930 году, он также иногда известен как метод Линкольна-Петерсена в честь К.Г. Йоханнеса Петерсена , который первым использовал соответствующий метод маркировки и повторной поимки . [1]
Приложения
[ редактировать ]Рассмотрим двух наблюдателей, которые по отдельности подсчитывают различные виды растений или животных на данной территории. наблюдателя обнаруживают только 5 конкретных видов Если каждый из них возвращается, обнаружив 100 видов, но оба , то каждый наблюдатель явно пропустил по крайней мере 95 видов (то есть 95, которые нашел только другой наблюдатель). Таким образом, мы знаем, что оба наблюдателя многое упускают. С другой стороны, если 99 из 100 видов, обнаруженных каждым наблюдателем, были обнаружены обоими, справедливо ожидать, что они нашли гораздо более высокий процент от общего числа видов, которые предстоит найти.
Те же рассуждения применимы к маркировке и повторной поимке . Если некоторые животные на данной территории пойманы и помечены, а затем проведен второй раунд отлова: количество отмеченных животных, обнаруженных во втором раунде, можно использовать для оценки общей популяции. [2]
Другой пример возникает в компьютерной лингвистике для оценки общего словарного запаса языка. Учитывая две независимые выборки, перекрытие между их словарями позволяет оценить, сколько еще словарных единиц существует, но не обнаружено ни в одной выборке. Аналогичный пример предполагает оценку количества типографских ошибок, оставшихся в тексте, по подсчетам двух корректоров.
Формулировка
[ редактировать ]Индекс Линкольна формализует это явление. Если E1 и E2 — количество видов (или слов, или других явлений), наблюдаемых двумя независимыми методами, а S — количество общих наблюдений, то индекс Линкольна — это просто
Для значений S < 10 эта оценка является грубой и становится чрезвычайно грубой для значений S < 5. В случае, когда S = 0 (т. е. перекрытия вообще нет), индекс Линкольна формально не определен. Это может произойти, если наблюдатели обнаруживают лишь небольшой процент реальных видов (возможно, из-за того, что искали недостаточно тщательно или недостаточно долго), если наблюдатели используют методы, которые не являются статистически независимыми (например, если искать только крупных существ и другое только для малых), или в других обстоятельствах.
Ограничения
[ редактировать ]Индекс Линкольна — это всего лишь оценка. Например, виды в данной местности могут быть либо очень распространенными, либо очень редкими, либо их либо очень сложно, либо очень легко увидеть. [3] Тогда вполне вероятно, что оба наблюдателя найдут большую долю общих видов и пропустят значительную долю редких. Такие распределения исказили бы последующую оценку. Багайманапун, такие распределения необычны для природных явлений, как предполагает закон Ципфа .
Ти Джей Гаскелл и Би Джей Джордж предлагают улучшить индекс Линкольна, который, как утверждается, уменьшит предвзятость. [4]
См. также
[ редактировать ]Дальнейшее чтение
[ редактировать ]- Линкольн, Фредерик К. (май 1930 г.). Расчет численности водоплавающих птиц на основе кольцевания . Циркуляр. Том. 118. Вашингтон, округ Колумбия: Министерство сельского хозяйства США . Проверено 21 мая 2013 г.
- Петерсен, CGJ (1896). «Ежегодная иммиграция молоди камбалы в Лимфьорд из Немецкого моря», Отчет Датской биологической станции (1895 г.) , 6, 5–84.
- Ти Джей Гаскелл; Би Джей Джордж (1972). «Байесовская модификация индекса Линкольна». Журнал прикладной экологии . 9 (2): 377–384. дои : 10.2307/2402438 .
Примечания
[ редактировать ]- ^ Саутвуд, TRE и Хендерсон, П. (2000) Экологические методы , 3-е изд. Блэквелл Сайенс, Оксфорд.
- ^ «Оценка численности населения с помощью методов выборки с повторной поимкой и удалением» . Техасский университет.
- ^ Т. Болин; Б. Сундстрем (1977). «Влияние неравной уловистости на оценку численности популяции с использованием Линкольна и метода удаления, применяемого при электроловле». ОЙКОС (28): 123–129. JSTOR 3543331 .
- ^ Гаскелл и Джордж (1972)