Статистическое доказательство
Статистическое доказательство — это рациональная демонстрация степени уверенности в утверждении , гипотезе или теории , которая используется для убеждения других после статистической проверки подтверждающих доказательств и типов выводов , которые можно сделать на основе результатов тестов. Статистические методы используются для улучшения понимания фактов, а доказательство демонстрирует обоснованность и логику выводов с явной ссылкой на гипотезу, экспериментальные данные , факты, тест и шансы . Доказательство преследует две основные цели: первая — убедить, а вторая — объяснить утверждение посредством экспертной и публичной оценки. [1]
Бремя доказательства лежит на очевидном применении статистического метода, раскрытии предположений и актуальности теста по отношению к подлинному пониманию данных относительно внешнего мира. Есть приверженцы нескольких различных статистических философий вывода, таких как теорема Байеса против функции правдоподобия или позитивизм против критического рационализма . Эти методы рассуждения имеют прямое отношение к статистическим доказательствам и их интерпретациям в более широкой философии науки. [1] [2]
Общим разграничением между наукой и ненаукой является гипотетико-дедуктивное доказательство фальсификации, разработанное Карлом Поппером , которое является устоявшейся практикой в традиции статистики. Однако другие способы вывода могут включать индуктивный и абдуктивный способы доказательства. [3] Ученые используют статистические доказательства не как средство достижения уверенности, а для фальсификации утверждений и объяснения теории. Наука не может достичь абсолютной уверенности и не является непрерывным движением к объективной истине, как может подразумевать общепринятый, в отличие от научного значения термина «доказательство». Статистическое доказательство предлагает своего рода доказательство ложности теории и средство эвристического обучения посредством повторяющихся статистических испытаний и экспериментальных ошибок. [2] Статистическое доказательство также имеет применение в юридических вопросах, что влияет на юридическое бремя доказывания . [4]
Аксиомы [ править ]
Существует два вида аксиом : 1) соглашения, которые считаются истинными, и которых следует избегать, поскольку их невозможно проверить, и 2) гипотезы. [5] Доказательство в теории вероятностей строилось на четырех аксиомах, разработанных в конце 17 века:
- Вероятность гипотезы представляет собой неотрицательное действительное число: ;
- Вероятность необходимой истины равна единице: ;
- Если две гипотезы h 1 и h 2 взаимоисключающие, то сумма их вероятностей равна вероятности их дизъюнкции : ;
- Условная вероятность h 1 при условии h 2 равна безусловной вероятности соединения h 1 и h 2 , разделенное на безусловную вероятность h 2 , где эта вероятность положительна , где .
Предыдущие аксиомы обеспечивают статистическое доказательство и основу законов случайности или объективной случайности, на основе которых продвинулась современная статистическая теория. Однако экспериментальные данные никогда не смогут доказать, что гипотеза (h) верна, а основаны на индуктивном выводе путем измерения вероятности гипотезы относительно эмпирических данных. Доказательство заключается в рациональной демонстрации использования логики вывода , математики , тестирования и дедуктивного рассуждения о значении . [1] [2] [6]
Тест и доказательство [ править ]
Термин «доказательство» произошел от своих латинских корней (доказуемый, вероятный, probare L.), означающих «проверять» . [7] [8] Следовательно, доказательство — это форма умозаключения посредством статистического теста. Статистические тесты формулируются на моделях, генерирующих распределения вероятностей . Примеры вероятностных распределений могут включать бинарное , нормальное или распределение Пуассона , которые дают точное описание переменных, которые ведут себя в соответствии с законами случайности естественными . Когда статистический тест применяется к выборкам совокупности, он определяет, значительно ли отличается статистика выборки от предполагаемой нулевой модели . Истинные значения популяции, которые на практике непознаваемы, называются параметрами популяции. Исследователи выбирают группы населения, которые предоставляют оценки параметров, для расчета среднего или стандартного отклонения. Если отбирается вся совокупность, то среднее статистическое значение и распределение выборки будут сходиться с параметрическим распределением. [9]
Используя научный метод фальсификации, перед тестом задается значение вероятности того, что выборочная статистика существенно отличается от нулевой модели, что не может быть объяснено только случайностью. Большинство статистиков устанавливают значение априорной вероятности на уровне 0,05 или 0,1, что означает, что если выборочная статистика расходится с параметрической моделью более чем в 5 (или 10) раз из 100, то это несоответствие вряд ли можно объяснить только случайностью и нулевым значением. гипотеза отвергается. Статистические модели обеспечивают точные результаты параметрических и оценок выборочной статистики. Следовательно, бремя доказательства лежит на выборочной статистике, которая дает оценки статистической модели. Статистические модели содержат математическое доказательство значений параметров и их вероятностных распределений. [10] [11]
Теорема Байеса [ править ]
Байесовская статистика основана на другом философском подходе к доказательству умозаключений . Математическая формула теоремы Байеса:
Формула читается как вероятность параметра (или гипотезы =h , как она используется в обозначениях аксиом ) «при данных» данных (или эмпирическом наблюдении), где горизонтальная черта означает «данность». Правая часть формулы вычисляет априорную вероятность статистической модели (Pr [Параметр]) с правдоподобием (Pr [Данные | Параметр]) для получения апостериорного распределения вероятностей параметра (Pr [Параметр | Данные]). Апостериорная вероятность — это вероятность того, что параметр верен с учетом наблюдаемых данных или статистики выборок. [12] Гипотезы можно сравнивать с помощью байесовского вывода с помощью фактора Байеса, который представляет собой отношение апостериорных шансов к априорным. Он обеспечивает измерение данных и позволяет определить, увеличило или уменьшило вероятность одной гипотезы по сравнению с другой. [13]
Статистическое доказательство — это байесовская демонстрация того, что одна гипотеза имеет более высокую (слабую, сильную, положительную) вероятность. [13] Ведутся серьезные споры о том, согласуется ли байесовский метод с методом доказательства фальсификации Карла Попперса, где некоторые полагают, что «... вообще не существует такой вещи, как «принятие» гипотез. Все, что делают в науке, — это присваивают степени вера..." [14] : 180 По мнению Поппера, гипотезы, выдержавшие проверку и еще не опровергнутые, не проверяются, а подтверждаются . Некоторые исследования предполагают, что стремление Поппера определить подтверждение на основе предпосылки вероятности привело его философию в соответствие с байесовским подходом. В этом контексте вероятность одной гипотезы относительно другой может быть показателем подтверждения, а не подтверждения, и, таким образом, статистически доказана посредством строгой объективной оценки. [6] [15]
В судебных разбирательствах [ править ]
«Там, где могут быть продемонстрированы грубые статистические различия, они сами по себе могут в соответствующем случае представлять собой prima facie доказательство модели или практики дискриминации». [номер 1] : 271
Статистические доказательства в судебном процессе можно разделить на три категории доказательств:
- Возникновение события, действия или типа поведения,
- Личность ответственного(ых) лица(ов)
- Намерение или психологическая ответственность [16]
Статистические доказательства не применялись регулярно в решениях, касающихся судебных разбирательств в Соединенных Штатах, до середины 1970-х годов, после знаменательного дела о дискриминации присяжных по делу Кастанеда против Партиды . Верховный суд США постановил, что серьезные статистические различия представляют собой « на первый взгляд доказательство» дискриминации, в результате чего бремя доказывания переносится с истца на ответчика. После этого постановления статистические доказательства использовались во многих других делах о неравенстве, дискриминации и доказательствах ДНК. [4] [17] [18] Однако между статистическим доказательством и юридическим бременем доказывания не существует однозначного соответствия. «Верховный суд заявил, что степень строгости, требуемая в процессах установления фактов по закону и науке, не обязательно соответствует». [18] : 1533
В примере приговора к смертной казни ( Макклески против Кемпа [номер 2] ) относительно расовой дискриминации, заявителю, чернокожему мужчине по имени Макклески, было предъявлено обвинение в убийстве белого полицейского во время ограбления. Экспертные показания Макклески представили статистические доказательства того, что «обвиняемые, обвиняемые в убийстве белых жертв, имели в 4,3 раза больше шансов получить смертный приговор, чем обвиняемые в убийстве чернокожих». [19] : 595 Тем не менее, статистики оказалось недостаточно, «чтобы доказать, что лица, принимающие решения по его делу, действовали с дискриминационными целями». [19] : 596 Далее утверждалось, что существуют «неизбежные ограничения статистических доказательств». [19] : 596 потому что это не относилось к особенностям личности. Несмотря на статистическую демонстрацию повышенной вероятности дискриминации, юридическое бремя доказывания (утверждалось) должно было рассматриваться в каждом конкретном случае. [19]
См. также [ править ]
Ссылки [ править ]
- ^ Jump up to: а б с Голд, Б .; Саймонс, Р.А. (2008). Доказательство и другие дилеммы: Математика и философия . Американской математической ассоциации Inc. ISBN 978-0-88385-567-6 .
- ^ Jump up to: а б с Гаттей, С. (2008). «Лингвистический поворот» Томаса Куна и наследие логического эмпиризма: несоизмеримость, рациональность и поиск истины . Ашгейт Паб Ко. р. 277. ИСБН 978-0-7546-6160-3 .
- ^ Педемонт, Б. (2007). «Как можно проанализировать взаимосвязь между аргументацией и доказательством?». Образовательные исследования по математике . 66 (1): 23–41. дои : 10.1007/s10649-006-9057-x . S2CID 121547580 .
- ^ Jump up to: а б с Мейер, П. (1986). «Проклятые лжецы и свидетели-эксперты» (PDF) . Журнал Американской статистической ассоциации . 81 (394): 269–276. дои : 10.1080/01621459.1986.10478270 .
- ^ Уайли, Э.О. (1975). «Карл Р. Поппер, Систематика и классификация: ответ Уолтеру Боку и другим эволюционным систематикам». Систематическая зоология . 24 (2): 233–43. дои : 10.2307/2412764 . ISSN 0039-7989 . JSTOR 2412764 .
- ^ Jump up to: а б Хаусон, Колин; Урбах, Питер (1991). «Байесовское рассуждение в науке». Природа . 350 (6317): 371–4. Бибкод : 1991Natur.350..371H . дои : 10.1038/350371a0 . ISSN 1476-4687 . S2CID 5419177 .
- ^ Сундхольм, Г. (1994). «Теоретико-доказательная семантика и критерии тождественности предложений по Фреге» (PDF) . Монист 77 (3): 294–314. дои : 10.5840/monist199477315 . hdl : 1887/11990 .
- ^ Бисселл, Д. (1996). «У статистиков есть слово» (PDF) . Преподавание статистики . 18 (3): 87–89. CiteSeerX 10.1.1.385.5823 . дои : 10.1111/j.1467-9639.1996.tb00300.x .
- ^ Сокаль, Р.Р.; Рольф, Ф.Дж. (1995). Биометрия (3-е изд.). WH Freeman & Company. стр. 887 . ISBN 978-0-7167-2411-7 .
биометрия.
- ^ Хит, Дэвид (1995). Введение в экспериментальный дизайн и статистику в биологии . ЦРК Пресс. ISBN 978-1-85728-132-3 .
- ^ Хальд, Андерс (2006). История параметрического статистического вывода от Бернулли до Фишера, 1713–1935 гг . Спрингер. п. 260. ИСБН 978-0-387-46408-4 .
- ^ Хюльзенбек, JP; Ронквист, Ф.; Болбак, JP (2001). «Байесовский вывод филогении и его влияние на эволюционную биологию» (PDF) . Наука . 294 (5550): 2310–2314. Бибкод : 2001Sci...294.2310H . дои : 10.1126/science.1065889 . ПМИД 11743192 . S2CID 2138288 .
- ^ Jump up to: а б Уэйд, PR (2000). «Байесовские методы в биологии сохранения» (PDF) . Биология сохранения . 14 (5): 1308–1316. дои : 10.1046/j.1523-1739.2000.99415.x . S2CID 55853118 .
- ^ Трезвый, Э. (1991). Реконструкция прошлого: экономия, эволюция и умозаключения . Книга Брэдфорда. п. 284. ИСБН 978-0-262-69144-4 .
- ^ Хелфенбайн, КГ; ДеСалле, Р. (2005). «Фальсификации и подтверждения: влияние Карла Поппера на систематику» (PDF) . Молекулярная филогенетика и эволюция . 35 (1): 271–280. дои : 10.1016/j.ympev.2005.01.003 . ПМИД 15737596 .
- ^ Финберг, SE; Кадане, Дж. Б. (1983). «Представление байесовского статистического анализа в судебных разбирательствах». Журнал Королевского статистического общества, серия D. 32 (1/2): 88–98. дои : 10.2307/2987595 . JSTOR 2987595 .
- ^ Гаро, MC (1990). «Правовые стандарты и статистические доказательства в судебных процессах по Разделу VII: в поисках последовательной модели несопоставимого воздействия» . Обзор права Пенсильванского университета . 139 (2): 455–503. дои : 10.2307/3312286 . JSTOR 3312286 .
- ^ Jump up to: а б Гарвардская ассоциация по обзору права (1995). «Развитие законодательства: решение новых проблем научных данных». Гарвардский обзор права . 108 (7): 1481–1605. дои : 10.2307/1341808 . JSTOR 1341808 .
- ^ Jump up to: а б с д и Фейгман, Д.Л. (1991). «Нормативное установление конституционных фактов»: изучение эмпирического компонента конституционной интерпретации» . Обзор права Пенсильванского университета . 139 (3): 541–613. doi : 10.2307/3312337 . JSTOR 3312337 .
Примечания [ править ]
- ↑ Верховный суд США Кастанеда против Партиды , 1977 г. [1] цитируется по Meier (1986) Там же. который заявляет: «Таким образом, менее чем за полгода Верховный суд перешел от традиционного юридического презрения к статистическим доказательствам к решительному одобрению того, что они способны самостоятельно возбудить дело prima facie против статистического доказательства». ответчик». [4]
- ^ 481 США 279 (1987). [19]