~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 7D2916A40361BCD4364736C16C65AA4E__1708370220 ✰
Заголовок документа оригинал.:
✰ Wilcoxon signed-rank test - Wikipedia ✰
Заголовок документа перевод.:
✰ Знаковый ранговый тест Уилкоксона — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Wilcoxon_signed-rank_test ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/7d/4e/7d2916a40361bcd4364736c16c65aa4e.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/7d/4e/7d2916a40361bcd4364736c16c65aa4e__translat.html ✰
Дата и время сохранения документа:
✰ 11.06.2024 00:43:09 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 19 February 2024, at 22:17 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Знаковый ранговый тест Уилкоксона — Википедия Jump to content

Знаковый тест Уилкоксона

Из Википедии, бесплатной энциклопедии

Знаковый ранговый критерий Уилкоксона это непараметрический ранговый критерий для проверки статистических гипотез, используемый либо для проверки местоположения популяции на основе выборки данных, либо для сравнения местоположения двух популяций с использованием двух совпадающих выборок. [1] Одновыборочная версия служит цели, аналогичной цели одновыборочного Стьюдента t- критерия . [2] Для двух совпадающих выборок это тест на парные различия критерию Стьюдента , подобный парному t- (также известному как « t -критерий для совпадающих пар» или « t -критерий для зависимых выборок»). Критерий Уилкоксона может быть хорошей альтернативой t -критерию, когда средние значения совокупности не представляют интереса; например, когда кто-то хочет проверить, отлична ли медиана популяции от нуля или существует ли вероятность выше 50% того, что выборка из одной популяции больше, чем выборка из другой популяции.

История [ править ]

Тест назван в честь Фрэнка Уилкоксона (1892–1965), который в одной статье предложил как его, так и критерий суммы рангов для двух независимых выборок. [3] Этот тест был популяризирован Сидни Сигелом (1956) в его влиятельном учебнике по непараметрической статистике. [4] Сигел использовал символ T для статистики теста, и, следовательно, тест иногда называют Уилкоксона T -тестом .

Процедура испытания [ править ]

Существует два варианта теста знакового ранга. С теоретической точки зрения тест с одной выборкой является более фундаментальным, поскольку тест с парной выборкой выполняется путем преобразования данных к ситуации теста с одной выборкой. Однако большинство практических применений критерия знакового ранга возникают при использовании парных данных.

Для парного выборочного теста данные состоят из выборок. . Каждый образец представляет собой пару измерений. В простейшем случае измерения производятся в интервальной шкале . Затем их можно преобразовать в действительные числа , а парный выборочный тест преобразуется в одновыборочный тест путем замены каждой пары чисел. по его разнице . [5] В общем, должна быть возможность ранжировать различия между парами. Для этого требуется, чтобы данные были в упорядоченной метрической шкале, типе шкалы, который несет больше информации, чем порядковая шкала, но может иметь меньше информации, чем интервальная шкала. [6]

Данные для одновыборочного теста представляют собой набор образцов действительных чисел. . Предположим для простоты, что выборки имеют разные абсолютные значения и ни одна выборка не равна нулю. (Ноли и связи создают некоторые сложности; см. ниже.) Тест выполняется следующим образом: [7] [8]

  1. Вычислить .
  2. Сортировать и используйте этот отсортированный список для присвоения рангов : ранг наименьшего наблюдения равен единице, ранг следующего наименьшего наблюдения равен двум и так далее.
  3. Позволять обозначим знаковую функцию : если и если . представляет Статистика теста собой сумму знакового ранга. :
  4. Создайте -значение путем сравнения его распределению при нулевой гипотезе.

Ранги определены так, что это количество для которого . Кроме того, если таков, что , затем для всех .

Знаковая сумма тесно связан с двумя другими статистическими данными испытаний. Сумма положительного ранга и сумма отрицательного ранга определяются [9]

Потому что равно сумме всех рангов, что , эти три статистики связаны соотношением: [10]
Потому что , , и несут одну и ту же информацию, любой из них может быть использован в качестве тестовой статистики.

Сумма положительного ранга и сумма отрицательного ранга имеют альтернативные интерпретации, которые полезны для теории, лежащей в основе теста. Определите среднее значение Уолша быть . Затем: [11]

Нулевые и альтернативные гипотезы [ править ]

Одновыборочный тест [ править ]

Одновыборочный знаково-ранговый критерий Уилкоксона можно использовать для проверки того, поступают ли данные из симметричной совокупности с заданной медианой. [12] Если медиана популяции известна, ее можно использовать для проверки того, симметричны ли данные относительно ее центра. [13]

Чтобы формально объяснить нулевую и альтернативную гипотезы, предположим, что данные состоят из независимых и одинаково распределенных выборок из распределения . Если и являются IID -распределенные случайные величины, определим быть кумулятивной функцией распределения . Набор

Предположим, что является непрерывным. Одновыборочный критерий суммы знаковых рангов Уилкоксона представляет собой проверку следующей нулевой гипотезы на соответствие одной из следующих альтернативных гипотез: [14]

Нулевая гипотеза H 0
Односторонняя альтернативная гипотеза H 1
.
Односторонняя альтернативная гипотеза H 2
.
Двусторонняя альтернативная гипотеза H 3
.

Проверяемая альтернативная гипотеза зависит от того, используется ли тестовая статистика для вычисления одностороннего или двустороннего значения p (и, если одностороннее, то какой стороны). Если представляет собой фиксированную, заранее определенную величину, то тест также можно использовать в качестве теста на значение вычитая из каждой точки данных.

Вышеупомянутые нулевая и альтернативная гипотезы вытекают из того факта, что является последовательной оценкой . [15] Его также можно получить из описания и с точки зрения средних значений Уолша, поскольку это описание показывает, что критерий Уилкоксона аналогичен критерию знаков, применяемому к набору средних значений Уолша. [16]

Ограничение интересующих распределений может привести к появлению более интерпретируемых нулевых и альтернативных гипотез. Одно умеренно ограничительное предположение состоит в том, что имеет уникальную медиану. называется псевдомедианой Эта медиана ; в целом оно отличается от среднего значения и медианы, даже если существуют все три. Если существование уникальной псевдомедианы можно считать верным как при нулевой, так и при альтернативной гипотезе, то эти гипотезы можно переформулировать как:

Нулевая гипотеза H 0
Псевдомедиана находится в нуле.
Односторонняя альтернативная гипотеза H 1
Псевдомедиана находится по адресу .
Односторонняя альтернативная гипотеза H 2
Псевдомедиана находится по адресу .
Двусторонняя альтернативная гипотеза H 3
Псевдомедиана находится по адресу .

Чаще всего нулевая и альтернативная гипотезы формулируются в предположении симметрии. Исправьте действительное число . Определять быть симметричным относительно если случайная величина с раздачей удовлетворяет для всех . Если имеет функцию плотности , затем симметричен относительно если и только если для каждого . [17]

Если нулевые и альтернативные распределения можно считать симметричным, тогда нулевая и альтернативная гипотезы упрощаются до следующего: [18]

Нулевая гипотеза H 0
симметричен относительно .
Односторонняя альтернативная гипотеза H 1
симметричен относительно .
Односторонняя альтернативная гипотеза H 2
симметричен относительно .
Двусторонняя альтернативная гипотеза H 3
симметричен относительно .

Если вдобавок , затем является медианой . Если эта медиана уникальна, то критерий суммы знаковых рангов Уилкоксона становится проверкой местоположения медианы. [19] Когда среднее значение определено, то среднее значение равно , и тест также является проверкой местоположения среднего значения. [20]

Ограничение на симметричность альтернативного распределения является весьма строгим, но для односторонних тестов его можно ослабить. Скажи это стохастически меньше , чем распределение, симметричное относительно нуля , если -распределенная случайная величина удовлетворяет для всех . Сходным образом, стохастически больше , чем распределение, симметричное относительно нуля , если для всех . Тогда критерий суммы знаковых рангов Уилкоксона также можно использовать для следующих нулевых и альтернативных гипотез: [21] [22]

Нулевая гипотеза H 0
симметричен относительно .
Односторонняя альтернативная гипотеза H 1
стохастически меньше, чем распределение, симметричное относительно нуля.
Односторонняя альтернативная гипотеза H 2
стохастически больше, чем распределение, симметричное относительно нуля.

Гипотезу о том, что данные являются IID, можно ослабить. Каждая точка данных может быть взята из другого распределения, при условии, что все распределения считаются непрерывными и симметричными относительно общей точки. . Точки данных не обязаны быть независимыми, пока условное распределение каждого наблюдения с учетом остальных симметрично относительно . [23]

Тест парных данных [ править ]

Поскольку тест парных данных возникает в результате анализа парных разностей, его нулевые и альтернативные гипотезы могут быть получены из гипотез теста одной выборки. В каждом случае они становятся утверждениями о поведении различий. .

Позволять быть совместным кумулятивным распределением пар . Если непрерывна, то наиболее общие нулевая и альтернативная гипотезы выражаются через

и идентичны одновыборочному случаю:

Нулевая гипотеза H 0
Односторонняя альтернативная гипотеза H 1
.
Односторонняя альтернативная гипотеза H 2
.
Двусторонняя альтернативная гипотеза H 3
.

Как и в случае с одной выборкой, при некоторых ограничениях тест можно интерпретировать как проверку того, находится ли псевдомедиана разностей на нуле.

Распространенным ограничением является симметричное распределение различий. В этом случае нулевая и альтернативная гипотезы таковы: [24] [25]

Нулевая гипотеза H 0
Наблюдения симметричны относительно .
Односторонняя альтернативная гипотеза H 1
Наблюдения симметричны относительно .
Односторонняя альтернативная гипотеза H 2
Наблюдения симметричны относительно .
Двусторонняя альтернативная гипотеза H 3
Наблюдения симметричны относительно .

Их также можно выразить более непосредственно через исходные пары: [26]

Нулевая гипотеза H 0
Наблюдения взаимозаменяемы что , а это означает, и имеют одинаковое распределение. Эквивалентно, .
Односторонняя альтернативная гипотеза H 1
Для некоторых , пары и имеют одинаковое распределение.
Односторонняя альтернативная гипотеза H 2
Для некоторых , пары и имеют одинаковое распределение.
Двусторонняя альтернативная гипотеза H 3
Для некоторых , пары и имеют одинаковое распределение.

Нулевая гипотеза об обменности может возникнуть в результате парного эксперимента с экспериментальной и контрольной группой. Рандомизация лечения и контроля внутри каждой пары делает наблюдения взаимозаменяемыми. Для сменного дистрибутива имеет то же распределение, что и , и, следовательно, при нулевой гипотезе распределение симметрично относительно нуля. [27]

Поскольку одновыборочный тест можно использовать в качестве одностороннего теста на стохастическое доминирование, критерий Уилкоксона парных разностей можно использовать для сравнения следующих гипотез: [28]

Нулевая гипотеза H 0
Наблюдения являются взаимозаменяемыми.
Односторонняя альтернативная гипотеза H 1
Различия стохастически меньше, чем распределение, симметричное относительно нуля, то есть для каждого , .
Односторонняя альтернативная гипотеза H 2
Различия стохастически больше, чем распределение, симметричное относительно нуля, то есть для каждого , .

Нули и связи [ править ]

В реальных данных иногда бывает, что есть выборка что равно нулю или паре с . Также может случиться, что имеются связанные образцы. Это означает, что для некоторых , у нас есть (в случае одной выборки) или (в случае парной выборки). Это особенно характерно для дискретных данных. В этом случае процедура тестирования, определенная выше, обычно не определена, поскольку не существует способа однозначно ранжировать данные. (Единственное исключение – если имеется один образец который равен нулю и не имеет других нулей или связей.) По этой причине необходимо изменить статистику теста.

Нули [ править ]

В оригинальной статье Уилкоксона не затрагивался вопрос наблюдений (или, в случае парной выборки, различий), равных нулю. Однако в более поздних опросах он рекомендовал убрать нули из выборки. [29] Затем к полученным данным можно было применить стандартный критерий знакового ранга, если не было никаких связей. Теперь это называется процедурой сокращенной выборки.

Пратт [30] заметил, что процедура сокращенной выборки может привести к парадоксальному поведению. Он приводит следующий пример. Предположим, что мы находимся в ситуации с одной выборкой и имеем следующие тринадцать наблюдений:

0, 2, 3, 4, 6, 7, 8, 9, 11, 14, 15, 17, −18.

Процедура сокращенной выборки удаляет ноль. Оставшимся данным присваиваются знаковые ранги:

1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, −12.

Это имеет одностороннее p -значение , и, следовательно, выборка не является достоверно положительной ни на каком уровне значимости . Пратт утверждает, что можно было бы ожидать, что уменьшение количества наблюдений определенно не приведет к тому, что данные будут выглядеть более позитивными. Однако если нулевое наблюдение уменьшается на величину меньше 2 или если все наблюдения уменьшаются на величину меньше 1, то ранги со знаком становятся:

−1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, −13.

Это имеет одностороннее p -значение . Следовательно, выборка будет считаться значимо положительной на любом уровне значимости. . Парадокс заключается в том, что если между и , то уменьшение незначительной выборки приводит к тому, что она становится значительно положительной .

Поэтому Пратт предложил процедуру нулевого знакового ранга. Эта процедура включает нули при ранжировании выборок. Однако он исключает их из тестовой статистики или, что то же самое, определяет . Пратт доказал, что процедура нулевого знакового ранга имеет несколько желательных свойств, которых нет в процедуре сокращенной выборки: [31]

  1. Увеличение наблюдаемых значений не делает существенно положительную выборку незначительной, а незначительная выборка не делает существенно отрицательной.
  2. Если распределение наблюдений симметрично, то значения которые тест не отклоняет из интервала.
  3. Выборка является значимо положительной, незначимой или существенно отрицательной тогда и только тогда, когда это так, когда нулям присвоены произвольные ненулевые знаки, тогда и только тогда, когда это так, когда нули заменяются ненулевыми значениями, которые меньше по абсолютной величине, чем любое ненулевое наблюдение.
  4. Для фиксированного порога значимости , а для теста, который рандомизирован для получения точного уровня , вероятность назвать набор наблюдений значимо положительным (соответственно существенно отрицательным) является неубывающей (соответственно невозрастающей) функцией наблюдений.

Пратт отмечает, что когда процедура нулевого знакового ранга объединяется с процедурой среднего ранга для разрешения связей, полученный тест является последовательным тестом против альтернативной гипотезы, согласно которой для всех , и отличаются по крайней мере на фиксированную константу, независящую от и . [32]

Процедура нулевого знакового ранга имеет тот недостаток, что при появлении нулей нулевое распределение тестовой статистики меняется, поэтому таблицы p -значений больше нельзя использовать.

Когда данные представлены по шкале Лайкерта с равноотстоящими друг от друга категориями, процедура нулевого знакового ранга с большей вероятностью сохранит частоту ошибок типа I, чем процедура сокращенной выборки. [33]

С точки зрения статистической эффективности не существует идеального правила обработки нулей. Коновер нашел примеры нулевых и альтернативных гипотез, которые показывают, что ни один из методов Уилкоксона и Пратта не является однозначно лучшим, чем другой. При сравнении дискретного равномерного распределения с распределением, в котором вероятности линейно возрастают слева направо, метод Пратта превосходит метод Уилкоксона. При тестировании биномиального распределения с центром в нуле, чтобы увидеть, является ли параметр каждого испытания Бернулли , метод Уилкоксона превосходит метод Пратта. [34]

Галстуки [ править ]

Когда данные не имеют связей, ранги используются для расчета статистики теста. При наличии связей звания не определяются. Есть два основных подхода к решению этой проблемы.

Наиболее распространенная процедура обработки ничьих, первоначально рекомендованная Уилкоксоном, называется процедурой среднего ранга или процедурой среднего ранга. номера от 1 до n Эта процедура присваивает наблюдениям , при этом два наблюдения получают одинаковый номер тогда и только тогда, когда они имеют одинаковое абсолютное значение. Эти числа условно называются рангами, хотя множество этих чисел не равно (за исключением случаев, когда нет ничьих). Ранг, присвоенный наблюдению, представляет собой среднее из возможных рангов, которые оно могло бы иметь, если бы связи были нарушены всеми возможными способами. После присвоения рангов статистика теста рассчитывается так же, как обычно. [35] [36]

Например, предположим, что наблюдения удовлетворяют

В этом случае, присвоено 1 ранг, и присваиваются звания , присвоен ранг 4, и , , и присваиваются звания . Формально предположим, что существует набор наблюдений, имеющих одинаковое абсолютное значение. , что наблюдения имеют абсолютное значение меньше, чем , и это наблюдения имеют абсолютное значение меньше или равное . Если связи между наблюдениями с абсолютным значением были нарушены, то эти наблюдения заняли бы ряды через . Таким образом, процедура среднего ранга присваивает им ранг .

При использовании процедуры среднего ранга нулевое распределение отличается при наличии связей. [37] [38] Процедура среднего ранга также имеет некоторые недостатки, аналогичные недостаткам процедуры сокращенной выборки для нулей. Вполне возможно, что выборка может быть оценена как значительно положительная с помощью процедуры среднего ранга; но увеличение некоторых значений так, чтобы разорвать связи, или разрыв связей каким-либо образом приводит к получению выборки, которую тест считает незначительной. [39] [40] Однако увеличение всех наблюдаемых значений на одинаковую величину не может превратить существенно положительный результат в незначимый, а незначительный - в существенно отрицательный. При этом, если наблюдения распределены симметрично, то значения которые тест не отклоняет из интервала. [41] [42]

Другим распространенным вариантом разрешения ничьих является процедура разрешения ничьих. В процедуре разрешения конфликтов наблюдениям присваиваются отдельные ранги в наборе . Ранг, присвоенный наблюдению, зависит от его абсолютного значения и правила разрешения ничьей. Наблюдениям с меньшими абсолютными значениями всегда присваиваются меньшие ранги, как и в стандартном тесте суммы рангов. Правило разрешения конфликтов используется для присвоения рангов наблюдениям с одинаковым абсолютным значением. Одним из преимуществ правил разрешения конфликтов является то, что они позволяют использовать стандартные таблицы для вычисления p -значений. [43]

Случайный тай-брейк разрывает ничью случайным образом. При случайном выявлении связей нулевое распределение такое же, как и при отсутствии связей, но результат теста зависит не только от данных, но и от дополнительных случайных выборов. Усреднение рангов по возможным случайным выборам приводит к процедуре среднего ранга. [44] Можно также сообщить о вероятности отклонения всех случайных выборов. [45] Случайное определение тай-брейка имеет то преимущество, что вероятность того, что выборка будет признана значительно положительной, не уменьшается при увеличении числа наблюдений. [46] Консервативный подход разрывает связи в пользу нулевой гипотезы. При выполнении одностороннего теста, при котором отрицательные значения имеют тенденцию быть более значимыми, связи разрываются путем присвоения более низких рангов отрицательным наблюдениям и более высоких - положительным. Когда тест дает положительные значения существенны, связи разрываются в другую сторону, и когда большие абсолютные значения значимы, связи разрываются, чтобы сделать как можно меньше. Пратт отмечает, что, когда ничья вероятны, консервативная процедура разрешения ничьей «предположительно имеет низкую эффективность, поскольку она равносильна разрыву всех связей в пользу нулевой гипотезы». [47]

Процедура среднего ранга может не совпадать с процедурой определения тай-брейка. Пратт приводит следующий пример. [48] Предположим, что наблюдения:

1, 1, 1, 1, 2, 3, −4.

Процедура среднего ранга присваивает им знаковые ранги.

2.5, 2.5, 2.5, 2.5, 5, 6, −7.

Этот образец значительно положителен на одностороннем уровне. . С другой стороны, любое правило тай-брейка будет присваивать ранги

1, 2, 3, 4, 5, 6, −7.

На том же одностороннем уровне , это не существенно.

Два других варианта решения ничьей основаны на усреднении результатов тай-брейка. В методе средней статистики тестовая статистика рассчитывается для всех возможных способов разрыва ничьих, а окончательная статистика представляет собой среднее значение статистики разрыва ничьих. В средней вероятности методе значение p вычисляется для каждого возможного способа разрыва связей, а окончательное значение p представляет собой среднее значение p- значений, связанных с ничьей. [49]

нулевого распределения Вычисление

Вычисление значений p требует знания распределения при нулевой гипотезе. Для этого распределения не существует закрытой формулы. [50] Однако для небольших значений , распределение может быть вычислено точно. При нулевой гипотезе, что данные симметричны относительно нуля, каждый с такой же вероятностью будет положительным, как и отрицательным. Поэтому вероятность того, что при нулевой гипотезе равно числу комбинаций знаков, которые дают разделить на количество возможных комбинаций знаков . Это можно использовать для расчета точного распределения при нулевой гипотезе. [51]

Вычисление распределения рассмотрение всех возможностей требует вычислений суммы, что невыполнимо для всех, кроме самых маленьких . Однако существует эффективная рекурсия для распределения . [52] [53] Определять — количество комбинаций знаков, для которых . Это равно количеству подмножеств какая сумма . Базовые случаи рекурсии: , для всех , и для всех или . Рекурсивная формула

Формула верна, поскольку каждое подмножество что в сумме равно либо не содержит , и в этом случае это также подмножество , или оно содержит , в этом случае удаление из подмножества производит подмножество что в сумме равно . Согласно нулевой гипотезе, функция массы вероятности удовлетворяет . Функция тесно связана с целочисленной функцией распределения . [54]

Если это вероятность того, что при нулевой гипотезе, когда имеются образцы, затем удовлетворяет аналогичной рекурсии: [55]

с аналогичными граничными условиями. Существует также рекурсивная формула для кумулятивной функции распределения . [56]

Для очень больших , даже приведенная выше рекурсия слишком медленная. В этом случае нулевое распределение может быть аппроксимировано. Нулевые распределения , , и асимптотически нормальны со средними и дисперсиями: [57]

Лучшие приближения можно получить, используя разложения Эджворта. Использование разложения Эджворта четвертого порядка показывает, что: [58] [59]

где
Техническая основа этих разложений весьма сложна, поскольку обычные разложения Эджворта применимы к суммам непрерывных случайных величин IID, а представляет собой сумму неодинаково распределенных дискретных случайных величин. Однако окончательный результат заключается в том, что приведенное выше расширение имеет ошибку , как обычное расширение Эджворта четвертого порядка. [58]

Производящая функция момента имеет точную формулу: [60]

Когда присутствуют нули и используется процедура обнуления знакового ранга, или когда присутствуют связи и используется процедура среднего ранга, нулевое распределение изменения. Кюретон получил нормальное приближение для этой ситуации. [61] [62] Предположим, что исходное количество наблюдений было и количество нулей было . Коррекция связи

где сумма по всем размерам каждой группы связанных наблюдений. Ожидание по-прежнему равно нулю, в то время как ожидание является
Если
затем

Альтернативная статистика [ править ]

Уилкоксон [63] первоначально определил статистику суммы рангов Уилкоксона как . Ранние авторы, такие как Сигел [64] последовал за Уилкоксоном. Это подходит для двусторонних проверок гипотез, но не может использоваться для односторонних проверок.

Вместо присвоения рангов от 1 до n также можно присваивать ранги от 0 до . Это так называемые модифицированные ранги . [65] Модифицированная сумма знакового ранга , модифицированная сумма положительного ранга и модифицированная сумма отрицательного ранга определяются аналогично , , и но с измененными званиями вместо обычных званий. Вероятность того, что сумма двух независимых -распределенная случайная величина положительна, может быть оценена как . [66] Когда рассмотрение ограничивается непрерывными распределениями, это несмещенная оценка минимальной дисперсии . [67]

Пример [ править ]

1 125 110 1 15
2 115 122  –1 7
3 130 125 1 5
4 140 120 1 20
5 140 140   0
6 115 124  –1 9
7 140 123 1 17
8 125 137  –1 12
9 140 135 1 5
10 135 145  –1 10
упорядочить по абсолютной разнице
5 140 140   0    
3 130 125 1 5 1.5 1.5
9 140 135 1 5 1.5 1.5
2 115 122  –1 7 3  –3
6 115 124  –1 9 4  –4
10 135 145  –1 10 5  –5
8 125 137  –1 12 6  –6
1 125 110 1 15 7 7
7 140 123 1 17 8 8
4 140 120 1 20 9 9

- знаковая функция , является абсолютной величиной , и это звание . Обратите внимание, что пары 3 и 9 связаны по абсолютному значению. Им будут присвоены ранги 1 и 2, поэтому каждый получает среднее значение этих рангов — 1,5.

что медиана парных разностей отлична от нуля.
The -значение для этого результата

Размер эффекта [ править ]

Чтобы вычислить величину эффекта для теста знакового ранга, можно использовать ранг-бисериальную корреляцию .

Если сообщается тестовая статистика T , ранговая корреляция r равна тестовой статистике T , разделенной на общую сумму рангов S , или r = T / S . [68] В приведенном выше примере статистика теста равна T = 9. Размер выборки, равный 9, имеет общую сумму рангов S = (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9) = 45. Следовательно, ранговая корреляция равна 9/45, поэтому r = 0,20.

Если сообщается тестовая статистика T , эквивалентным способом вычисления ранговой корреляции является использование разницы в пропорциях между двумя суммами рангов, что представляет собой формулу простой разности Керби (2014). [68] Продолжая текущий пример, размер выборки равен 9, поэтому общая сумма рангов равна 45. T — меньшая из двух сумм рангов, поэтому T равна 3 + 4 + 5 + 6 = 18. Только из этой информации можно сделать вывод, что Оставшуюся сумму рангов можно вычислить, поскольку это общая сумма S минус T или, в данном случае, 45 - 18 = 27. Далее, две пропорции суммы рангов: 27/45 = 60% и 18/45 = 40%. Наконец, ранговая корреляция представляет собой разницу между двумя пропорциями (0,60 минус 0,40), следовательно, r = 0,20.

Программные реализации [ править ]

  • R включает реализацию теста как wilcox.test(x,y, paired=TRUE), где x и y — векторы одинаковой длины. [69]
  • ALGLIB включает реализацию знакового рангового теста Уилкоксона на C++, C#, Delphi, Visual Basic и т. д.
  • GNU Octave реализует различные односторонние и двусторонние версии теста в wilcoxon_test функция.
  • SciPy включает в себя реализацию знакового рангового теста Уилкоксона на Python.
  • Accord.NET включает реализацию знакового рангового теста Уилкоксона на C# для приложений .NET.
  • MATLAB реализует этот тест с использованием «теста суммы рангов Уилкоксона», поскольку [p,h] =signrank(x,y) также возвращает логическое значение, указывающее решение теста. Результат h = 1 указывает на отклонение нулевой гипотезы, а h = 0 указывает на неспособность отвергнуть нулевую гипотезу на уровне значимости 5%.
  • Пакет Julia HypothesisTests включает в себя тест знакового ранга Уилкоксона как «value(SignedRankTest(x, y))».
  • SAS PROC UNIVARIATE включает ранговый тест со знаком Уилкоксона в заголовках рамок «Тесты на определение местоположения» как «Знаковый ранг». Несмотря на то, что эта процедура рассчитывает S-статистику, а не W-статистику, полученное значение p все равно можно использовать для этого теста. [70]

См. также [ править ]

Ссылки [ править ]

  1. ^ Коновер, WJ (1999). Практическая непараметрическая статистика (3-е изд.). Джон Уайли и сыновья, Inc. ISBN  0-471-16068-7 . , п. 350
  2. ^ «Знаково-ранговый тест Уилкоксона - Справочник по биологической статистике» . www.biostathandbook.com . Проверено 02 сентября 2021 г.
  3. ^ Уилкоксон, Фрэнк (декабрь 1945 г.). «Индивидуальные сравнения методами ранжирования» (PDF) . Биометрический бюллетень . 1 (6): 80–83. дои : 10.2307/3001968 . hdl : 10338.dmlcz/135688 . JSTOR   3001968 .
  4. ^ Сигел, Сидни (1956). Непараметрическая статистика для поведенческих наук . Нью-Йорк: МакГроу-Хилл. стр. 75–83. ISBN  9780070573482 .
  5. ^ Коновер, с. 352
  6. ^ Сигел, с. 76
  7. ^ Коновер, с. 353
  8. ^ Пратт, Джон В.; Гиббонс, Джин Д. (1981). Концепции непараметрической теории . Спрингер-Верлаг. ISBN  978-1-4612-5933-6 . , п. 148
  9. ^ Пратт и Гиббонс, с. 148
  10. ^ Пратт и Гиббонс, с. 148
  11. ^ Пратт и Гиббонс, с. 150
  12. ^ Коновер, стр. 352–357.
  13. ^ Хеттманспергер, Томас П. (1984). Статистический вывод на основе рангов . Джон Уайли и сыновья. ISBN  0-471-88474-Х . , стр. 32, 50
  14. ^ Пратт и Гиббонс, с. 153
  15. ^ Пратт и Гиббонс, стр. 153–154.
  16. ^ Хеттманспергер, стр. 38–39.
  17. ^ Пратт и Гиббонс, стр. 146–147.
  18. ^ Пратт и Гиббонс, стр. 146–147.
  19. ^ Хеттманспергер, стр. 30–31.
  20. ^ Коновер, с. 353
  21. ^ Пратт и Гиббонс, стр. 155–156.
  22. ^ Хеттманспергер, стр. 49–50.
  23. ^ Пратт и Гиббонс, с. 155
  24. ^ Коновер, с. 354
  25. ^ Холландер, Майлс ; Вулф, Дуглас А.; Цыпленок, Эрик (2014). Непараметрические статистические методы (Третье изд.). Джон Уайли и сыновья, Inc. ISBN  978-0-470-38737-5 . , стр. 39–41.
  26. ^ Пратт и Гиббонс, с. 147
  27. ^ Пратт и Гиббонс, с. 147
  28. ^ Хеттманспергер, стр. 49–50.
  29. ^ Уилкоксон, Фрэнк (1949). Некоторые быстрые приближенные статистические процедуры . Американская компания Cynamic.
  30. ^ Пратт, Дж. (1959). «Замечания о нулях и связях в процедурах ранжирования со знаком Уилкоксона». Журнал Американской статистической ассоциации . 54 (287): 655–667. дои : 10.1080/01621459.1959.10501526 .
  31. ^ Пратт, стр. 659.
  32. ^ Пратт, стр. 663.
  33. ^ Деррик, Б; Уайт, П. (2017). «Сравнение двух выборок по отдельному вопросу Лайкерта». Международный журнал математики и статистики . 18 (3): 1–13.
  34. ^ Коновер, Уильям Джей (1973). «О методах обработки связей в критерии знаковых рангов Уилкоксона». Журнал Американской статистической ассоциации . 68 (344): 985–988. дои : 10.1080/01621459.1973.10481460 .
  35. ^ Пратт и Гиббонс, с. 162
  36. ^ Коновер, стр. 352–353.
  37. ^ Пратт и Гиббонс, с. 164
  38. ^ Коновер, стр. 358–359.
  39. ^ Пратт, стр. 660.
  40. ^ Пратт и Гиббонс, стр. 168–169.
  41. ^ Пратт, стр. 661–662.
  42. ^ Пратт и Гиббонс, с. 170
  43. ^ Пратт и Гиббонс, стр. 163, 166.
  44. ^ Пратт, стр. 660.
  45. ^ Пратт и Гиббонс, с. 166
  46. ^ Пратт и Гиббонс, с. 171
  47. ^ Пратт, стр. 661.
  48. ^ Пратт, стр. 660.
  49. ^ Гиббонс, Джин Д.; Чакраборти, Субхабрата (2011). Непараметрический статистический вывод (Пятое изд.). Чепмен и Холл/CRC. ISBN  978-1-4200-7762-9 . , п. 194
  50. ^ Хеттманспергер, с. 34
  51. ^ Пратт и Гиббонс, стр. 148–149.
  52. ^ Пратт и Гиббонс, стр. 148–149, стр. 186–187.
  53. ^ Хеттманспергер, с. 171
  54. ^ Пратт и Гиббонс, с. 187
  55. ^ Пратт и Гиббонс, с. 187
  56. ^ Пратт и Гиббонс, с. 187
  57. ^ Пратт и Гиббонс, с. 149
  58. ^ Перейти обратно: а б Коласса, Джон Э. (1995). «Аппроксимации Эджворта для статистики теста суммы рангов» . Статистика и вероятностные буквы . 24 (2): 169–171. дои : 10.1016/0167-7152(95)00164-H .
  59. ^ Хеттманспергер, с. 37
  60. ^ Хеттманспергер, с. 35
  61. ^ Кюртон, Эдвард Э. (1967). «Нормальное приближение к выборочному распределению знакового ранга при наличии нулевых различий». Журнал Американской статистической ассоциации . 62 (319): 1068–1069. дои : 10.1080/01621459.1967.10500917 .
  62. ^ Пратт и Гиббонс, с. 193
  63. ^ Уилкоксон, с. 82
  64. ^ Сигел, с. 76
  65. ^ Пратт и Гиббонс, с. 158
  66. ^ Пратт и Гиббонс, с. 159
  67. ^ Пратт и Гиббонс, с. 191
  68. ^ Перейти обратно: а б Керби, Дэйв С. (2014), «Формула простой разницы: подход к обучению непараметрической корреляции», Комплексная психология , 3 : 11.IT.3.1, doi : 10.2466/11.IT.3.1
  69. ^ Далгаард, Питер (2008). Вводная статистика с R Springer Science & Business Media. стр. 100-1 99–100. ISBN  978-0-387-79053-4 .
  70. ^ «Знаково-ранговый тест Уилкокса: инструкция SAS» . www.stat.purdue.edu . Проверено 24 августа 2023 г.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 7D2916A40361BCD4364736C16C65AA4E__1708370220
URL1:https://en.wikipedia.org/wiki/Wilcoxon_signed-rank_test
Заголовок, (Title) документа по адресу, URL1:
Wilcoxon signed-rank test - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)