Манна-Уитни U- тест

Манн-Уитни $U$ тест (также называемый критерием Манна-Уитни-Уилкоксона ( MWW/MWU ), критерием суммы рангов Уилкоксона или критерием Уилкоксона-Манна-Уитни ) — это непараметрический тест нулевой гипотезы , который для случайно выбранных значений X и Y из двух популяций , вероятность того, что X больше Y , равна вероятности того, что Y больше X .

Непараметрические критерии, используемые для двух зависимых выборок, — это знаковый критерий и знаково-ранговый критерий Уилкоксона .

Предположения и формальная формулировка гипотез

Хотя Генри Манн и Дональд Рэнсом Уитни ^[1] критерий Манна-Уитни разработали U- в предположении непрерывных ответов с альтернативной гипотезой, заключающейся в том, что одно распределение стохастически больше другого. Существует много других способов сформулировать нулевую и альтернативную гипотезы, такие как U- критерий Манна-Уитни даст действительный тест. ^[2]

В очень общей формулировке предполагается, что:

Все наблюдения обеих групп независимы друг от друга,
Ответы как минимум порядковые (т. е. можно сказать, по крайней мере, из любых двух наблюдений, какое из них больше),
При нулевой гипотезе H ₀ распределения обеих популяций идентичны. ^[3]
Альтернативная гипотеза H ₁ состоит в том, что распределения не идентичны.

Согласно общей формулировке, тест является состоятельным происходит следующее только тогда, когда при H ₁ :

Вероятность того, что наблюдение из популяции X превысит наблюдение из популяции Y , отличается (больше или меньше), чем вероятность того, что наблюдение из Y превысит наблюдение из X ; т. е. $P(X > Y) \neq P(Y > X)$ или $P (X > Y) + 0,5 \cdot P (X = Y) \neq 0,5$ .

При более строгих предположениях, чем общая формулировка, приведенная выше, например, если предполагается, что реакции непрерывны, а альтернатива ограничена сдвигом местоположения, т. е. $F 1 (x) = F 2 (x + δ)$ , мы можем интерпретировать значительный U- критерий Манна-Уитни, показывающий разницу в медианах. В соответствии с этим предположением о смещении местоположения мы также можем интерпретировать U- критерий Манна-Уитни как оценку того, отличается ли оценка Ходжеса-Лемана разницы в центральной тенденции между двумя популяциями от нуля. Оценка Ходжеса -Лемана для этой задачи с двумя выборками представляет собой медиану всех возможных различий между наблюдением в первой выборке и наблюдением во второй выборке.

В противном случае, если как дисперсии, так и формы распределения обеих выборок различаются, U- критерий Манна – Уитни не проходит проверку медиан. Можно показать примеры, когда медианы численно равны, в то время как тест отклоняет нулевую гипотезу с небольшим значением p. ^[4] ^[5] ^[6]

критерий Манна-Уитни U- /критерий суммы рангов Уилкоксона — это не то же самое, что Уилкоксона критерий знакового ранга , хотя оба они являются непараметрическими и включают суммирование рангов . критерий Манна-Уитни U- применяется к независимым выборкам. Знако-ранговый критерий Уилкоксона применяется к совпадающим или зависимым выборкам.

статистика

Позволять $X_{1},\ldots ,X_{n_{1}}$ быть образцом iid из $X$ , и $Y_{1},\ldots ,Y_{n_{2}}$ образец iid из $Y$ , и обе выборки независимы друг от друга. Соответствующая -статистика Манна – Уитни U определяется как меньшая из:

U_{1}=n_{1}n_{2}+{\tfrac {n_{1}(n_{1}+1)}{2}}-R_{1},U_{2}=n_{1}n_{2}+{\tfrac {n_{2}(n_{2}+1)}{2}}-R_{2}

с

R_{1},R_{2}

представляет собой сумму рангов в группах 1 и 2 после объединения всех выборок в один набор (см. ниже), где наименьшее значение получает ранг 1 и так далее. ^[7]

Статистика площади под кривой (AUC) для кривых ROC

Статистика U связана с площадью под рабочей характеристики приемника кривой ( AUC ): ^[8]

\mathrm {AUC} _{1}={U_{1} \over n_{1}n_{2}}

Обратите внимание, что это то же определение, что и размер общего языкового эффекта , т. е. вероятность того, что классификатор поставит случайно выбранный положительный экземпляр выше, чем случайно выбранный отрицательный (при условии, что «положительный» ранг выше, чем «отрицательный»). ^[9]

Благодаря своей вероятностной форме статистика U может быть обобщена до меры способности разделения классификатора для более чем двух классов: ^[10]

M={1 \over c(c-1)}\sum \mathrm {AUC} _{k,\ell }

Где c — количество классов, а R _{k , ℓ} член _{AUC k , ℓ} учитывает только ранжирование элементов, принадлежащих классам k и ℓ (т. е. элементы, принадлежащие всем другим классам, игнорируются) согласно оценкам классификатора. вероятности того, что эти предметы принадлежат классу k . AUC _{k , k} всегда будет равна нулю, но, в отличие от двухклассного случая, обычно $AUC k, ℓ \neq AUC ℓ, k$ , поэтому сумма показателей M суммируется по всем парам ( k , ℓ ), фактически используя среднее значение AUC _{k , ℓ} и AUC _{ℓ , k} .

Расчеты

Тест включает в себя вычисление статистики , обычно называемой U , распределение которой при нулевой гипотезе известно:

В случае небольших выборок распределение записывается в таблицу.
Для размеров выборки более ~20 аппроксимация с использованием нормального распределения достаточно хороша.

В качестве альтернативы нулевое распределение можно аппроксимировать с помощью тестов перестановок и моделирования Монте-Карло.

В некоторых книгах статистические данные, эквивалентные U , представлены в таблицах, например, сумма рангов в одной из выборок, а не U. сама

критерий Манна-Уитни U- включен в большинство статистических пакетов .

Его также легко рассчитать вручную, особенно для небольших выборок. Есть два способа сделать это.

Способ первый:

Для сравнения двух небольших наборов наблюдений прямой метод является быстрым и дает представление о значении статистики U , которая соответствует количеству побед во всех парных соревнованиях (см. пример черепахи и зайца в разделе «Примеры» ниже). Для каждого наблюдения в одном наборе подсчитайте, сколько раз это первое значение выигрывает у любых наблюдений в другом наборе (другое значение проигрывает, если первое значение больше). При любой ничьей отсчитывайте 0,5. Сумма побед и ничьих равна U (т.е.: $U_{1}$ ) для первого набора. U для другого набора является обратным (т.е.: $U_{2}$ ).

Способ второй:

Для более крупных образцов:

Присвойте числовые ранги всем наблюдениям (поместите наблюдения из обеих групп в один набор), начиная с 1 для наименьшего значения. При наличии групп связанных значений присвойте ранг, равный середине нескорректированных рейтингов (например, ранги $(3, 5, 5, 5, 5, 8)$ равны $(1, 3,5, 3,5, 3,5, 3,5, 6). )$ , где нескорректированные ранги будут $(1, 2, 3, 4, 5, 6)$ ).
Теперь сложите ранги наблюдений, полученных из выборки 1. Теперь определена сумма рангов в выборке 2, поскольку сумма всех рангов равна $N (N + 1)/2,$ где N — общее количество наблюдений. .
Тогда U определяется следующим образом: ^[11]

U_{1}=R_{1}-{n_{1}(n_{1}+1) \over 2}\,\!

где n ₁ — размер выборки для выборки 1, а R ₁ — сумма рангов в выборке 1.

Обратите внимание, что не имеет значения, какой из двух образцов считается образцом 1. Столь же верная формула для U :

U_{2}=R_{2}-{n_{2}(n_{2}+1) \over 2}\,\!

Меньшее значение U ₁ и U ₂ используется при просмотре таблиц значимости. Сумма двух значений определяется выражением

U_{1}+U_{2}=R_{1}-{n_{1}(n_{1}+1) \over 2}+R_{2}-{n_{2}(n_{2}+1) \over 2}.\,\!

Зная, что

R 1 + R 2 = N (N + 1)/2

и

N = n 1 + n 2

, и занимаясь алгеброй , мы находим, что сумма равна

U 1 + U 2 знак равно п 1 п 2

.

Характеристики

Максимальное значение U представляет собой произведение размеров выборки для двух выборок (т.е.: $U_{i}=n_{1}n_{2}$ ). В таком случае «другой» U будет равен 0.

Примеры

Иллюстрация методов расчета

Предположим, что Эзоп недоволен своим классическим экспериментом, в котором было обнаружено, что одна черепаха победила одного зайца в гонке, и решает провести проверку значимости, чтобы выяснить, можно ли распространить результаты на черепах и зайцев в целом. Он собирает выборку из 6 черепах и 6 зайцев и заставляет их всех участвовать в забеге одновременно. Порядок, в котором они достигают финишной стойки (их ранг, от первого до последнего пересечения финишной черты), следующий: T обозначает черепаху, а H — зайца:

ТХХХЧТТТТТТТТТТТТ

Какова ценность У ?

Прямым методом берем по очереди каждую черепаху и считаем, сколько зайцев она побьет, получая 6, 1, 1, 1, 1, 1, что означает, что $U T = 11$ . Альтернативно, мы могли бы взять каждого зайца по очереди и посчитать, сколько черепах он побьет. В этом случае мы получаем 5, 5, 5, 5, 5, 0, поэтому $U H = 25$ . Обратите внимание, что сумма этих двух значений для $U = 36$ , что составляет $6\times6$ .
Используя косвенный метод:

ранжируйте животных по времени, которое им потребуется на прохождение курса, поэтому присвойте первому приюту для животных ранг 12, второму ранг 11 и так далее.

сумма рангов, достигнутых черепахами, равна

12 + 6 + 5 + 4 + 3 + 2 = 32

.

Следовательно,

U T = 32 — (6\times7)/2 = 32 — 21 = 11

(так же, как и первый метод).

Сумма рангов, достигнутых зайцами, равна

11 + 10 + 9 + 8 + 7 + 1 = 46

, что приводит к

U H = 46 - 21 = 25

.

Пример отчета о результатах

Сообщая о результатах U- теста Манна-Уитни, важно указать: ^[12]

Мера центральных тенденций двух групп (средние значения или медианы; поскольку U- критерий Манна-Уитни является порядковым тестом, обычно рекомендуются медианы)
Значение U (возможно, с некоторой мерой размера эффекта, например, размером эффекта общего языка или ранг-бисериальной корреляцией ).
Размеры выборки
Уровень значимости.

На практике некоторая часть этой информации, возможно, уже была предоставлена, и при принятии решения о ее повторении следует руководствоваться здравым смыслом. Типичный отчет может выглядеть следующим образом:

«Средние задержки в группах E и C составляли 153 и 247 мс; распределения в двух группах значительно различались (Mann-Whitney

U = 10,5

,

n 1 = n 2 = 8

,

P <0,05

двусторонний)».

Утверждение, которое полностью отражает статистический статус теста, может звучать так:

«Результаты двух методов лечения сравнивались с использованием двухвыборочного критерия суммы рангов Уилкоксона-Манна-Уитни. Эффект лечения (разница между методами лечения) оценивался количественно с использованием оценщика Ходжеса-Лемана (HL), который согласуется с критерием Вилкоксона. . ^[13] Эта оценка (HLΔ) представляет собой медиану всех возможных различий в результатах между субъектом в группе B и субъектом в группе A. Непараметрический доверительный интервал 0,95 для HLΔ сопровождает эти оценки, как и ρ, оценка вероятности того, что случайно выбранный субъект из популяции B имеет более высокий вес, чем случайно выбранный субъект из популяции A. Средний вес [квартили] для субъектов, получающих лечение A и B, соответственно, составляет 147 [121, 177] и 151 [130, 180] кг. Лечение А уменьшило вес на HLΔ = 5 кг (0,95 CL [2, 9] кг,

2 P = 0,02

,

ρ = 0,58

)».

Однако редко можно найти столь обширный отчет в документе, основной темой которого не были бы статистические выводы.

Нормальное приближение и коррекция связи

Для больших выборок U имеет примерно нормальное распределение . В этом случае стандартизированное значение

z={\frac {U-m_{U}}{\sigma _{U}}},\,

где m _U и σ _U — среднее значение и стандартное отклонение U , примерно соответствует стандартному нормальному отклонению, значимость которого можно проверить по таблицам нормального распределения. m _U и σ _U определяются выражениями

m_{U}={\frac {n_{1}n_{2}}{2}},\,

^[14] и

\sigma _{U}={\sqrt {n_{1}n_{2}(n_{1}+n_{2}+1) \over 12}}.\,

^[14]

Формула стандартного отклонения усложняется при наличии связанных рангов. Если есть связи в рангах, σ следует скорректировать следующим образом:

\sigma _{\text{ties}}={\sqrt {{n_{1}n_{2}(n_{1}+n_{2}+1) \over 12}-{n_{1}n_{2}\sum _{k=1}^{K}(t_{k}^{3}-t_{k}) \over 12n(n-1)}}},\,

^[15]

где левая часть — это просто дисперсия, а правая — поправка на связи, t _k — количество связей для k -го ранга, а K — общее количество уникальных рангов со связями.

Более эффективная в вычислительном отношении форма с $n 1 n 2 /12$ вычетом :

\sigma _{\text{ties}}={\sqrt {{n_{1}n_{2} \over 12}\left((n+1)-{\sum _{k=1}^{K}(t_{k}^{3}-t_{k}) \over n(n-1)}\right)}},

где $п знак равно п 1 + п 2$ .

Если количество связей невелико (и особенно если нет больших связующих полос), связи можно не учитывать при выполнении расчетов вручную. Компьютерные статистические пакеты будут регулярно использовать правильно скорректированную формулу.

Обратите внимание, что поскольку $U 1 + U 2 = n 1 n 2$ , среднее значение $n 1 n 2 /2 ,$ используемое в нормальном приближении, является средним из двух значений U . Следовательно, абсолютное значение рассчитанной z -статистики будет одинаковым, какое бы значение U ни использовалось.

Размеры эффекта

Ученым широко рекомендуется сообщать о величине эффекта для логического теста. ^[16]^[17]

Доля согласия среди всех пар

Следующие три меры эквивалентны.

Размер эффекта общего языка

Одним из методов сообщения о размере эффекта для U- критерия Манна-Уитни является использование f , размера общего языкового эффекта. ^[18]^[19] В качестве выборочной статистики величина эффекта общего языка вычисляется путем формирования всех возможных пар между двумя группами, а затем определения доли пар, которые поддерживают определенное направление (скажем, что элементы из группы 1 больше, чем элементы из группы 2). ^[19] Для иллюстрации: в исследовании с выборкой из десяти зайцев и десяти черепах общее количество заказанных пар составляет десять раз по десять или 100 пар зайцев и черепах. Предположим, результаты показывают, что заяц бежал быстрее черепахи в 90 из 100 пар выборки; в этом случае размер эффекта общего языка выборки составляет 90%. ^[20]

Связь между f Манна – Уитни и U (в частности, $U_{1}$ ) выглядит следующим образом:

f={U_{1} \over n_{1}n_{2}}\,

Это то же самое, что площадь под кривой (AUC) для кривой ROC .

ρ статистика

Статистика под названием ρ , которая линейно связана с U и широко используется в исследованиях категоризации ( обучение распознаванию понятий ) и в других местах. ^[21] рассчитывается путем деления U на его максимальное значение для заданных размеров выборки, которое составляет просто $n 1 \times n 2$ . Таким образом, ρ является непараметрической мерой перекрытия двух распределений; он может принимать значения от 0 до 1 и представляет собой оценку $P(Y > X) + 0,5 P(Y = X)$ , где X и Y — случайно выбранные наблюдения из двух распределений. Оба крайних значения представляют собой полное разделение распределений, а значение ρ , равное 0,5, представляет собой полное перекрытие. Полезность статистики ρ можно увидеть в случае нечетного примера, использованного выше, где два распределения, которые значительно различались по U- критерию Манна-Уитни, тем не менее, имели почти одинаковые медианы: значение ρ в этом случае составляет примерно 0,723 в пользу зайцев, что правильно отражает тот факт, что, хотя средняя черепаха победила среднего зайца, в совокупности зайцы показали лучшие результаты, чем черепахи вместе взятые. ^{[ нужна ссылка ]}

Ранг-бисериальная корреляция

Метод сообщения о величине эффекта для U- критерия Манна-Уитни заключается в использовании меры ранговой корреляции, известной как ранговая бисерийная корреляция. Эдвард Кюртон представил и назвал эту меру. ^[22] Как и другие корреляционные меры, двухрядная корреляция может варьироваться от минус одного до плюс одного, при этом нулевое значение указывает на отсутствие связи.

Существует простая формула разности для вычисления ранговой бисериальной корреляции на основе размера общего языкового эффекта: корреляция представляет собой разницу между долей пар, благоприятных для гипотезы ( f ), минус ее дополнение (т. е.: доля, которая является неблагоприятной ( u )). Эта простая формула разницы представляет собой разницу в величине общего языкового эффекта каждой группы и выглядит следующим образом: ^[18]

r=f-u

Например, рассмотрим пример, где зайцы бегают быстрее черепах в 90 из 100 пар. Размер эффекта общего языка составляет 90%, поэтому двухрядная корреляция равна 90% минус 10%, а двухрядная корреляция $r = 0,80$ .

Альтернативную формулу для бисериала ранга можно использовать для его расчета на основе U Манна – Уитни (либо $U_{1}$ или $U_{2}$ ) и размеры выборки каждой группы: ^[23]

r=f-(1-f)=2f-1={2U_{1} \over n_{1}n_{2}}-1=1-{2U_{2} \over n_{1}n_{2}}

Эта формула полезна, когда данные недоступны, но когда есть опубликованный отчет, поскольку U и размеры выборки сообщаются регулярно. Если использовать приведенный выше пример с 90 парами, предпочитающими зайцев, и 10 парами, предпочитающими черепаху, U ₂ будет меньшим из двух, поэтому $U 2 = 10$ . Затем эта формула дает $r = 1 - (2\times10)/(10\times10) = 0,80$ , что является тем же результатом, что и для простой формулы разности, приведенной выше.

Связь с другими тестами

Стьюдента Сравнение с t -критерием

критерий Манна-Уитни U- проверяет нулевую гипотезу о том, что распределение вероятностей случайно выбранного наблюдения из одной группы такое же, как распределение вероятностей случайно выбранного наблюдения из другой группы, против альтернативы, согласно которой эти распределения не равны (см. U-тест Манна – Уитни # Предположения и формальная формулировка гипотез ). Напротив, t-критерий проверяет нулевую гипотезу о равных средних в двух группах по сравнению с альтернативой о неравных средних. критерий Манна-Уитни Следовательно, за исключением особых случаев, U- и t-критерий не проверяют одни и те же гипотезы, и их следует учитывать при сравнении.

Порядковые данные: критерий Манна-Уитни U- предпочтительнее t -критерия, когда данные имеют порядковый номер , но не масштабированы по интервалам, и в этом случае расстояние между соседними значениями шкалы не может считаться постоянным.
Надежность: Поскольку он сравнивает суммы рангов, ^[24] критерий Манна-Уитни U- с меньшей вероятностью, чем t -критерий, будет ложно указывать на значимость из-за наличия выбросов . Однако U- критерий Манна-Уитни может иметь худший контроль ошибок типа I , когда данные одновременно гетероскедастичны и ненормальны. ^[25]
Эффективность: критерий Манна-Уитни Когда сохраняется нормальность, U- имеет (асимптотическую) эффективность 3/ $π$ или около 0,95 по сравнению с t -тестом. ^[26] критерий Манна-Уитни Для распределений, достаточно далеких от нормального, и для достаточно больших размеров выборки U- значительно более эффективен, чем t . ^[27] Однако это сравнение эффективности следует интерпретировать с осторожностью, поскольку Манн-Уитни и t-критерий не проверяют одни и те же величины. Если, например, основной интерес представляет разница групповых средних, тест Манна-Уитни не является подходящим тестом. ^[28]

критерий Манна-Уитни U- даст результаты, очень похожие на результаты обычного параметрического двухвыборочного t -теста для ранжирования данных. ^[29]

Относительная эффективность критерия Манна – Уитни по сравнению с двухвыборочным t -критерием, если f = g равно числу распределений ^[30]
Распределение	Эффективность
Логистика	$\pi ^{2}/9$
Нормальный	$3/\pi$
Лаплас	3/2
Униформа	1

Различные дистрибутивы

-критерий Манна-Уитни U непригоден для проверки нулевой гипотезы. $P(Y>X)+0.5P(Y=X)=0.5$ против альтернативной гипотезы $P(Y>X)+0.5P(Y=X)\neq 0.5$ ), не предполагая, что распределения одинаковы при нулевой гипотезе (т. е. предполагая, что $F_{1}=F_{2}$ ). ^[2] Для проверки этих гипотез существуют более эффективные тесты. Среди них тест Бруннера-Мюнцеля и тест Флиннера-Поличелло. ^[31] В частности, согласно более общей нулевой гипотезе $P(Y>X)+0.5P(Y=X)=0.5$ критерий Манна-Уитни U- может иметь завышенную частоту ошибок типа I даже в больших выборках (особенно, если дисперсии двух совокупностей неравны и размеры выборок различны), и эту проблему решают лучшие альтернативы. ^[32] В результате было предложено использовать одну из альтернатив (в частности, критерий Бруннера-Мюнцеля), если нельзя предположить, что распределения равны при нулевой гипотезе. ^[32]

Альтернативы

Если кто-то хочет получить простую интерпретацию сдвига, использовать U- следует не критерий Манна-Уитни , когда распределения двух выборок сильно различаются, поскольку он может дать ошибочную интерпретацию значимых результатов. ^[33] В этой ситуации -критерия с неравными дисперсиями версия t может дать более надежные результаты.

Аналогично, некоторые авторы (например, Conover ^{[ нужна полная цитата ]}) предлагают преобразовать данные в ранги (если они еще не являются рангами), а затем выполнить t -критерий для преобразованных данных, причем версия t -теста используется в зависимости от того, предположительно ли дисперсия генеральной совокупности различна. Преобразования рангов не сохраняют дисперсии, но дисперсии пересчитываются из выборок после преобразований рангов.

Тест Брауна-Форсайта был предложен в качестве подходящего непараметрического эквивалента F -теста для равных дисперсий. ^{[ нужна ссылка ]}

Более мощный тест — тест Бруннера-Мюнцеля критерий Манна-Уитни , превосходящий U- в случае нарушения предположения об обменности. ^[34]

тест Манна-Уитни U- представляет собой частный случай модели пропорциональных шансов , позволяющий корректировать ковариаты. ^[35]

См. также тест Колмогорова–Смирнова .

Связанная статистика тестов

тау Кендалла

критерий Манна-Уитни U- связан с рядом других непараметрических статистических процедур. Например, он эквивалентен тау-коэффициенту корреляции Кендалла , если одна из переменных является двоичной (то есть может принимать только два значения). ^{[ нужна ссылка ]}

Реализации программного обеспечения

критерий Манна-Уитни Во многих пакетах программного обеспечения U- (гипотезы о равном распределении соответствующих альтернатив) плохо документирован. Некоторые пакеты неправильно обрабатывают связи или не документируют асимптотические методы (например, поправку на непрерывность). В обзоре 2000 года обсуждались некоторые из следующих пакетов: ^[36]

MATLAB имеет Ranksum в панели инструментов статистики.
тест Базовый пакет статистики R реализует wilcox.test в пакете «stats».
Функция R УилкоксонЗ из Пакет rcompanion рассчитает $z-$ статистику для двухвыборочного, парного или одновыборочного критерия Уилкоксона.
SAS реализует тест в своей PROC NPAR1WAY процедура.
В Python есть реализация этого теста, предоставленная SciPy . ^[37]
SigmaStat (SPSS Inc., Чикаго, Иллинойс)
SYSTAT (SPSS Inc., Чикаго, Иллинойс)
В Java есть реализация этого теста, предоставленная Apache Commons. ^[38]
У Джулии есть реализации этого теста в нескольких пакетах. В упаковке HypothesisTests.jl, это находится как pvalue(MannWhitneyUTest(X, Y)). ^[39]
JMP (Институт SAS, Кэри, Северная Каролина)
S-Plus (MathSoft, Inc., Сиэтл, Вашингтон)
СТАТИСТИКА (StatSoft, Inc., Талса, Оклахома)
ЮНИСТАТ (Unistat Ltd, Лондон)
SPSS (SPSS Inc, Чикаго)
StatsDirect (StatsDirect Ltd, Манчестер, Великобритания) реализует все распространенные варианты .
Компания Stata (Stata Corporation, Колледж-Стейшн, Техас) реализует тест в своей команда рангсум .
StatXact (Cytel Software Corporation, Кембридж, Массачусетс)
PSPP реализует тест в своем Функция ВИЛКОКСОНА .
KNIME реализует тест в своем узле теста Уилкоксона-Манна-Уитни .

История

Статистика появилась в статье 1914 года. ^[40] немца Густава Дойхлера (с отсутствующим членом в дисперсии).

В единственной статье 1945 года Фрэнк Уилкоксон предложил ^[41] как критерий знакового ранга с одной выборкой, так и критерий суммы рангов с двумя выборками, в тесте значимости с нулевой гипотезой в сравнении с ее дополнительной альтернативой (то есть равен или не равен). Однако в этой статье он свел в таблицы лишь несколько пунктов для случая равного размера выборки (хотя в более поздней статье он привел таблицы большего размера).

Тщательный анализ статистики, который включал повторение, позволяющее вычислить хвостовые вероятности для произвольных размеров выборки, и таблицы для выборок размером восемь или меньше, появился в статье Генри Манна и его ученика Дональда Рэнсома Уитни в 1947 году. ^[1] В этой статье обсуждались альтернативные гипотезы, включая стохастическое упорядочение (где кумулятивные функции распределения удовлетворяют точечному неравенству $F X (t) < F Y (t)$ ). В этой статье также были вычислены первые четыре момента и установлена предельная нормальность статистики при нулевой гипотезе, тем самым установив, что она асимптотически свободна от распределения.

См. также

Примечания

^ Перейти обратно: ^а ^б Манн, Генри Б .; Уитни, Дональд Р. (1947). «О проверке того, является ли одна из двух случайных величин стохастически большей другой» . Анналы математической статистики . 18 (1): 50–60. дои : 10.1214/aoms/1177730491 . МР 0022058 . Збл 0041.26103 .
^ Перейти обратно: ^а ^б Фэй, Майкл П.; Прощан, Майкл А. (2010). «Уилкоксона – Манна – Уитни или t -критерий? О предположениях для проверки гипотез и множественных интерпретациях правил принятия решений» . Статистические опросы . 4 : 1–39. дои : 10.1214/09-SS051 . МР 2595125 . ПМЦ 2857732 . ПМИД 20414472 .
^ [1] См. Таблицу 2.1 книги Пратта (1964) «Надежность некоторых процедур для задачи размещения двух выборок». Журнал Американской статистической ассоциации. 59 (307): 655–680. Если два распределения нормальны с одинаковым средним значением, но разными дисперсиями, то Pr[ X > Y ] = Pr[ Y < X ], но размер теста Манна – Уитни может быть больше номинального уровня. Поэтому мы не можем определить нулевую гипотезу как Pr[ X > Y ] = Pr[ Y < X ] и получить валидный тест.
^ Дивайн, Джордж У.; Нортон, Х. Джеймс; Барон, Анна Э.; Хуарес-Колунга, Элизабет (2018). «Процедура Уилкоксона-Манна-Уитни не удалась при проверке медиан» . Американский статистик . 72 (3): 278–286. дои : 10.1080/00031305.2017.1305291 .
^ Конрой, Ронан (2012). «Какие гипотезы на самом деле проверяют «непараметрические» двухгрупповые тесты?» . Статический журнал . 12 (2): 182–190. дои : 10.1177/1536867X1201200202 . S2CID 118445807 . Проверено 24 мая 2021 г.
^ Харт, Анна (2001). «Тест Манна-Уитни — это не просто тест медиан: различия в разбросе могут иметь важное значение» . БМЖ . 323 (7309): 391–393. дои : 10.1136/bmj.323.7309.391 . ПМК 1120984 . ПМИД 11509435 .
^ Бостонский университет (SPH), 2017 г.
^ Мейсон, С.Дж., Грэм, Н.Е. (2002). «Области под кривыми относительных рабочих характеристик (ROC) и относительных рабочих уровней (ROL): статистическая значимость и интерпретация». Ежеквартальный журнал Королевского метеорологического общества . 128 (584): 2145–2166. дои : 10.1256/003590002320603584 . ISSN 1477-870X .
^ Фосетт, Том (2006); Введение в ROC-анализ , Письма о распознавании образов, 27, 861–874.
^ Хэнд, Дэвид Дж.; Тилль, Роберт Дж. (2001). «Простое обобщение площади под кривой ROC для задач классификации нескольких классов» . Машинное обучение . 45 (2): 171–186. дои : 10.1023/А:1010920819831 .
^ Зар, Джеррольд Х. (1998). Биостатистический анализ . Нью-Джерси: Prentice Hall International, INC. с. 147. ИСБН 978-0-13-082390-8 .
^ Фриц, Кэтрин О.; Моррис, Питер Э.; Ричлер, Дженнифер Дж. (2012). «Оценки размера эффекта: текущее использование, расчеты и интерпретация» . Журнал экспериментальной психологии: Общие сведения . 141 (1): 2–18. дои : 10.1037/a0024338 . ISSN 1939-2222 . ПМИД 21823805 .
^ Майлз Холландер; Дуглас А. Вулф (1999). Непараметрические статистические методы (2-е изд.). Уайли-Интерсайенс. ISBN 978-0471190455 .
^ Перейти обратно: ^а ^б Сигал, Сидни (1956). Непараметрическая статистика для поведенческих наук . МакГроу-Хилл. п. 121. {{cite book}}: CS1 maint: числовые имена: список авторов ( ссылка )
^ Леманн, Эрих; Д'Абрера, Ховард (1975). Непараметрические методы: статистические методы, основанные на рангах . Холден-Дэй. п. 20. {{cite book}}: CS1 maint: числовые имена: список авторов ( ссылка )
^ Уилкинсон, Лиланд (1999). «Статистические методы в психологических журналах: рекомендации и пояснения». Американский психолог . 54 (8): 594–604. дои : 10.1037/0003-066X.54.8.594 .
^ Накагава, Шиничи; Катхилл, Иннес С. (2007). «Размер эффекта, доверительный интервал и статистическая значимость: практическое руководство для биологов». Биологические обзоры Кембриджского философского общества . 82 (4): 591–605. дои : 10.1111/j.1469-185X.2007.00027.x . ПМИД 17944619 . S2CID 615371 .
^ Перейти обратно: ^а ^б Керби, Д.С. (2014). «Формула простой разницы: подход к обучению непараметрической корреляции». Комплексная психология . 3 : 11.IT.3.1. doi : 10.2466/11.IT.3.1 (неактивен 2 июня 2024 г.). S2CID 120622013 . {{cite journal}}: CS1 maint: DOI неактивен по состоянию на июнь 2024 г. ( ссылка )
^ Перейти обратно: ^а ^б МакГроу, КО; Вонг, Джей-Джей (1992). «Статистика размера общего языкового эффекта». Психологический вестник . 111 (2): 361–365. дои : 10.1037/0033-2909.111.2.361 .
^ Гриссом Р.Дж. (1994). «Статистический анализ порядкового категориального статуса после терапии». Журнал консалтинговой и клинической психологии . 62 (2): 281–284. дои : 10.1037/0022-006X.62.2.281 . ПМИД 8201065 .
^ Хернштейн, Ричард Дж.; Лавленд, Дональд Х.; Кейбл, Синтия (1976). «Естественные концепции голубей». Журнал экспериментальной психологии: процессы поведения животных . 2 (4): 285–302. дои : 10.1037/0097-7403.2.4.285 . ПМИД 978139 .
^ Кюртон, Э.Э. (1956). «Ранг-бисериальная корреляция». Психометрика . 21 (3): 287–290. дои : 10.1007/BF02289138 . S2CID 122500836 .
^ Вендт, HW (1972). «Решение распространенной проблемы в социальных науках: упрощенный двухрядный коэффициент корреляции, основанный на статистике U ». Европейский журнал социальной психологии . 2 (4): 463–465. дои : 10.1002/ejsp.2420020412 .
^ Мотульский, Харви Дж.; Руководство по статистике , Сан-Диего, Калифорния: GraphPad Software, 2007, стр. 123
^ Циммерман, Дональд В. (1 января 1998 г.). «Аннулирование параметрических и непараметрических статистических тестов одновременным нарушением двух предположений». Журнал экспериментального образования . 67 (1): 55–68. дои : 10.1080/00220979809598344 . ISSN 0022-0973 .
^ Лехамн, Эрих Л.; Элементы теории больших выборок , Springer, 1999, с. 176
^ Коновер, Уильям Дж.; Практическая непараметрическая статистика , John Wiley & Sons, 1980 (2-е издание), стр. 225–226.
^ Ламли, Томас; Дир, Паула ; Эмерсон, Скотт; Чен, Лу (май 2002 г.). «Важность предположения о нормальности в больших наборах данных общественного здравоохранения» . Ежегодный обзор общественного здравоохранения . 23 (1): 151–169. doi : 10.1146/annurev.publhealth.23.100901.140546 . ISSN 0163-7525 . ПМИД 11910059 .
^ Коновер, Уильям Дж.; Иман, Рональд Л. (1981). «Ранговые преобразования как мост между параметрической и непараметрической статистикой». Американский статистик . 35 (3): 124–129. дои : 10.2307/2683975 . JSTOR 2683975 .
^ Ваарт, А.В. ван дер (13 октября 1998 г.). Асимптотическая статистика . Издательство Кембриджского университета. дои : 10.1017/cbo9780511802256 . ISBN 978-0-511-80225-6 .
^ Бруннер, Эдгар; Батке, Арне К.; Коничке, Франк (2018). Процедуры ранга и псевдоранга для независимых наблюдений в факторных планах: использование R и SAS . Серия Спрингера по статистике. Чам: Международное издательство Springer. дои : 10.1007/978-3-030-02914-2 . ISBN 978-3-030-02912-8 .
^ Перейти обратно: ^а ^б Карч, Джулиан Д. (2021). «Психологи должны использовать U-тест Бруннера-Мюнцеля вместо U- теста Манна-Уитни в качестве непараметрической процедуры по умолчанию» . Достижения в методах и практике психологической науки . 4 (2). дои : 10.1177/2515245921999602 . hdl : 1887/3209569 . ISSN 2515-2459 .
^ Касуя, Эйити (2001). « U -тест Манна – Уитни, когда дисперсии неравны». Поведение животных . 61 (6): 1247–1249. дои : 10.1006/anbe.2001.1691 . S2CID 140209347 .
^ Карч, Джулиан (2021). «Психологи должны использовать U-тест Бруннера-Мюнцеля вместо U- теста Манна-Уитни в качестве непараметрической процедуры по умолчанию» . Достижения в методах и практике психологической науки . 4 (2). дои : 10.1177/2515245921999602 . hdl : 1887/3209569 . S2CID 235521799 .
^ Харрелл, Фрэнк (20 сентября 2020 г.). «Нарушение пропорциональных шансов не фатально» . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
^ Бергманн, Рейнхард; Ладбрук, Джон; Спурен, Уилл ПиДжем (2000). «Различные результаты теста Уилкоксона – Манна – Уитни из разных статистических пакетов». Американский статистик . 54 (1): 72–77. дои : 10.1080/00031305.2000.10474513 . JSTOR 2685616 . S2CID 120473946 .
^ "scipy.stats.mannwhitneyu" . Справочное руководство SciPy v0.16.0 . Сообщество Scipy. 24 июля 2015 года . Проверено 11 сентября 2015 г. scipy.stats.mannwhitneyu(x, y, use_continuity=True): вычисляет ранговый критерий Манна-Уитни на выборках x и y.
^ «MannWhitneyUTest (API Apache Commons Math 3.3)» . commons.apache.org .
^ "JuliaStats/HypothesisTests.jl" . Гитхаб . 30 мая 2021 г.
^ Краскал, Уильям Х. (сентябрь 1957 г.). «Исторические заметки о непарном двухвыборочном тесте Уилкоксона». Журнал Американской статистической ассоциации . 52 (279): 356–360. дои : 10.2307/2280906 . JSTOR 2280906 .
^ Уилкоксон, Фрэнк (1945). «Индивидуальные сравнения методами ранжирования». Биометрический бюллетень . 1 (6): 80–83. дои : 10.2307/3001968 . hdl : 10338.dmlcz/135688 . JSTOR 3001968 .

Ссылки

Хеттманспергер, ТП; Маккин, JW (1998). Робастные непараметрические статистические методы . Статистическая библиотека Кендалла. Том. 5 (Первое изд., а не второе изд. Тейлора и Фрэнсиса (2010).). Лондон; Нью-Йорк: Эдвард Арнольд; John Wiley and Sons, Inc., стр. xiv+467. ISBN 978-0-340-54937-7 . МР 1604954 .
Кордер, ГВ; Форман, Д.И. (2014). Непараметрическая статистика: пошаговый подход . Уайли. ISBN 978-1118840313 .
Ходжес, Дж.Л.; Леманн, Э.Л. (1963). «Оценка местоположения по рангам» . Анналы математической статистики . 34 (2): 598–611. дои : 10.1214/aoms/1177704172 . JSTOR 2238406 . МР 0152070 . Збл 0203.21105 . PE euclid.aoms/1177704172 .
Керби, Д.С. (2014). «Формула простой разницы: подход к обучению непараметрической корреляции». Комплексная психология . 3 : 11.IT.3.1. doi : 10.2466/11.IT.3.1 (неактивен 2 июня 2024 г.). S2CID 120622013 . {{cite journal}}: CS1 maint: DOI неактивен по состоянию на июнь 2024 г. ( ссылка )
Леманн, Эрих Л. (2006). Непараметрические методы: статистические методы, основанные на рангах . При особой помощи HJM D'Abrera (перепечатка 1988 г., редакция издания Holden-Day 1975 г.). Нью-Йорк: Спрингер. стр. xvi+463. ISBN 978-0-387-35212-1 . МР 0395032 .
Оджа, Ханну (2010). Многомерные непараметрические методы с R : подход, основанный на пространственных знаках и рангах . Конспект лекций по статистике. Том. 199. Нью-Йорк: Спрингер. стр. xiv+232. дои : 10.1007/978-1-4419-0468-3 . ISBN 978-1-4419-0467-6 . МР 2598854 .
Сен, Пранаб Кумар (декабрь 1963 г.). «Об оценке относительной активности в методах разведения (прямого) безраспределения». Биометрия . 19 (4): 532–552. дои : 10.2307/2527532 . JSTOR 2527532 . Збл 0119.15604 .

Внешние ссылки

Таблица критических значений U (pdf)
Интерактивный калькулятор U значения и его
Краткое руководство психолога-экспериментатора Карла Л. Вюнша – Непараметрические оценки величины эффекта (авторские права Карла Л. Вюнша, 2015 г.)

[mannwhitney1947-1] Перейти обратно: ^а ^б Манн, Генри Б .; Уитни, Дональд Р. (1947). «О проверке того, является ли одна из двух случайных величин стохастически большей другой» . Анналы математической статистики . 18 (1): 50–60. дои : 10.1214/aoms/1177730491 . МР 0022058 . Збл 0041.26103 .

[FayProschan2010-2] Перейти обратно: ^а ^б Фэй, Майкл П.; Прощан, Майкл А. (2010). «Уилкоксона – Манна – Уитни или t -критерий? О предположениях для проверки гипотез и множественных интерпретациях правил принятия решений» . Статистические опросы . 4 : 1–39. дои : 10.1214/09-SS051 . МР 2595125 . ПМЦ 2857732 . ПМИД 20414472 .

[3] [1] См. Таблицу 2.1 книги Пратта (1964) «Надежность некоторых процедур для задачи размещения двух выборок». Журнал Американской статистической ассоциации. 59 (307): 655–680. Если два распределения нормальны с одинаковым средним значением, но разными дисперсиями, то Pr[ X > Y ] = Pr[ Y < X ], но размер теста Манна – Уитни может быть больше номинального уровня. Поэтому мы не можем определить нулевую гипотезу как Pr[ X > Y ] = Pr[ Y < X ] и получить валидный тест.

[4] Дивайн, Джордж У.; Нортон, Х. Джеймс; Барон, Анна Э.; Хуарес-Колунга, Элизабет (2018). «Процедура Уилкоксона-Манна-Уитни не удалась при проверке медиан» . Американский статистик . 72 (3): 278–286. дои : 10.1080/00031305.2017.1305291 .

[5] Конрой, Ронан (2012). «Какие гипотезы на самом деле проверяют «непараметрические» двухгрупповые тесты?» . Статический журнал . 12 (2): 182–190. дои : 10.1177/1536867X1201200202 . S2CID 118445807 . Проверено 24 мая 2021 г.

[6] Харт, Анна (2001). «Тест Манна-Уитни — это не просто тест медиан: различия в разбросе могут иметь важное значение» . БМЖ . 323 (7309): 391–393. дои : 10.1136/bmj.323.7309.391 . ПМК 1120984 . ПМИД 11509435 .

[7] Бостонский университет (SPH), 2017 г.

[8] Мейсон, С.Дж., Грэм, Н.Е. (2002). «Области под кривыми относительных рабочих характеристик (ROC) и относительных рабочих уровней (ROL): статистическая значимость и интерпретация». Ежеквартальный журнал Королевского метеорологического общества . 128 (584): 2145–2166. дои : 10.1256/003590002320603584 . ISSN 1477-870X .

[fawcett-9] Фосетт, Том (2006); Введение в ROC-анализ , Письма о распознавании образов, 27, 861–874.

[10] Хэнд, Дэвид Дж.; Тилль, Роберт Дж. (2001). «Простое обобщение площади под кривой ROC для задач классификации нескольких классов» . Машинное обучение . 45 (2): 171–186. дои : 10.1023/А:1010920819831 .

[11] Зар, Джеррольд Х. (1998). Биостатистический анализ . Нью-Джерси: Prentice Hall International, INC. с. 147. ИСБН 978-0-13-082390-8 .

[12] Фриц, Кэтрин О.; Моррис, Питер Э.; Ричлер, Дженнифер Дж. (2012). «Оценки размера эффекта: текущее использование, расчеты и интерпретация» . Журнал экспериментальной психологии: Общие сведения . 141 (1): 2–18. дои : 10.1037/a0024338 . ISSN 1939-2222 . ПМИД 21823805 .

[13] Майлз Холландер; Дуглас А. Вулф (1999). Непараметрические статистические методы (2-е изд.). Уайли-Интерсайенс. ISBN 978-0471190455 .

[auto-14] Перейти обратно: ^а ^б Сигал, Сидни (1956). Непараметрическая статистика для поведенческих наук . МакГроу-Хилл. п. 121. {{cite book}}: CS1 maint: числовые имена: список авторов ( ссылка )

[15] Леманн, Эрих; Д'Абрера, Ховард (1975). Непараметрические методы: статистические методы, основанные на рангах . Холден-Дэй. п. 20. {{cite book}}: CS1 maint: числовые имена: список авторов ( ссылка )

[Wilkinson1999-16] Уилкинсон, Лиланд (1999). «Статистические методы в психологических журналах: рекомендации и пояснения». Американский психолог . 54 (8): 594–604. дои : 10.1037/0003-066X.54.8.594 .

[Nakagawa2007-17] Накагава, Шиничи; Катхилл, Иннес С. (2007). «Размер эффекта, доверительный интервал и статистическая значимость: практическое руководство для биологов». Биологические обзоры Кембриджского философского общества . 82 (4): 591–605. дои : 10.1111/j.1469-185X.2007.00027.x . ПМИД 17944619 . S2CID 615371 .

[Kerby2014-18] Перейти обратно: ^а ^б Керби, Д.С. (2014). «Формула простой разницы: подход к обучению непараметрической корреляции». Комплексная психология . 3 : 11.IT.3.1. doi : 10.2466/11.IT.3.1 (неактивен 2 июня 2024 г.). S2CID 120622013 . {{cite journal}}: CS1 maint: DOI неактивен по состоянию на июнь 2024 г. ( ссылка )

[McGraw1992-19] Перейти обратно: ^а ^б МакГроу, КО; Вонг, Джей-Джей (1992). «Статистика размера общего языкового эффекта». Психологический вестник . 111 (2): 361–365. дои : 10.1037/0033-2909.111.2.361 .

[20] Гриссом Р.Дж. (1994). «Статистический анализ порядкового категориального статуса после терапии». Журнал консалтинговой и клинической психологии . 62 (2): 281–284. дои : 10.1037/0022-006X.62.2.281 . ПМИД 8201065 .

[H1976-21] Хернштейн, Ричард Дж.; Лавленд, Дональд Х.; Кейбл, Синтия (1976). «Естественные концепции голубей». Журнал экспериментальной психологии: процессы поведения животных . 2 (4): 285–302. дои : 10.1037/0097-7403.2.4.285 . ПМИД 978139 .

[22] Кюртон, Э.Э. (1956). «Ранг-бисериальная корреляция». Психометрика . 21 (3): 287–290. дои : 10.1007/BF02289138 . S2CID 122500836 .

[23] Вендт, HW (1972). «Решение распространенной проблемы в социальных науках: упрощенный двухрядный коэффициент корреляции, основанный на статистике U ». Европейский журнал социальной психологии . 2 (4): 463–465. дои : 10.1002/ejsp.2420020412 .

[Motulsky_2007-24] Мотульский, Харви Дж.; Руководство по статистике , Сан-Диего, Калифорния: GraphPad Software, 2007, стр. 123

[25] Циммерман, Дональд В. (1 января 1998 г.). «Аннулирование параметрических и непараметрических статистических тестов одновременным нарушением двух предположений». Журнал экспериментального образования . 67 (1): 55–68. дои : 10.1080/00220979809598344 . ISSN 0022-0973 .

[Lehmann_1999-26] Лехамн, Эрих Л.; Элементы теории больших выборок , Springer, 1999, с. 176

[Conover_1980-27] Коновер, Уильям Дж.; Практическая непараметрическая статистика , John Wiley & Sons, 1980 (2-е издание), стр. 225–226.

[28] Ламли, Томас; Дир, Паула ; Эмерсон, Скотт; Чен, Лу (май 2002 г.). «Важность предположения о нормальности в больших наборах данных общественного здравоохранения» . Ежегодный обзор общественного здравоохранения . 23 (1): 151–169. doi : 10.1146/annurev.publhealth.23.100901.140546 . ISSN 0163-7525 . ПМИД 11910059 .

[29] Коновер, Уильям Дж.; Иман, Рональд Л. (1981). «Ранговые преобразования как мост между параметрической и непараметрической статистикой». Американский статистик . 35 (3): 124–129. дои : 10.2307/2683975 . JSTOR 2683975 .

[30] Ваарт, А.В. ван дер (13 октября 1998 г.). Асимптотическая статистика . Издательство Кембриджского университета. дои : 10.1017/cbo9780511802256 . ISBN 978-0-511-80225-6 .

[31] Бруннер, Эдгар; Батке, Арне К.; Коничке, Франк (2018). Процедуры ранга и псевдоранга для независимых наблюдений в факторных планах: использование R и SAS . Серия Спрингера по статистике. Чам: Международное издательство Springer. дои : 10.1007/978-3-030-02914-2 . ISBN 978-3-030-02912-8 .

[karch-32] Перейти обратно: ^а ^б Карч, Джулиан Д. (2021). «Психологи должны использовать U-тест Бруннера-Мюнцеля вместо U- теста Манна-Уитни в качестве непараметрической процедуры по умолчанию» . Достижения в методах и практике психологической науки . 4 (2). дои : 10.1177/2515245921999602 . hdl : 1887/3209569 . ISSN 2515-2459 .

[33] Касуя, Эйити (2001). « U -тест Манна – Уитни, когда дисперсии неравны». Поведение животных . 61 (6): 1247–1249. дои : 10.1006/anbe.2001.1691 . S2CID 140209347 .

[34] Карч, Джулиан (2021). «Психологи должны использовать U-тест Бруннера-Мюнцеля вместо U- теста Манна-Уитни в качестве непараметрической процедуры по умолчанию» . Достижения в методах и практике психологической науки . 4 (2). дои : 10.1177/2515245921999602 . hdl : 1887/3209569 . S2CID 235521799 .

[35] Харрелл, Фрэнк (20 сентября 2020 г.). «Нарушение пропорциональных шансов не фатально» . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )

[36] Бергманн, Рейнхард; Ладбрук, Джон; Спурен, Уилл ПиДжем (2000). «Различные результаты теста Уилкоксона – Манна – Уитни из разных статистических пакетов». Американский статистик . 54 (1): 72–77. дои : 10.1080/00031305.2000.10474513 . JSTOR 2685616 . S2CID 120473946 .

[37] "scipy.stats.mannwhitneyu" . Справочное руководство SciPy v0.16.0 . Сообщество Scipy. 24 июля 2015 года . Проверено 11 сентября 2015 г. scipy.stats.mannwhitneyu(x, y, use_continuity=True): вычисляет ранговый критерий Манна-Уитни на выборках x и y.

[38] «MannWhitneyUTest (API Apache Commons Math 3.3)» . commons.apache.org .

[39] "JuliaStats/HypothesisTests.jl" . Гитхаб . 30 мая 2021 г.

[Kruskal57-40] Краскал, Уильям Х. (сентябрь 1957 г.). «Исторические заметки о непарном двухвыборочном тесте Уилкоксона». Журнал Американской статистической ассоциации . 52 (279): 356–360. дои : 10.2307/2280906 . JSTOR 2280906 .

[wilcoxon1945-41] Уилкоксон, Фрэнк (1945). «Индивидуальные сравнения методами ранжирования». Биометрический бюллетень . 1 (6): 80–83. дои : 10.2307/3001968 . hdl : 10338.dmlcz/135688 . JSTOR 3001968 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]