Заблуждения о нормальном распределении
У студентов, изучающих статистику и теорию вероятностей, иногда возникают неверные представления о нормальном распределении, идеи, которые могут показаться правдоподобными, но математически неверны. Например, иногда ошибочно полагают, что две линейно некоррелированные , нормально распределенные случайные величины должны быть статистически независимыми . Однако это неверно, как можно доказать на контрпримере. Точно так же иногда ошибочно полагают, что линейная комбинация нормально распределенных случайных величин сама по себе будет нормально распределенной, но опять же контрпримеры доказывают это неправильно. [1] [2]
Сказать, что пара случайных величин имеет двумерное нормальное распределение, что означает, что каждая линейная комбинация из и для постоянных (т.е. неслучайных) коэффициентов и (не оба равны нулю) имеет одномерное нормальное распределение. В том случае, если и некоррелированы, то они независимы. [3] Однако возможно и для двух случайных величин и быть настолько распределены совместно, что каждый из них в отдельности распределен незначительно нормально, и они некоррелированы, но не независимы; примеры приведены ниже.
Примеры
[ редактировать ]Симметричный пример
[ редактировать ]Предполагать имеет нормальное распределение с ожидаемым значением 0 и дисперсией 1. Пусть имеют распределение Радемахера , так что или , каждый с вероятностью 1/2, и предположим не зависит от . Позволять . Затем и некоррелированы, в чем можно убедиться, вычислив их ковариацию . Более того, оба имеют одинаковое нормальное распределение. И все же, и не являются независимыми. [4] [1] [5]
Чтобы увидеть это и не являются независимыми, заметим, что или что .
Наконец, распределение простой линейной комбинации концентрирует положительную вероятность в 0: . Следовательно, случайная величина не является нормально распределенным, и поэтому также и не являются совместно нормально распределенными (согласно приведенному выше определению). [4]
Асимметричный пример
[ редактировать ]Предполагать имеет нормальное распределение с ожидаемым значением 0 и дисперсией 1. Пусть где – положительное число, которое будет указано ниже. Если очень мала, то корреляция рядом если очень велико, то близко к 1. Поскольку корреляция является непрерывной функцией , теорема о промежуточном значении подразумевает, что существует некоторое конкретное значение это делает корреляцию равной 0. Это значение составляет примерно 1,54. [2] [примечание 1] В этом случае и некоррелированы, но явно не независимы, поскольку полностью определяет .
Чтобы увидеть это нормально распределена — более того, ее распределение такое же, как и у — можно вычислить его кумулятивную функцию распределения : [6]
где предпоследнее равенство следует из симметричности распределения и симметрия условия, что .
В этом примере разница далеко не является нормально распределенным, поскольку существует значительная вероятность (около 0,88) того, что оно будет равно 0. Напротив, нормальное распределение, будучи непрерывным распределением, не имеет дискретной части, то есть оно не концентрирует более нулевая вероятность в любой отдельной точке. Следовательно и не являются совместно нормально распределенными, хотя они нормально распределены отдельно. [2]
Примеры с поддержкой практически везде в плоскости
[ редактировать ]Предположим, что координаты случайной точки на плоскости выбираются в соответствии с функцией плотности вероятности Тогда случайные величины и некоррелированы, и каждый из них имеет нормальное распределение (со средним значением 0 и дисперсией 1), но они не являются независимыми. [7] : 93
Известно, что соотношение двух независимых стандартных нормальных случайных отклонений и имеет распределение Коши . [8] [9] [7] : 122 С таким же успехом можно начать со случайной величины Коши и выведем условное распределение удовлетворить требование о том, что с и независимый и стандартный нормальный. Отсюда следует, что в котором является случайной величиной Радемахера и — случайная величина хи-квадрат с двумя степенями свободы.
Рассмотрим два набора , . Обратите внимание, что не индексируется – то есть та же случайная величина Коши используется в определении обоих и . Это разделение приводит к зависимости между индексами: ни ни не зависит от . Тем не менее все и некоррелированы, поскольку все двумерные распределения обладают симметрией отражения по осям. [ нужна ссылка ]
На рисунке показаны диаграммы рассеяния выборок, взятых из приведенного выше распределения. Это дает два примера двумерных распределений, которые не коррелируют и имеют нормальные маргинальные распределения, но не являются независимыми. На левой панели показано совместное распределение и ; дистрибутив имеет поддержку везде, кроме источника. На правой панели показано совместное распределение и ; распределение имеет поддержку везде, кроме вдоль осей, и имеет разрыв в начале координат: плотность расходится при приближении к началу координат по любому прямому пути, кроме вдоль осей.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б Розенталь, Джеффри С. (2005). «Разглагольствования о некоррелированных нормальных случайных величинах» .
- ^ Jump up to: а б с Мельник, Эдвард Л.; Тененбейн, Аарон (ноябрь 1982 г.). «Неверные спецификации нормального распределения». Американский статистик . 36 (4): 372–373. дои : 10.1080/00031305.1982.10483052 .
- ^ Хогг, Роберт ; Танис, Эллиот (2001). «Глава 5.4 Двумерное нормальное распределение». Вероятность и статистический вывод (6-е изд.). Прентис Холл. стр. 258–259. ISBN 0130272949 .
- ^ Jump up to: а б Эш, Роберт Б. «Лекция 21. Многомерное нормальное распределение » (PDF) . Лекции по статистике . Архивировано из оригинала (PDF) 14 июля 2007 г.
- ^ Романо, Джозеф П.; Сигел, Эндрю Ф. (1986). Контрпримеры в теории вероятности и статистике . Уодсворт и Брукс/Коул. стр. 65–66. ISBN 0-534-05568-0 .
- ^ Уайз, Гэри Л.; Холл, Эрик Б. (1993). Контрпримеры в теории вероятности и реальном анализе . Издательство Оксфордского университета. стр. 140–141. ISBN 0-19-507068-2 .
- ^ Jump up to: а б Стоянов, Джордан М. (2013). Контрпримеры в теории вероятности (3-е изд.). Дувр. ISBN 978-0-486-49998-7 .
- ^ Патель, Джагдиш К.; Прочтите, Кэмпбелл Б. (1996). Справочник по нормальному распределению (2-е изд.). Тейлор и Фрэнсис. п. 113. ИСБН 978-0-824-79342-5 .
- ^ Кришнамурти, К. (2006). Справочник по статистическим распределениям с приложениями . ЦРК Пресс. п. 278. ИСБН 978-1-420-01137-1 .
- Примечания
- ^ Точнее, 1,53817..., квадратный корень из медианы распределения хи-квадрат с 3 степенями свободы.