Иллюстрация центральной предельной теоремы
В теории вероятностей центральная предельная теорема (ЦПТ) утверждает, что во многих ситуациях, когда добавляются независимые и одинаково распределенные случайные величины, их правильно нормализованная сумма стремится к нормальному распределению. В данной статье приведены две иллюстрации этой теоремы. Оба включают сумму независимых и одинаково распределенных случайных величин и показывают, как распределение вероятностей суммы приближается к нормальному распределению по мере увеличения количества членов в сумме.
Первая иллюстрация связана с непрерывным распределением вероятностей , для которого случайные величины имеют функцию плотности вероятности . Вторая иллюстрация, для которой большая часть вычислений может быть выполнена вручную, включает дискретное распределение вероятностей , которое характеризуется функцией массы вероятности .
Иллюстрация непрерывного случая
[ редактировать ]Плотность суммы двух независимых действительных случайных величин равна свертке функций плотности исходных переменных.
Таким образом, плотность суммы m + n членов последовательности независимых одинаково распределенных переменных равна свертке плотностей сумм m членов и n членов. В частности, плотность суммы n +1 слагаемых равна свертке плотности суммы n слагаемых с исходной плотностью («сумма» 1 слагаемого).
Функция плотности вероятности показана на первом рисунке ниже. Тогда плотности сумм двух, трех и четырех независимых одинаково распределенных переменных , каждая из которых имеет исходную плотность, показаны на следующих рисунках.Если исходная плотность представляет собой кусочный полином , как в примере, то такими же являются и суммарные плотности все более высокой степени. Хотя исходная плотность далека от нормальной, плотность суммы всего нескольких переменных с этой плотностью гораздо более гладкая и имеет некоторые качественные особенности нормальной плотности .
Свертки были вычислены с помощью дискретного преобразования Фурье . Был построен список значений y = f ( x 0 + k ∆ x ), где f — исходная функция плотности, ∆ x примерно равна 0,002, а k равно от 0 до 1000. Дискретное преобразование Y Фурье y было вычислено. Тогда свертка f сама с собой пропорциональна обратному дискретному преобразованию Фурье поточечного произведения Y с самой собой.
Исходная функция плотности вероятности
[ редактировать ]Начнем с функции плотности вероятности. Эта функция, хотя и прерывистая, но далеко не самый патологический пример, который можно было бы создать. Это кусочный полином с частями степени 0 и 1. Среднее значение этого распределения равно 0, а его стандартное отклонение равно 1.
Функция плотности вероятности суммы двух слагаемых
[ редактировать ]Затем мы вычисляем плотность суммы двух независимых переменных , каждая из которых имеет указанную выше плотность. Плотность суммы представляет собой свертку указанной выше плотности с самой собой.
Сумма двух переменных имеет среднее значение 0.Плотность, показанная на рисунке справа, была изменена на , так что его стандартное отклонение равно 1.
Эта плотность уже более гладкая, чем оригинал.Имеются явные комки, соответствующие интервалам , на которых определялась исходная плотность.
Функция плотности вероятности суммы трех слагаемых
[ редактировать ]Затем мы вычисляем плотность суммы трех независимых переменных, каждая из которых имеет указанную выше плотность. Плотность суммы — это свертка первой плотности со второй.
Сумма трех переменных имеет среднее значение 0.Плотность, показанная на рисунке справа, была масштабирована на √ 3 , так что ее стандартное отклонение равно 1.
Эта плотность еще более гладкая, чем предыдущая.На этом рисунке комочки едва заметны.
Функция плотности вероятности суммы четырех слагаемых
[ редактировать ]Наконец, мы вычисляем плотность суммы четырех независимых переменных, каждая из которых имеет указанную выше плотность. Плотность суммы — это свертка первой плотности с третьей (или второй плотности с самой собой).
Сумма четырех переменных имеет среднее значение 0.Плотность, показанная на рисунке справа, была масштабирована на √ 4 , так что ее стандартное отклонение равно 1.
Эта плотность качественно очень похожа на нормальную плотность .Никакие комочки на глаз не различимы.
Иллюстрация дискретного случая
[ редактировать ]В этом разделе центральная предельная теорема иллюстрируется на примере, для которого вычисления можно быстро выполнить вручную на бумаге, в отличие от более ресурсоемкого примера из предыдущего раздела.
Исходная функция массы вероятности
[ редактировать ]Предположим, что распределение вероятностей дискретной случайной величины X присваивает равные веса 1, 2 и 3:
Массовую функцию вероятности случайной величины X можно изобразить следующей гистограммой :
Очевидно, что это совсем не похоже на колоколообразную кривую нормального распределения. Сравните приведенное выше с изображениями ниже.
Массовая функция вероятности суммы двух слагаемых
[ редактировать ]Теперь рассмотрим сумму двух независимых копий X :
Массовую функцию вероятности этой суммы можно изобразить следующим образом:
Это все еще не очень похоже на колоколообразную кривую, но, как и колоколообразная кривая и в отличие от функции массы вероятности самого X , она выше в середине, чем в двух хвостах.
Массовая функция вероятности суммы трех слагаемых
[ редактировать ]Теперь рассмотрим сумму трех независимых копий этой случайной величины:
Массовую функцию вероятности этой суммы можно изобразить следующим образом:
Мало того, что в центре она больше, чем у хвостов, но по мере продвижения к центру от любого хвоста наклон сначала увеличивается, а затем уменьшается, как и в случае с колоколообразной кривой.
Степень ее сходства с колоколообразной кривой можно количественно оценить следующим образом. Учитывать
- Пр 1 + X2 + X3(
Насколько это близко к тому, что нормальное дало бы приближение? Легко видеть, что ожидаемое значение Y = X 1 + X 2 + X 3 равно 6, а стандартное отклонение Y представляет собой квадратный корень из 2 . Поскольку Y ≤ 7 (слабое неравенство) тогда и только тогда, когда Y < 8 (строгое неравенство), мы используем поправку на непрерывность и ищем
где Z имеет стандартное нормальное распределение. Разница между 0,85185... и 0,85558... кажется удивительно малой, если учесть, что количество добавленных независимых случайных величин составило всего три.
Массовая функция вероятности суммы 1000 членов
[ редактировать ]На следующем изображении показан результат моделирования на основе примера, представленного на этой странице. Извлечение из равномерного распределения повторяется 1000 раз и результаты суммируются.
Поскольку моделирование основано на методе Монте-Карло , процесс повторяется 10 000 раз. Результаты показывают, что распределение суммы 1000 однородных экстракций очень хорошо напоминает колоколообразную кривую.
Внешние ссылки
[ редактировать ]- Единообразное суммирование в Mathworld
- Анимированные примеры CLT
- Общая динамическая деятельность SOCR CLT
- Интерактивное моделирование центральной предельной теоремы для Windows
- Деятельность SOCR CLT обеспечивает практическую демонстрацию теории и приложений этой предельной теоремы .
- демонстрирующее центральную предельную теорему с доской Гальтона. Музыкальное видео Карла МакТэга,