Сменные случайные величины
В статистике — сменная последовательность случайных величин (также иногда взаимозаменяемых ). [1] — это последовательность X 1 , X 2 , X 3 , ... (которая может быть конечной или бесконечно длинной), совместное распределение вероятностей которой не меняется при изменении позиций в последовательности, в которой появляется конечное число из них. Другими словами, совместное распределение инвариантно к конечной перестановке. Так, например, последовательности
оба имеют одинаковое совместное распределение вероятностей.
Это тесно связано с использованием независимых и одинаково распределенных случайных величин в статистических моделях. Сменные последовательности случайных величин возникают в случаях простой случайной выборки .
Определение
[ редактировать ]Формально обменной последовательностью случайных величин называется конечная или бесконечная последовательность X 1 , X 2 , X 3 , ... случайных величин такая, что для любой конечной перестановки σ индексов 1, 2, 3, ..., ( перестановка действует только на конечное число индексов, остальные фиксированы), совместное распределение вероятностей перестановочной последовательности
совпадает с совместным распределением вероятностей исходной последовательности. [1] [2]
(Последовательность событий E 1 , E 2 , E 3 , ... называется обменной именно в том случае, если последовательность ее индикаторных функций является обменной.) Функция распределения F X 1 ,..., X n ( x 1 , ..., x n ) конечной последовательности перестановочных случайных величин симметрична по своим аргументам x 1 , ..., x n . Олав Калленберг дал подходящее определение взаимозаменяемости для случайных процессов с непрерывным временем. [3] [4]
История
[ редактировать ]Эта концепция была представлена Уильямом Эрнестом Джонсоном в его книге 1924 года «Логика, часть III: Логические основы науки» . [5] Обмениваемость эквивалентна концепции статистического контроля, введенной Уолтером Шухартом также в 1924 году. [6] [7]
Взаимозаменяемость и статистическая модель iid
[ редактировать ]Свойство заменяемости тесно связано с использованием независимых и одинаково распределенных (iid) случайных величин в статистических моделях. [8] Последовательность случайных величин, которые являются iid, зависящими от некоторой базовой формы распределения, можно обменивать. Это следует непосредственно из структуры совместного распределения вероятностей, генерируемого формой iid.
Смесь заменяемых последовательностей (в частности, последовательностей iid-переменных) заменяемы. Обратное утверждение можно установить для бесконечных последовательностей с помощью важной о представлении теоремы Бруно де Финетти (позже расширенной другими теоретиками вероятностей, такими как Халмош и Сэвидж ). [9] Расширенные версии теоремы показывают, что в любой бесконечной последовательности заменяемых случайных величин случайные величины условно независимы и одинаково распределены , учитывая основную форму распределения. Эта теорема кратко сформулирована ниже. (Исходная теорема Де Финетти показала, что это верно только для случайных индикаторных переменных, но позже это было расширено, чтобы охватить все последовательности случайных величин.) Другой способ выразить это состоит в том, что теорема де Финетти характеризует заменяемые последовательности как смеси iid последовательностей - в то время как заменяемая последовательность сама по себе не обязательно должна быть безусловно iid, она может быть выражена как смесь лежащих в основе iid последовательностей. [1]
Это означает, что бесконечные последовательности заменяемых случайных величин можно эквивалентно рассматривать как последовательности условно одинаковых случайных величин, основанных на некоторой базовой форме распределения. (Обратите внимание, что эта эквивалентность не совсем справедлива для конечной заменяемости. Однако для конечных векторов случайных величин существует близкое приближение к модели iid.) Бесконечная заменяемая последовательность строго стационарна , поэтому закон больших чисел имеет вид теорема Биркгофа – Хинчина . Применима [4] Это означает, что базовому распределению можно дать оперативную интерпретацию как предельное эмпирическое распределение последовательности значений. Тесная связь между обменными последовательностями случайных величин и формой iid означает, что последняя может быть оправдана на основе бесконечной обмениваемости. Это понятие является центральным для Бруно де Финетти разработки прогнозирующего вывода и байесовской статистики . Также можно показать, что это полезное основополагающее предположение в частотной статистике и связывает две парадигмы. [10]
Теорема о представлении: Это утверждение основано на представлении О'Нила (2009) в ссылках ниже. Учитывая бесконечную последовательность случайных величин определим предельную эмпирическую функцию распределения к
(Это предел Чезаро индикаторных функций. В тех случаях, когда предел Чезаро не существует, эту функцию фактически можно определить как банаховский предел индикаторных функций, который является расширением этого предела. Этот последний предел всегда существует для сумм индикаторных функций, так что эмпирическое распределение всегда четко определено.) Это означает, что для любого вектора случайных величин в последовательности мы имеем совместную функцию распределения, определяемую выражением
Если функция распределения индексируется другим параметром тогда (с соответствующим определением плотностей) мы имеем
Эти уравнения показывают совместное распределение или плотность, характеризуемую как смешанное распределение, основанное на базовом предельном эмпирическом распределении (или параметре, индексирующем это распределение).
Обратите внимание, что не все конечные заменяемые последовательности являются смесью iid. Чтобы убедиться в этом, рассмотрим выборку без замены из конечного набора до тех пор, пока не останется ни одного элемента. Результирующая последовательность является заменяемой, но не является смесью iid. Действительно, при условии, что все остальные элементы последовательности известны, оставшийся элемент известен.
Ковариация и корреляция
[ редактировать ]Заменяемые последовательности обладают некоторыми основными свойствами ковариации и корреляции, что означает, что они обычно положительно коррелируют. Для бесконечных последовательностей заменяемых случайных величин ковариация между случайными величинами равна дисперсии среднего значения базовой функции распределения. [10] Для конечных взаимозаменяемых последовательностей ковариация также является фиксированной величиной, не зависящей от конкретных случайных величин в последовательности. Существует более слабая нижняя граница, чем для бесконечной обмениваемости, и возможно существование отрицательной корреляции.
Ковариация для заменяемых последовательностей (бесконечная): если последовательность взаимозаменяем, то
Ковариация для заменяемых последовательностей (конечная): Если можно обменять на , затем
Результат о конечной последовательности можно доказать следующим образом. Используя тот факт, что ценности взаимозаменяемы, мы имеем
Затем мы можем решить неравенство для ковариации, получив указанную нижнюю оценку. Неотрицательность ковариации для бесконечной последовательности может быть получена как предельный результат из этого результата для конечной последовательности.
Равенство нижней границы для конечных последовательностей достигается в простой модели урны: урна содержит 1 красный шарик и n - 1 зеленый шарик, и их образцы отбираются без замены, пока урна не опустеет. Пусть X i = 1, если красный шарик вытащили в i -м испытании, и 0 в противном случае. Конечная последовательность, достигающая нижней границы ковариации, не может быть расширена до более длинной заменяемой последовательности. [11]
Примеры
[ редактировать ]- Любая выпуклая комбинация или смешанное распределение - последовательностей iid случайных величин является взаимозаменяемой. Обратным утверждением является теорема де Финетти . [12]
- Предположим, в урне находится красный и синие мраморы. Предположим, шарики вытягивают без замены, пока урна не опустеет. Позволять – индикаторная случайная величина события, которое -й нарисованный шарик красный. Затем является сменной последовательностью. Эта последовательность не может быть расширена до какой-либо более длинной заменяемой последовательности.
- Предположим, в урне находится красный и синие мраморы. Далее предположим, что из урны вытащили шарик, а затем заменили его дополнительным шариком того же цвета. Позволять – индикаторная случайная величина события, которое -й нарисованный шарик красный. Затем является сменной последовательностью. Эта модель называется урна Поли .
- Позволять имеют двумерное нормальное распределение с параметрами , и произвольный коэффициент корреляции . Случайные величины и тогда взаимозаменяемы, но независимы только в том случае, если . Функция плотности
Приложения
[ редактировать ]Экстрактор фон Неймана — это экстрактор случайности , который зависит от возможности обмена: он дает метод получения заменяемой последовательности нулей и единиц ( испытания Бернулли ) с некоторой вероятностью p , равной 0 и из 1 и создаем (более короткую) заменяемую последовательность нулей и единиц с вероятностью 1/2.
Разделите последовательность на непересекающиеся пары: если два элемента пары равны (00 или 11), отбросьте ее; если два элемента пары неравны (01 или 10), сохраните первый. Это дает последовательность испытаний Бернулли с поскольку из-за возможности обмена шансы данной пары, равные 01 или 10, равны.
Заменяемые случайные величины возникают при изучении статистики U , особенно при разложении Хёффдинга. [13]
Взаимозаменяемость является ключевым допущением метода конформного предсказания, основанного на выводе без распределения . [14]
См. также
[ редактировать ]- Передискретизация
- Повторная выборка (статистика) § Критерии перестановки , статистические тесты, основанные на обмене между группами
Примечания
[ редактировать ]- ^ Перейти обратно: а б с Короче говоря, порядок последовательности случайных величин не влияет на ее совместное распределение вероятностей.
- Чоу, Юань Ши и Тейчер, Генри, Теория вероятностей. Независимость, взаимозаменяемость, мартингалы, «Тексты Спрингера в статистике», 3-е изд., Спрингер, Нью-Йорк, 1997. xxii+488 стр. ISBN 0-387-98228-0
- ^ Олдос, Дэвид Дж., Обмениваемость и смежные темы , в: École d'Été de Probabilités de Saint-Flour XIII — 1983, Конспекты лекций по математике. 1117, с. 1–198, Шпрингер, Берлин, 1985. ISBN 978-3-540-15203-3 два : 10.1007/BFb0099421
- ^ Диаконис, Перси (2009). «Рецензия на книгу: Вероятностные симметрии и принципы инвариантности (Олав Калленберг, Спрингер, Нью-Йорк, 2005)» . Бюллетень Американского математического общества . Новая серия. 46 (4): 691–696. дои : 10.1090/S0273-0979-09-01262-2 . МР 2525743 .
- ^ Перейти обратно: а б Калленберг О. Вероятностные симметрии и принципы инвариантности . Спрингер-Верлаг, Нью-Йорк (2005). 510 стр. ISBN 0-387-25115-4 .
- ^ Забелл (1992)
- ^ Барлоу и Ирония (1992)
- ^ Бергман (2009)
- ^ Кордани, ЛК; Векслер, С. (2006). «Обучение независимости и взаимозаменяемости» (PDF) . Материалы международной конференции по педагогической статистике . Ден Хааг: Международная ассоциация статистического образования.
- ^ Диаконис, П. (1988). «Недавний прогресс в понятиях взаимозаменяемости де Финетти». В Бернардо, JM ; и др. (ред.). Байесовская статистика . Том. 3. Издательство Оксфордского университета. стр. 111–125. ISBN 0-19-852220-7 .
- ^ Перейти обратно: а б О'Нил, Б. (2009). «Обмениваемость, корреляция и эффект Байеса». Международный статистический обзор . 77 (2): 241–250. дои : 10.1111/j.1751-5823.2008.00059.x .
- ^ Тейлор, Роберт Ли; Даффер, Питер З.; Паттерсон, Рональд Ф. (1985). Предельные теоремы для сумм перестановочных случайных величин . Роуман и Алланхельд. стр. 1–152. ISBN 9780847674350 .
- ^ Спиццичино, Фабио Субъективные вероятностные модели на всю жизнь . Монографии по статистике и прикладной теории вероятности, 91. Chapman & Hall/CRC , Бока-Ратон, Флорида, 2001. xx+248 стр. ISBN 1-58488-060-0
- ^ Borovskikh, Yu. V. (1996). "Chapter 10 Dependent variables". U -statistics in Banach spaces . Utrecht: VSP. pp. 365–376. ISBN 90-6764-200-2 . МР 1419498 .
- ^ Шафер, Гленн; Вовк, Владимир (2008). «Учебник по конформному прогнозированию» . Журнал исследований машинного обучения . 9 : 371–421.
Библиография
[ редактировать ]- Олдос, Дэвид Дж., Обмениваемость и смежные темы , в: École d'Été de Probabilités de Saint-Flour XIII — 1983, Конспекты лекций по математике. 1117, с. 1–198, Шпрингер, Берлин, 1985. ISBN 978-3-540-15203-3 два : 10.1007/BFb0099421
- Барлоу, Р.Э. и Ирони, Т.З. (1992) «Основы статистического контроля качества» в Гош, М. и Патхак, П.К. (ред.) Текущие проблемы статистического вывода: эссе в честь Д. Басу , Хейворд, Калифорния: Институт Математическая статистика, 99–112.
- Бергман, Б. (2009) «Концептуалистический прагматизм: основа байесовского анализа?», IIE Transactions , 41 , 86–93
- Borovskikh, Yu. V. (1996). U -statistics in Banach spaces . Utrecht: VSP. pp. xii+420. ISBN 90-6764-200-2 . МР 1419498 .
- Чоу, Юань Ши и Тейчер, Генри, Теория вероятностей. Независимость, взаимозаменяемость, мартингалы, «Тексты Спрингера в статистике», 3-е изд., Спрингер, Нью-Йорк, 1997. xxii+488 стр. ISBN 0-387-98228-0
- Диаконис, Перси (2009). «Рецензия на книгу: Вероятностные симметрии и принципы инвариантности (Олав Калленберг, Спрингер, Нью-Йорк, 2005)» . Бюллетень Американского математического общества . Новая серия. 46 (4): 691–696. дои : 10.1090/S0273-0979-09-01262-2 . МР 2525743 .
- Калленберг О. Вероятностные симметрии и принципы инвариантности . Спрингер-Верлаг, Нью-Йорк (2005). 510 стр. ISBN 0-387-25115-4 .
- Кингман, JFC, Использование взаимозаменяемости , Ann. Вероятность 6 (1978) 83–197 MR 494344 JSTOR 2243211
- О'Нил, Б. (2009) Обмениваемость, корреляция и эффект Байеса. Международное статистическое обозрение 77(2) , стр. 241–250. ISBN 978-3-540-15203-3 дои : 10.1111/j.1751-5823.2008.00059.x
- Тейлор, Роберт Ли; Даффер, Питер З.; Паттерсон, Рональд Ф. (1985). Предельные теоремы для сумм перестановочных случайных величин . Роуман и Алланхельд. стр. 1–152. ISBN 9780847674350 .
- Забелл, С.Л. (1988) «Симметрия и ее недовольство», в Скирмс, Б. и Харпер, WL Causation, Chance and Credence, стр. 155-190, Kluwer
- Забелл, С.Л. (1992). «Предсказание непредсказуемого». Синтезируйте . 90 (2): 205. дои : 10.1007/bf00485351 . S2CID 9416747 .