Характеристическая функция (теория вероятностей)

В теории вероятностей и статистике характеристическая функция любой вещественной случайной величины полностью определяет ее распределение вероятностей . Если случайная величина допускает функцию плотности вероятности , то характеристическая функция представляет собой преобразование Фурье (с изменением знака) функции плотности вероятности. Таким образом, это обеспечивает альтернативный путь к аналитическим результатам по сравнению с прямой работой с функциями плотности вероятности или кумулятивными функциями распределения . Особенно простые результаты получены для характеристических функций распределений, определяемых взвешенными суммами случайных величин.
В дополнение к одномерным распределениям характеристические функции могут быть определены для случайных величин с векторными или матричными значениями, а также могут быть распространены на более общие случаи.
Характеристическая функция всегда существует, если рассматривать ее как функцию действительного аргумента, в отличие от функции, порождающей момент . Существуют связи между поведением характеристической функции распределения и свойствами распределения, такими как существование моментов и существование функции плотности.
Введение
[ редактировать ]Характеристическая функция – это способ описания случайной величины .Характеристическая функция ,
функция t ,определяет поведение и свойства распределения вероятностей случайной X. величины Это эквивалентно функции плотности вероятности или кумулятивной функции распределения в том смысле, что, зная одну из функций, всегда можно найти другие, но они дают разную информацию для понимания особенностей случайной величины. Более того, в отдельных случаях могут быть различия в том, можно ли представить эти функции в виде выражений, включающих простые стандартные функции.
Если случайная величина допускает функцию плотности , то характеристическая функция является ее двойственной Фурье в том смысле, что каждая из них является преобразованием Фурье другой. Если случайная величина имеет производящую момент функцию , то область определения характеристической функции можно продолжить на комплексную плоскость, и
Однако обратите внимание, что характеристическая функция распределения четко определена для всех действительных значений t функция , , даже если производящая момент, не определена четко для всех действительных значений t .
Подход характеристических функций особенно полезен при анализе линейных комбинаций независимых случайных величин: классическое доказательство Центральной предельной теоремы использует характеристические функции и теорему о непрерывности Леви . Другое важное приложение — к теории разложимости случайных величин.
Определение
[ редактировать ]Для скалярной случайной величины X характеристическая функция определяется как ожидаемое значение e ИТХ , где i — мнимая единица , а t ∈ R — аргумент характеристической функции:
Здесь F X — кумулятивная функция распределения X функцией , f X — соответствующая функция плотности вероятности , Q X ( p ) — соответствующая обратная кумулятивная функция распределения, также называемая квантиля , [2] а интегралы имеют вид Римана–Стилтьеса . Если случайная величина X имеет функцию плотности вероятности , то характеристической функцией является ее преобразование Фурье с изменением знака в комплексной экспоненте. [3] [ нужна страница ] . [4] Это соглашение о константах, входящих в определение характеристической функции, отличается от обычного соглашения о преобразовании Фурье. [5] Например, некоторые авторы [6] определим φ X ( t ) = E[ e −2 πitX ] , что по сути является изменением параметра. В литературе можно встретить и другие обозначения: как характеристическая функция для вероятностной меры p , или как характеристическая функция, соответствующая плотности f .
Обобщения
[ редактировать ]Понятие характеристических функций распространяется на многомерные случайные величины и более сложные случайные элементы . Аргумент характеристической функции всегда будет принадлежать непрерывному двойственному пространству, в котором случайная величина X принимает свои значения. Для распространенных случаев такие определения перечислены ниже:
- Если X — k -мерный случайный вектор , то для t ∈ R к где является транспонированием вектора ,
- Если X — k × p размерности случайная матрица , то для t ∈ R k × p где — оператор трассировки ,
- Если X — комплексная случайная величина , то для t ∈ C [7] где представляет собой сопряжение комплексное и это действительная часть комплексного числа ,
- Если X — k -мерный комплексный случайный вектор , то для t ∈ C к [8] где является сопряженным транспонированием вектора ,
- Если X ( s ) — случайный процесс , то для всех функций t ( s ) таких, что интеграл сходится почти для всех реализаций X [9]
Примеры
[ редактировать ]Распределение | Характеристическая функция |
---|---|
Вырожденное δ a | |
Бернулли Берн( п ) | |
Биномиальный B( n, p ) | |
Отрицательный бином NB( r, p ) | |
Рыбный горошек ( λ ) | |
Равномерный (непрерывный) U( a, b ) | |
Равномерное (дискретное) DU( a, b ) | |
Лаплас L( μ , b ) | |
Логистика Логистика( μ , s ) | |
Нормальный Н ( м , р 2 ) | |
Хи-квадрат χ 2 к | |
Нецентральный хи-квадрат | |
Обобщенный хи-квадрат | |
Коши C( μ , θ ) | |
Гамма Γ( k , θ ) | |
Экспоненциальный Exp( λ ) | |
Геометрический Gf( p ) (количество неудач) | |
Геометрический Gt( p ) (количество испытаний) | |
Многомерный нормальный N ( μ , Σ ) | |
Многомерный Коши MultiCauchy( μ , Σ ) [10] |
Оберхеттингер (1973) приводит обширные таблицы характеристических функций.
Характеристики
[ редактировать ]- Характеристическая функция вещественной случайной величины всегда существует, поскольку она является интегралом от ограниченной непрерывной функции в пространстве, мера которого конечна.
- Характеристическая функция равномерно непрерывна на всем пространстве.
- Оно не обращается в нуль в области около нуля: φ (0) = 1 .
- Оно ограничено: | φ ( т ) | ≤ 1 .
- Оно эрмитово : φ (− t ) знак равно φ ( t ) . В частности, характеристическая функция симметричной (вокруг начала координат) случайной величины является вещественной и четной .
- Существует биекция между распределениями вероятностей и характеристическими функциями. То есть для любых двух случайных величин X 1 , X 2 обе имеют одинаковое распределение вероятностей тогда и только тогда, когда . [ нужна ссылка ]
- Если случайная величина X имеет моменты до k -го порядка, то характеристическая функция φ X k раз непрерывно дифференцируема на всей вещественной прямой. В этом случае
- Если характеристическая функция φ X имеет k -ю производную в нуле, то случайная величина X имеет все моменты до k , если k четное, и только до k – 1 , если k нечетное. [11]
- Если X 1 , ..., X n — независимые случайные величины, а a 1 , ..., an — некоторые константы, то характеристическая функция линейной комбинации переменных X i равна Одним из конкретных случаев является сумма двух независимых случайных величин X 1 и X 2, и в этом случае имеем
- Позволять и две случайные величины с характеристическими функциями и . и независимы тогда и только тогда, когда .
- Хвостовое поведение характеристической функции определяет гладкость соответствующей функции плотности.
- Пусть случайная величина быть линейным преобразованием случайной величины . Характеристическая функция является . Для случайных векторов и (где A — постоянная матрица, а B — постоянный вектор), имеем . [12]
Непрерывность
[ редактировать ]Установленная выше биекция между распределениями вероятностей и характеристическими функциями является секвенциально непрерывной . То есть всякий раз, когда последовательность функций распределения F j ( x ) сходится (слабо) к некоторому распределению F ( x ) , соответствующая последовательность характеристических функций φ j ( t ) также будет сходиться, и предел φ ( t ) будет соответствовать к характеристической функции закона F . Более формально это формулируется как
- Теорема Леви о непрерывности : последовательность X j с n случайных величин -мерами сходится по распределению к случайной величине X тогда и только тогда, когда последовательность φ X j сходится поточечно к функции φ , непрерывной в начале координат. Где φ характеристическая функция X. — [13]
Эту теорему можно использовать для доказательства закона больших чисел и центральной предельной теоремы .
Формула инверсии
[ редактировать ]Между кумулятивными функциями распределения и характеристическими функциями существует взаимно однозначное соответствие , поэтому можно найти одну из этих функций, если мы знаем другую. Формула в определении характеристической функции позволяет нам вычислить φ , когда мы знаем функцию распределения F (или плотность f ). Если, с другой стороны, мы знаем характеристическую функцию φ и хотим найти соответствующую функцию распределения, то одну из следующих теорем обращения можно использовать .
Теорема . Если характеристическая функция φ X случайной величины X интегрируема X , то F X абсолютно непрерывна, и, следовательно, имеет функцию плотности вероятности . В одномерном случае (т.е. когда X скалярнозначно) функция плотности определяется выражением
В многомерном случае это
где является скалярным произведением .
Функция плотности представляет собой производную Радона–Никодима распределения µ X по мере Лебега λ :
Теорема (Леви) . [примечание 1] Если φ X является характеристической функцией функции распределения F X , две точки a < b таковы, что { x | a < x < b } — непрерывности множество µ X (в одномерном случае это условие эквивалентно непрерывности F X в точках a и b ), тогда
- Если X скаляр: Эту формулу можно переформулировать в более удобной для численного расчета форме: [14] Для случайной величины, ограниченной снизу, можно получить взяв такой, что В противном случае, если случайная величина не ограничена снизу, предел для дает , но численно непрактично. [14]
- Если X — векторная случайная величина:
Теорема . Если a (возможно) является атомом X (в одномерном случае это означает точку разрыва F X ), то
- Если X скаляр:
- Если X — векторная случайная величина: [15]
Теорема (Жиль-Пелаес) . [16] Для одномерной случайной величины X , если x является точкой непрерывности F X , то
где мнимая часть комплексного числа дается .
А его функция плотности:
Интеграл может быть не интегрируемым по Лебегу ; например, когда X — дискретная случайная величина , которая всегда равна 0, она становится интегралом Дирихле .
Доступны формулы обращения для многомерных распределений. [14] [17]
Критерии характеристических функций
[ редактировать ]Множество всех характеристических функций замыкается при определенных операциях:
- Выпуклая линейная комбинация (с ) конечного или счетного числа характеристических функций также является характеристической функцией.
- Произведение конечного числа характеристических функций также является характеристической функцией. То же самое справедливо и для бесконечного произведения при условии, что оно сходится к функции, непрерывной в начале координат.
- Если φ — характеристическая функция, а α — действительное число, то , Re( φ ), | ж | 2 , и φ ( αt ) также являются характеристическими функциями.
Хорошо известно, что любая неубывающая càdlàg функция F с пределами F (−∞) = 0 , F (+∞) = 1 соответствует кумулятивной функции распределения некоторой случайной величины. Также существует интерес найти аналогичные простые критерии того, когда данная функция φ может быть характеристической функцией некоторой случайной величины. Центральным результатом здесь является теорема Бохнера , хотя ее полезность ограничена, поскольку главное условие теоремы — неотрицательная определенность — очень трудно проверить. Существуют и другие теоремы, например теоремы Хинчина, Матиаса или Крамера, хотя их применение столь же сложно. С другой стороны, теорема Полиа дает очень простое условие выпуклости, которое является достаточным, но не необходимым. Характеристические функции, удовлетворяющие этому условию, называются типами Полиа. [18]
Теорема Бохнера . Произвольная функция φ : R н → C — характеристическая функция некоторой случайной величины тогда и только тогда, когда φ положительно определена , непрерывна в начале координат и если φ (0) = 1 .
Критерий Хинчина . Комплекснозначная абсолютно непрерывная функция φ с φ (0) = 1 является характеристической функцией тогда и только тогда, когда она допускает представление
Теорема Матиаса . Действительная, четная, непрерывная, абсолютно интегрируемая функция φ с φ (0) = 1 является характеристической функцией тогда и только тогда, когда
для n = 0,1,2,... и всех p > 0 . Здесь H 2 n обозначает полином Эрмита степени 2 n .

Теорема Полиа . Если — вещественная четная непрерывная функция, удовлетворяющая условиям
- ,
- является выпуклым для ,
- ,
тогда φ ( t ) — характеристическая функция абсолютно непрерывного распределения, симметричного относительно 0.
Использование
[ редактировать ]Из-за теоремы о непрерывности характеристические функции используются в наиболее часто встречающемся доказательстве центральной предельной теоремы . Основной прием вычислений с характеристической функцией заключается в признании этой функции характеристической функцией определенного распределения.
Базовые манипуляции с дистрибутивами
[ редактировать ]Характеристические функции особенно полезны при работе с линейными функциями независимых случайных величин. Например, если X 1 , X 2 , ..., X n представляет собой последовательность независимых (и не обязательно одинаково распределенных) случайных величин, и
где a i характеристическая функция для Sn — константы, то определяется выражением
В частности, φ X+Y ( t ) = φ X ( t ) φ Y ( t ) . Чтобы убедиться в этом, выпишите определение характеристической функции:
Независимость X и Y необходима для установления равенства третьего и четвертого выражений.
Другой особый случай, представляющий интерес для одинаково распределенных случайных величин, — это когда a i = 1/ n , а затем S n — выборочное среднее. В этом случае, записывая X для обозначения среднего значения,
Моменты
[ редактировать ]Характеристические функции также можно использовать для поиска моментов случайной величины. При условии, что n - й момент существует, характеристическую функцию можно дифференцировать n раз:
Формально это можно записать с помощью производных дельта-функции Дирака : что позволяет формально решить проблему моментов .Например, предположим, что X имеет стандартное распределение Коши . Тогда φ X ( t ) = e −| т | . Это не дифференцируемо при t = 0 , показывая, что распределение Коши не имеет математического ожидания . Кроме того, характеристическая функция выборочного среднего X n наблюдений независимых имеет характеристическую функцию φ X ( t ) = ( e −| т |/ н ) н = и −| т | , используя результат из предыдущего раздела. Это характерная функция стандартного распределения Коши: таким образом, выборочное среднее имеет то же распределение, что и сама совокупность.
В качестве дальнейшего примера предположим, что X следует распределению Гаусса , т.е. . Затем и
Аналогичный расчет показывает и его легче осуществить, чем применять определение ожидания и использовать интегрирование по частям для оценки .
Логарифм характеристической функции является производящей функцией кумулянта , которая полезна для нахождения кумулянтов ; некоторые вместо этого определяют кумулянтную производящую функцию как логарифм функции, генерирующей момент , и называют логарифм характеристической функции второй кумулянтной производящей функцией.
Анализ данных
[ редактировать ]Характеристические функции могут использоваться как часть процедур подбора вероятностных распределений к выборкам данных. Случаи, когда это обеспечивает практический вариант по сравнению с другими возможностями, включают подбор стабильного распределения, поскольку выражения для плотности в замкнутой форме недоступны, что затрудняет реализацию оценки максимального правдоподобия . Доступны процедуры оценки, которые сопоставляют теоретическую характеристическую функцию с эмпирической характеристической функцией , рассчитанной на основе данных. Полсон и др. (1975) [19] и Хиткот (1977) [20] предоставить некоторую теоретическую основу для такой процедуры оценки. Кроме того, Ю (2004) [21] описывает применение эмпирических характеристических функций для соответствия моделям временных рядов , где процедуры правдоподобия непрактичны. Эмпирические характеристические функции также использовались Ансари и др. (2020) [22] и Ли и др. (2020) [23] для обучения генеративно-состязательных сетей .
Пример
[ редактировать ]Гамма -распределение с параметром масштаба θ и параметром формы k имеет характеристическую функцию
Теперь предположим, что у нас есть
где X и Y распределение X + Y. независимы друг от друга, и мы хотим знать, каково Характеристическими функциями являются
что в силу независимости и основных свойств характеристической функции приводит к
Это характеристическая функция параметра масштаба гамма-распределения θ и параметра формы k 1 + k 2 , и поэтому мы заключаем
Результат можно расширить до n независимых гамма-распределенных случайных величин с тем же масштабным параметром, и мы получим
Целые характеристические функции
[ редактировать ]![]() | Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( декабрь 2009 г. ) |
Как определено выше, аргумент характеристической функции рассматривается как действительное число: однако некоторые аспекты теории характеристических функций развиваются путем расширения определения в комплексную плоскость путем аналитического продолжения в тех случаях, когда это возможно. [24]
Связанные понятия
[ редактировать ]Связанные понятия включают функцию, генерирующую момент , и функцию, генерирующую вероятность . Характеристическая функция существует для всех распределений вероятностей. Это не относится к функции, производящей момент.
Характеристическая функция тесно связана с преобразованием Фурье характеристическая функция функции плотности вероятности p ( x ) является комплексно-сопряженным непрерывным преобразованием Фурье p : ( x ) (согласно обычному соглашению; см. непрерывное преобразование Фурье - другое конвенции ).
где P ( t ) обозначает непрерывное преобразование Фурье функции плотности вероятности p ( x ) . Аналогично, p ( x ) можно восстановить из φ X ( t ) посредством обратного преобразования Фурье:
Действительно, даже если случайная величина не имеет плотности, характеристическую функцию можно рассматривать как преобразование Фурье меры, соответствующей случайной величине.
Другая родственная концепция — представление вероятностных распределений как элементов воспроизводящего ядра гильбертова пространства посредством встраивания распределений в ядро . Эту структуру можно рассматривать как обобщение характеристической функции при конкретном выборе функции ядра .
См. также
[ редактировать ]- Субнезависимость — более слабое условие, чем независимость, определяемое через характеристические функции.
- Кумулянт — член производящих функций кумулянта , которые представляют собой журналы характеристических функций.
Примечания
[ редактировать ]Ссылки
[ редактировать ]Цитаты
[ редактировать ]- ^ Лукач (1970) , стр. 196.
- ^ Шоу, WT; Маккейб, Дж. (2009). «Выборка методом Монте-Карло с учетом характеристической функции: квантильная механика в пространстве импульсов». arXiv : 0903.1592 [ q-fin.CP ].
- ^ Статистическая и адаптивная обработка сигналов (2005)
- ^ Биллингсли (1995) .
- ^ Пинский (2002) .
- ^ Бохнер (1955) .
- ^ Андерсен и др. (1995) , Определение 1.10.
- ^ Андерсен и др. (1995) , Определение 1.20.
- ^ Собчик (2001) , стр. 20.
- ^ Коц и Надараджа (2004) , с. 37, используя 1 как число степеней свободы для восстановления распределения Коши.
- ^ Лукач (1970) , Следствие 1 к теореме 2.3.1.
- ^ «Совместная характеристическая функция» . www.statlect.com . Проверено 7 апреля 2018 г.
- ^ Куппенс (1975) , Теорема 2.6.9.
- ^ Jump up to: а б с Шепард (1991а) .
- ^ Куппенс (1975) , Теорема 2.3.2.
- ^ Вендель (1961) .
- ^ Шепард (1991b) .
- ^ Лукач (1970) , стр. 84.
- ^ Полсон, Холкомб и Лейтч (1975) .
- ^ Хиткот (1977) .
- ^ Yu (2004) .
- ^ Ансари, Скарлетт и Со (2020) .
- ^ Ли и др. (2020) .
- ^ Лукач (1970) , Глава 7.
Источники
[ редактировать ]- Андерсен, Х.Х.; Хойбьерре, М.; Соренсен, Д.; Эриксен, П.С. (1995). Линейные и графические модели многомерного комплексного нормального распределения . Конспекты лекций по статистике 101. Нью-Йорк: Springer-Verlag. ISBN 978-0-387-94521-7 .
- Биллингсли, Патрик (1995). Вероятность и мера (3-е изд.). Джон Уайли и сыновья. ISBN 978-0-471-00710-4 .
- Бисгаард, ТМ; Сасвари, З. (2000). Характеристические функции и последовательности моментов . Нова Наука.
- Бохнер, Саломон (1955). Гармонический анализ и теория вероятностей . Издательство Калифорнийского университета.
- Куппенс, Р. (1975). Разложение многомерных вероятностей . Академическая пресса. ISBN 9780121994501 .
- Хиткот, Чехия (1977). «Интегральная квадратичная ошибка оценки параметров». Биометрика . 64 (2): 255–264. дои : 10.1093/biomet/64.2.255 .
- Лукач, Э. (1970). Характеристические функции . Лондон: Гриффин.
- Коц, Сэмюэл; Надараджа, Саралис (2004). Многомерные Т-распределения и их приложения . Издательство Кембриджского университета.
- Манолакис, Димитрис Г.; Ингл, Винай К.; Когон, Стивен М. (2005). Статистическая и адаптивная обработка сигналов: спектральная оценка, моделирование сигналов, адаптивная фильтрация и обработка массивов . Артех Хаус. ISBN 978-1-58053-610-3 .
- Оберхеттингер, Фриц (1973). Преобразования Фурье распределений и обратные им; сборник таблиц . Нью-Йорк: Академическая пресса. ISBN 9780125236508 .
- Полсон, А.С.; Холкомб, EW; Лейтч, Р.А. (1975). «Оценка параметров устойчивых законов». Биометрика . 62 (1): 163–170. дои : 10.1093/biomet/62.1.163 .
- Пинский, Марк (2002). Введение в анализ Фурье и вейвлеты . Брукс/Коул. ISBN 978-0-534-37660-4 .
- Собчик, Казимеж (2001). Стохастические дифференциальные уравнения . Академическое издательство Kluwer . ISBN 978-1-4020-0345-5 .
- Вендель, Дж. Г. (1961). «Неабсолютная сходимость интеграла обращения Жиля-Пелаеса» . Анналы математической статистики . 32 (1): 338–339. дои : 10.1214/aoms/1177705164 .
- Ю, Дж. (2004). «Оценка эмпирической характеристической функции и ее приложения» (PDF) . Эконометрические обзоры . 23 (2): 93–1223. дои : 10.1081/ETC-120039605 . S2CID 9076760 .
- Шепард, Нью-Йорк (1991a). «От характеристической функции к функции распределения: простая основа теории» . Эконометрическая теория . 7 (4): 519–529. дои : 10.1017/s0266466600004746 . S2CID 14668369 .
- Шепард, Нью-Йорк (1991b). «Правила численного интегрирования для многомерных обращений» . Журнал статистических вычислений и моделирования . 39 (1–2): 37–46. дои : 10.1080/00949659108811337 .
- Ансари, Абдул Фатир; Скарлетт, Джонатан; Итак, Гарольд (2020). «Подход с характеристическими функциями к глубокому неявному генеративному моделированию» . Материалы конференции IEEE/CVF по компьютерному зрению и распознаванию образов (CVPR), 2020 . стр. 7478–7487.
- Ли, Шэнси; Ю, Цзэян; Сян, Мин; Мандич, Данило (2020). «Взаимное состязательное обучение с помощью характеристических функций» . Достижения в области нейронных систем обработки информации 33 (NeurIPS 2020) .
Внешние ссылки
[ редактировать ]- «Характеристическая функция» , Математическая энциклопедия , EMS Press , 2001 [1994]