Jump to content

Оценка плотности ядра

Оценка плотности ядра для 100 нормально распределенных случайных чисел с использованием различных полос сглаживания.

В статистике ) — это оценка плотности вероятности ( KDE применение сглаживания ядра для оценки плотности вероятности , то есть непараметрический метод оценки функции плотности вероятности на случайной величины основе ядер в качестве весов . KDE решает фундаментальную проблему сглаживания данных, когда выводы о совокупности делаются на основе конечной выборки данных . В некоторых областях, таких как обработка сигналов и эконометрика, его также называют методом окна Парцена-Розенблатта в честь Эмануэля Парцена и Мюррея Розенблатта , которым обычно приписывают независимое создание его в его нынешней форме. [1] [2] Одним из известных применений оценки плотности ядра является оценка условных классов предельных плотностей данных при использовании наивного байесовского классификатора , что может повысить точность его прогнозирования. [3]

Определение

[ редактировать ]

Пусть ( x 1 , x 2 , ..., x n ) будут независимыми и одинаково распределенными выборками, взятыми из некоторого одномерного распределения с неизвестной плотностью ƒ в любой заданной точке x . Нас интересует оценка формы этой функции ƒ . Его оценка плотности ядра :

где K ядро ​​(неотрицательная функция), а h > 0 параметр сглаживания , называемый шириной полосы или просто шириной. [3] Ядро с индексом h называется масштабированным ядром и определяется как K h ( x ) = К ( ) . Интуитивно хочется выбрать h настолько маленьким, насколько позволяют данные; однако всегда существует компромисс между предвзятостью оценщика и его дисперсией. Выбор полосы пропускания более подробно обсуждается ниже.

ряд функций ядра Обычно используется : равномерная, треугольная, двухвесовая, трехвесовая, Епанечникова (параболическая), нормальная и другие. Ядро Епанечникова оптимально в смысле среднеквадратической ошибки: [4] хотя потеря эффективности невелика для ядер, перечисленных ранее. [5] Из-за удобных математических свойств часто используется нормальное ядро, что означает K ( x ) = φ ( x ) , где φ стандартная нормальная функция плотности.

Построение ядерной оценки плотности находит интерпретации в областях, выходящих за рамки оценки плотности. [6] Например, в термодинамике это эквивалентно количеству тепла, выделяемого при тепловых ядер (фундаментальное решение уравнения теплопроводности размещении ) в каждой точке данных x i . Подобные методы используются для построения дискретных операторов Лапласа на облаках точек для обучения многообразию (например, карта диффузии ).

Оценки плотности ядра тесно связаны с гистограммами , но могут быть наделены такими свойствами, как гладкость или непрерывность, с помощью подходящего ядра. Диаграмма ниже, основанная на этих 6 точках данных, иллюстрирует эту взаимосвязь:

Образец 1 2 3 4 5 6
Ценить −2.1 −1.3 −0.4 1.9 5.1 6.2

Для гистограммы сначала горизонтальная ось делится на подинтервалы или интервалы, которые охватывают диапазон данных: в этом случае шесть интервалов каждый шириной 2. Всякий раз, когда точка данных попадает внутрь этого интервала, отображается блок высотой 1. /12 находится там. Если в один и тот же интервал попадает более одной точки данных, блоки складываются друг на друга.

Для оценки плотности ядра нормальные ядра со стандартным отклонением 1,5 (обозначены красными пунктирными линиями) помещаются в каждую из точек данных x i . Ядра суммируются для получения оценки плотности ядра (сплошная синяя кривая). Гладкость оценки плотности ядра (по сравнению с дискретностью гистограммы) показывает, как оценки плотности ядра быстрее сходятся к истинной базовой плотности для непрерывных случайных величин. [7]

Сравнение гистограммы (слева) и оценки плотности ядра (справа), построенной по тем же данным. Шесть отдельных ядер показаны красными пунктирными кривыми, оценка плотности ядра — синими кривыми. Точки данных представляют собой график ковра на горизонтальной оси.
Сравнение гистограммы (слева) и оценки плотности ядра (справа), построенной по тем же данным. Шесть отдельных ядер показаны красными пунктирными кривыми, оценка плотности ядра — синими кривыми. Точки данных представляют собой график ковра на горизонтальной оси.

Выбор полосы пропускания

[ редактировать ]
Оценка плотности ядра (KDE) с различной шириной полосы случайной выборки из 100 точек из стандартного нормального распределения. Серый: истинная плотность (стандартная норма). Красный: KDE с h=0,05. Черный: KDE с h=0,337. Зеленый: KDE с h=2.

Пропускная способность ядра является свободным параметром , который оказывает сильное влияние на результирующую оценку. Чтобы проиллюстрировать его эффект, мы берем смоделированную случайную выборку из стандартного нормального распределения (отмеченного синими шипами на графике ковра на горизонтальной оси). Серая кривая — истинная плотность (нормальная плотность со средним значением 0 и дисперсией 1). Для сравнения, красная кривая недостаточно сглажена , поскольку она содержит слишком много ложных артефактов данных, возникающих из-за использования полосы пропускания h = 0,05, которая слишком мала. Зеленая кривая слишком сглажена, поскольку использование полосы пропускания h = 2 скрывает большую часть базовой структуры. Черная кривая с шириной полосы h = 0,337 считается оптимально сглаженной, поскольку ее оценка плотности близка к истинной плотности. Экстремальная ситуация встречается в пределе (без сглаживания), где оценка представляет собой сумму n дельта-функций с центром в координатах анализируемых образцов. В другом крайнем пределе оценка сохраняет форму используемого ядра, центрированную по среднему значению выборок (полностью гладкая).

Наиболее распространенным критерием оптимальности, используемым для выбора этого параметра, является ожидаемая L2 функция риска , также называемая среднеинтегральной квадратичной ошибкой :

При слабых предположениях относительно ƒ и K ( ƒ — обычно неизвестная функция реальной плотности), [1] [2]

где o маленькое обозначение o , а n — размер выборки (как указано выше). AMISE – это асимптотический MISE, т.е. е. два ведущих термина,

где для функции g , и является второй производной от и это ядро. Минимум этого AMISE является решением этого дифференциального уравнения

или

Ни формулы AMISE, ни формулы h AMISE нельзя использовать напрямую, поскольку они включают в себя неизвестную функцию плотности. или его вторая производная . Чтобы преодолеть эту трудность, были разработаны различные автоматические методы выбора полосы пропускания на основе данных. Было проведено несколько обзорных исследований для сравнения их эффективности. [8] [9] [10] [11] [12] [13] [14] по общему мнению, селекторы плагинов [6] [15] [16] и перекрестной проверки селекторы [17] [18] [19] являются наиболее полезными для широкого спектра наборов данных.

Подставляя любую полосу пропускания h, имеющую тот же асимптотический порядок n −1/5 как ч AMISE в AMISEдает, что AMISE( h ) = O ( n −4/5 ), где O это большое O. обозначение — Можно показать, что при слабых предположениях не может существовать непараметрическая оценка, которая сходится быстрее, чем ядерная оценка. [20] Обратите внимание, что н −4/5 скорость медленнее, чем типичный n −1 скорость сходимости параметрических методов.

Если полоса пропускания не является фиксированной, а изменяется в зависимости от местоположения оценки (баллонная оценка) или выборок (точечная оценка), это дает особенно мощный метод, называемый адаптивной или переменной оценкой плотности ядра полосы пропускания .

Выбор полосы пропускания для оценки плотности ядра распределений с тяжелым хвостом относительно сложен. [21]

Эмпирический оценщик пропускной способности

[ редактировать ]

данных используются базисные функции Гаусса Если для аппроксимации одномерных , а оцениваемая базовая плотность является гауссовой, оптимальным выбором для h (то есть полосы пропускания, которая минимизирует среднеинтегральную квадратичную ошибку ) является: [22]

Ан Значение считается более надежным, если оно улучшает соответствие длиннохвостым и асимметричным распределениям или бимодальным смешанным распределениям. Это часто делается эмпирически путем замены стандартного отклонения по параметру ниже:

где IQR — межквартильный размах.
Сравнение практического правила и пропускной способности решения уравнения
Сравнение практического правила и пропускной способности решения уравнения.

Еще одна модификация, которая улучшит модель, заключается в уменьшении коэффициента с 1,06 до 0,9. Тогда окончательная формула будет такой:

где это размер выборки.

Это приближение называется приближением нормального распределения , приближением Гаусса или Сильвермана эмпирическим правилом . [22] Хотя это эмпирическое правило легко вычислить, его следует использовать с осторожностью, поскольку оно может дать весьма неточные оценки, когда плотность не близка к нормальной. Например, при оценке модели бимодальной гауссовой смеси

из выборки из 200 точек на рисунке справа показаны истинная плотность и две оценки плотности ядра — одна с использованием полосы пропускания по эмпирическому правилу, а другая с использованием полосы пропускания решения уравнения. [6] [16] Оценка, основанная на эмпирическом правиле полосы пропускания, значительно сглажена.

Связь с оценкой плотности характеристической функции

[ редактировать ]

По выборке ( x 1 , x 2 , ..., x n ) естественно оценить характеристическую функцию φ ( t ) = E[ e ИТХ ] как

Зная характеристическую функцию, можно найти соответствующую функцию плотности вероятности с помощью формулы преобразования Фурье . Одна из трудностей применения этой формулы обращения состоит в том, что она приводит к расходящемуся интегралу, поскольку оценка ненадежно для больших t . Чтобы обойти эту проблему, оценщик умножается на функцию демпфирования ψ h ( t ) = ψ ( ht ) , которая равна 1 в начале координат, а затем падает до 0 на бесконечности. «Параметр пропускной способности» h контролирует, насколько быстро мы пытаемся заглушить функцию. . В частности, когда h мало, тогда ψ h ( t ) будет приблизительно равно единице для большого диапазона t , а это означает, что остается практически неизменным в наиболее важной области t .

Наиболее распространенным выбором функции ψ является либо равномерная функция ψ ( t ) = 1 {−1 ≤ t ≤ 1 }, что фактически означает усечение интервала интегрирования в формуле обращения до [−1/ h , 1/ h ] , или функция Гаусса ψ ( t ) = e π т 2 . функции ψ После выбора можно применить формулу обращения, и оценка плотности будет иметь вид

где K преобразование Фурье функции затухания ψ . Таким образом, оценка плотности ядра совпадает с оценкой плотности характеристической функции.

Геометрические и топологические особенности

[ редактировать ]

Мы можем расширить определение (глобального) режима до локального значения и определить локальные режимы:

А именно, представляет собой совокупность точек, для которых функция плотности локально максимизируется. Естественный оценщик это плагин от KDE, [23] [24] где и являются версией KDE и . При мягких предположениях является последовательной оценкой . Обратите внимание, что можно использовать алгоритм среднего сдвига [25] [26] [27] вычислить оценщик численно.

Статистическая реализация

[ редактировать ]

Неисчерпывающий список программных реализаций средств оценки плотности ядра включает:

  • В версии Analytica 4.4 параметр «Сглаживание» для результатов PDF использует KDE, а из выражений он доступен через встроенный Pdf функция.
  • В C / C++ FigTree это библиотека, которую можно использовать для вычисления оценок плотности ядра с использованием обычных ядер. Доступен интерфейс MATLAB.
  • В C++ libagf это библиотека для оценки переменной плотности ядра .
  • В C++ mlpack это библиотека, которая может вычислять KDE, используя множество различных ядер. Это позволяет установить допуск на ошибки для более быстрого вычисления. Python и R. Доступны интерфейсы
  • в C# и F# Math.NET Numerics это библиотека с открытым исходным кодом для численных вычислений, которая включает оценку плотности ядра.
  • В CrimeStat оценка плотности ядра реализована с использованием пяти различных функций ядра — нормальной, равномерной, четвертой степени, отрицательной экспоненциальной и треугольной. Доступны как одноядерные, так и двухядерные процедуры оценки плотности. Оценка плотности ядра также используется при интерполяции процедуры «Удар головой», при оценке двумерной функции плотности «Путешествие к преступлению» и при оценке трехмерной байесовской оценки «Путешествие к преступлению».
  • В ELKI функции плотности ядра можно найти в пакете de.lmu.ifi.dbs.elki.math.statistics.kernelfunctions
  • В продуктах ESRI отображение плотности ядра управляется из набора инструментов Spatial Analyst и использует ядро ​​Quartic (двухвесное).
  • Королевское химическое общество создало в Excel надстройку для оценки плотности ядра на основе технического описания Комитета по аналитическим методам 4 .
  • В gnuplot оценка плотности ядра реализуется с помощью smooth kdensity вариант, файл данных может содержать вес и пропускную способность для каждой точки, или пропускная способность может быть установлена ​​автоматически [28] согласно «эмпирическому правилу Сильвермана» (см. выше).
  • В Haskell плотность ядра реализована в пакете статистики .
  • В IGOR Pro оценка плотности ядра реализована с помощью StatsKDE операция (добавлена ​​в Игорь Про 7.00). Пропускная способность может быть указана пользователем или оценена с помощью Сильвермана, Скотта или Боумана и Аззалини . Типы ядра: Епанечникова, Двухвесовое, Трехвесовое, Треугольное, Гауссово и Прямоугольное.
  • В Java пакет машинного обучения Weka предоставляет weka.estimators.KernelEstimator . , среди прочего,
  • В JavaScript пакет визуализации D3.js предлагает пакет KDE в своем пакете science.stats.
  • В JMP платформа Graph Builder использует оценку плотности ядра для создания контурных графиков и областей высокой плотности (HDR) для двумерных плотностей, а также графиков скрипки и HDR для одномерных плотностей. Ползунки позволяют пользователю изменять пропускную способность. Двумерные и одномерные оценки плотности ядра также предоставляются платформами Fit Y by X и Distribution соответственно.
  • В Julia оценка плотности ядра реализована в пакете KernelDensity.jl .
  • В KNIME можно генерировать и строить 1D- и 2D-распределения плотности ядра, используя узлы из вклада сообщества Vernalis , например, 1D-график плотности ядра и других. Базовая реализация написана на Java .
  • В MATLAB оценка плотности ядра реализуется через ksdensity функция (Панель инструментов статистики). Начиная с версии MATLAB 2018a, можно указать как полосу пропускания, так и сглаживание ядра, включая другие параметры, такие как указание диапазона плотности ядра. [29] Альтернативно, бесплатный пакет программного обеспечения MATLAB, реализующий метод автоматического выбора полосы пропускания. [6] доступен в Центральном файловом обмене MATLAB для
  • В Mathematica числовая оценка плотности ядра реализована функцией SmoothKernelDistribution[31] а символьная оценка реализуется с помощью функции KernelMixtureDistribution[32] оба из которых обеспечивают пропускную способность, управляемую данными.
  • В Minitab Королевское химическое общество создало макрос для оценки плотности ядра на основе технического задания 4 Комитета по аналитическим методам. [33]
  • В библиотеке NAG оценка плотности ядра реализована через g10ba подпрограмма (доступна как в Fortran [34] и С [35] версии библиотеки).
  • В Nuklei фокусируются методы плотности ядра C++ на данных из специальной евклидовой группы. .
  • В Octave оценка плотности ядра реализуется с помощью kernel_density вариант (пакет эконометрики).
  • В Origin график плотности ядра 2D можно построить из пользовательского интерфейса, а две функции, Ksdensity для 1D и Ks2density для 2D, можно использовать из его LabTalk , Python или C. кода
  • В Perl реализацию можно найти в модуле Статистика-KernelEstimation.
  • В PHP реализацию можно найти в библиотеке MathPHP.
  • В Python существует множество реализаций: Модуль pyqt_fit.kde в пакете PyQt-Fit , SciPy( scipy.stats.gaussian_kde), Государственные модели ( KDEUnivariate и KDEMultivariate) и scikit-learn ( KernelDensity) (см. сравнение [36] ). KDEpy поддерживает взвешенные данные, и его реализация БПФ работает на несколько порядков быстрее, чем другие реализации. Широко используемая библиотека pandas [1] предлагает поддержку построения графиков kde с помощью методаplot ( df.plot(kind='kde')[2] ). Пакет getdist для взвешенных и коррелированных выборок MCMC поддерживает оптимизированную полосу пропускания, коррекцию границ и методы более высокого порядка для 1D и 2D распределений. Один из новых пакетов для оценки плотности ядра — Seaborn ( import seaborn as sns , sns.kdeplot() ). [37] Также существует реализация KDE на графическом процессоре. [38]
  • В R это реализовано через density в базовом дистрибутиве и bw.nrd0 используется в пакете статистики, эта функция использует оптимизированную формулу из книги Сильвермана. bkde в библиотеке KernSmooth , ParetoDensityEstimation в библиотеке DataVisualizations (для оценки плотности распределения Парето), kde в библиотеке КС , dkden и dbckden в библиотеке evmix (последний для оценки плотности ядра с коррекцией границ для ограниченной поддержки), npudens в библиотеке np (числовые и категориальные данные ), sm.density в библиотеке см . Для реализации kde.R функция, не требующая установки каких-либо пакетов или библиотек, см kde.R. . Библиотека btb , посвященная городскому анализу, реализует оценку плотности ядра через kernel_smoothing.
  • В САС , proc kde может использоваться для оценки одномерной и двумерной плотности ядра.
  • В Apache Spark KernelDensity() сорт [39]
  • В Stata это реализовано через kdensity; [40] например histogram x, kdensity. В качестве альтернативы доступен бесплатный модуль Stata KDENS. [41] позволяя пользователю оценить функции плотности 1D или 2D.
  • В Swift это реализовано через SwiftStats.KernelDensityEstimation в библиотеке статистики с открытым исходным кодом SwiftStats .

См. также

[ редактировать ]

Дальнейшее чтение

[ редактировать ]
  • Хердле, Мюллер, Сперлих, Верватц, Непараметрические и полупараметрические методы , Springer-Verlag Berlin Heidelberg 2004, стр. 39–83.
  1. ^ Jump up to: а б Розенблатт, М. (1956). «Замечания о некоторых непараметрических оценках функции плотности» . Анналы математической статистики . 27 (3): 832–837. дои : 10.1214/aoms/1177728190 .
  2. ^ Jump up to: а б Парзен, Э. (1962). «Об оценивании функции плотности вероятности и режима» . Анналы математической статистики . 33 (3): 1065–1076. дои : 10.1214/aoms/1177704472 . JSTOR   2237880 .
  3. ^ Jump up to: а б Хасти, Тревор ; Тибширани, Роберт ; Фридман, Джером Х. (2001). Элементы статистического обучения: интеллектуальный анализ данных, логические выводы и прогнозирование: с 200 полноцветными иллюстрациями . Нью-Йорк: Спрингер. ISBN  0-387-95284-5 . OCLC   46809224 .
  4. ^ Епанечников, В.А. (1969). «Непараметрическая оценка многомерной плотности вероятности». Теория вероятностей и ее приложения . 14 : 153–158. дои : 10.1137/1114019 .
  5. ^ Ванд, член парламента; Джонс, MC (1995). Сглаживание ядра . Лондон: Чепмен и Холл/CRC. ISBN  978-0-412-55270-0 .
  6. ^ Jump up to: а б с д Ботев, Здравко (2007). Непараметрическая оценка плотности методом диффузионного смешивания (Технический отчет). Университет Квинсленда.
  7. ^ Скотт, Д. (1979). «Об оптимальных и основанных на данных гистограммах». Биометрика . 66 (3): 605–610. дои : 10.1093/biomet/66.3.605 .
  8. ^ Парк, Будапешт; Маррон, Дж. С. (1990). «Сравнение селекторов пропускной способности, управляемых данными». Журнал Американской статистической ассоциации . 85 (409): 66–72. CiteSeerX   10.1.1.154.7321 . дои : 10.1080/01621459.1990.10475307 . JSTOR   2289526 .
  9. ^ Парк, Будапешт; Турлах, бакалавр (1992). «Практическая работа нескольких селекторов полосы пропускания, управляемых данными (с обсуждением)» . Вычислительная статистика . 7 : 251–270.
  10. ^ Цао, Р.; Куэвас, А.; Мантейга, WG (1994). «Сравнительное исследование нескольких методов сглаживания при оценке плотности». Вычислительная статистика и анализ данных . 17 (2): 153–176. дои : 10.1016/0167-9473(92)00066-Z .
  11. ^ Джонс, MC; Маррон, Дж. С.; Шизер, С.Дж. (1996). «Краткий обзор выбора полосы пропускания для оценки плотности». Журнал Американской статистической ассоциации . 91 (433): 401–407. дои : 10.2307/2291420 . JSTOR   2291420 .
  12. ^ Шизер, SJ (1992). «Эффективность шести популярных методов выбора полосы пропускания на некоторых реальных наборах данных (с обсуждением)». Вычислительная статистика . 7 : 225–250, 271–281.
  13. ^ Агарвал, Н.; Алуру, НР (2010). «Стохастический подход к коллокации, основанный на данных, для количественной оценки неопределенности в MEMS» (PDF) . Международный журнал численных методов в технике . 83 (5): 575–597. Бибкод : 2010IJNME..83..575A . дои : 10.1002/nme.2844 . S2CID   84834908 .
  14. ^ Сюй, Х.; Ян, З.; Сюй, С. (2015). «Оценка распределения вероятности скорости ветра с помощью метода плотности ядра на основе диффузии». Исследование электроэнергетических систем . 121 : 28–37. Бибкод : 2015EPSR..121...28X . дои : 10.1016/j.epsr.2014.11.029 .
  15. ^ Ботев З.И.; Гротовски, Дж. Ф.; Крозе, Д.П. (2010). «Оценка плотности ядра посредством диффузии». Анналы статистики . 38 (5): 2916–2957. arXiv : 1011.2602 . дои : 10.1214/10-AOS799 . S2CID   41350591 .
  16. ^ Jump up to: а б Шизер, С.Дж.; Джонс, MC (1991). «Надежный метод выбора полосы пропускания на основе данных для оценки плотности ядра». Журнал Королевского статистического общества, серия B. 53 (3): 683–690. дои : 10.1111/j.2517-6161.1991.tb01857.x . JSTOR   2345597 .
  17. ^ Рудемо, М. (1982). «Эмпирический выбор гистограмм и средств оценки плотности ядра». Скандинавский статистический журнал . 9 (2): 65–78. JSTOR   4615859 .
  18. ^ Боуман, AW (1984). «Альтернативный метод перекрестной проверки для сглаживания оценок плотности». Биометрика . 71 (2): 353–360. дои : 10.1093/biomet/71.2.353 .
  19. ^ Холл, П.; Маррон, Дж. С.; Парк, Будапешт (1992). «Сглаженная перекрестная проверка» . Теория вероятностей и смежные области . 92 : 1–20. дои : 10.1007/BF01205233 . S2CID   121181481 .
  20. ^ Вахба, Г. (1975). «Оптимальные свойства сходимости методов переменных узлов, ядер и ортогональных рядов для оценки плотности» . Анналы статистики . 3 (1): 15–29. дои : 10.1214/aos/1176342997 .
  21. ^ Бух-Ларсен, TINE (2005). «Оценка плотности ядра для распределений с тяжелым хвостом с использованием преобразования Чамперноуна». Статистика . 39 (6): 503–518. CiteSeerX   10.1.1.457.1544 . дои : 10.1080/02331880500439782 . S2CID   219697435 .
  22. ^ Jump up to: а б Сильверман, BW (1986). Оценка плотности для статистики и анализа данных . Лондон: Чепмен и Холл/CRC. п. 45 . ISBN  978-0-412-24620-3 .
  23. ^ Чен, Йен-Чи; Дженовезе, Кристофер Р.; Вассерман, Ларри (2016). «Комплексный подход к кластеризации режимов» . Электронный статистический журнал . 10 (1): 210–241. arXiv : 1406.1780 . дои : 10.1214/15-ejs1102 . ISSN   1935-7524 .
  24. ^ Шазаль, Фредерик; Фази, Бриттани Тереза; Леччи, Фабрицио; Ринальдо, Алессандро; Вассерман, Ларри (2014). «Стохастическая конвергенция устойчивых ландшафтов и силуэтов» . Материалы тридцатого ежегодного симпозиума по вычислительной геометрии . Том. 6. Нью-Йорк, Нью-Йорк, США: ACM Press. стр. 474–483. дои : 10.1145/2582112.2582128 . ISBN  978-1-4503-2594-3 . S2CID   6029340 .
  25. ^ Фукунага, К.; Хостетлер, Л. (январь 1975 г.). «Оценка градиента функции плотности с применением в распознавании образов». Транзакции IEEE по теории информации . 21 (1): 32–40. дои : 10.1109/тит.1975.1055330 . ISSN   0018-9448 .
  26. ^ Ицзун Ченг (1995). «Сдвиг среднего, поиск режима и кластеризация». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 17 (8): 790–799. CiteSeerX   10.1.1.510.1222 . дои : 10.1109/34.400568 . ISSN   0162-8828 .
  27. ^ Команичиу, Д.; Меер, П. (май 2002 г.). «Сдвиг среднего: надежный подход к анализу пространства признаков». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 24 (5): 603–619. дои : 10.1109/34.1000236 . ISSN   0162-8828 . S2CID   691081 .
  28. ^ Джанерт, Филипп К. (2009). Gnuplot в действии: понимание данных с помощью графиков . Коннектикут, США: Публикации Мэннинга. ISBN  978-1-933988-39-9 . См. раздел 13.2.2, озаглавленный «Оценки плотности ядра» .
  29. ^ «Оценка функции сглаживания ядра для одномерных и двумерных данных - MATLAB ksdensity» . www.mathworks.com . Проверено 5 ноября 2020 г.
  30. ^ Горова, И.; Колачек Ю.; Зелинка, Дж. (2012). Ядерное сглаживание в MATLAB: Теория и практика ядерного сглаживания . Сингапур: Мировое научное издательство. ISBN  978-981-4405-48-5 .
  31. ^ «SmoothKernelDistribution — документация по языку Wolfram» . ссылка.wolfram.com . Проверено 5 ноября 2020 г.
  32. ^ «KernelMixtureDistribution — Документация по языку Wolfram» . ссылка.wolfram.com . Проверено 5 ноября 2020 г.
  33. ^ «Программное обеспечение для расчета плотности ядра» . www.rsc.org . Проверено 5 ноября 2020 г.
  34. ^ Группа числовых алгоритмов. «Обычный документ библиотеки NAG: nagf_smooth_kerndens_gauss (g10baf)» (PDF) . Руководство по библиотеке НАГ, Марк 23 . Проверено 16 февраля 2012 г.
  35. ^ Группа числовых алгоритмов. «Обычный документ библиотеки NAG: nag_kernel_density_estim (g10bac)» (PDF) . Руководство по библиотеке NAG, Марк 9 . Архивировано из оригинала (PDF) 24 ноября 2011 г. Проверено 16 февраля 2012 г.
  36. ^ Вандерплас, Джейк (1 декабря 2013 г.). «Оценка плотности ядра в Python» . Проверено 12 марта 2014 г.
  37. ^ «seaborn.kdeplot — документация seaborn 0.10.1» . seaborn.pydata.org . Проверено 12 мая 2020 г.
  38. ^ «Kde-gpu: мы реализовали лучшую плотность ядра и оценщик условной вероятности ядра, используя cuda через cupy. Это намного быстрее, чем версия процессора, но для этого требуется графический процессор с большим объемом памяти» .
  39. ^ «Базовая статистика — API на основе RDD — Документация Spark 3.0.1» . http://spark.apache.org . Проверено 5 ноября 2020 г.
  40. ^ «kdensity — Одномерная оценка плотности ядра» (PDF) . Стата 15 инструкция .
  41. ^ Янн, Бен (26 мая 2008 г.), «KDENS: модуль Stata для одномерной оценки плотности ядра» , Компоненты статистического программного обеспечения , Экономический факультет Бостонского колледжа , получено 15 октября 2022 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1d9ba57b5d05b11e0805c4d08e5b0914__1718261340
URL1:https://arc.ask3.ru/arc/aa/1d/14/1d9ba57b5d05b11e0805c4d08e5b0914.html
Заголовок, (Title) документа по адресу, URL1:
Kernel density estimation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)