Сглаживающий сплайн
Сглаживающие сплайны представляют собой оценки функций, , полученное из набора зашумленных наблюдений цели , чтобы сбалансировать согласия меру к с производной мерой гладкости . Они обеспечивают средство для сглаживания шумов. данные. Самый знакомый пример — кубический сглаживающий сплайн, но существует множество других возможностей, в том числе и для случая, когда является векторной величиной.
Определение кубического сплайна
[ редактировать ]Позволять быть набором наблюдений, моделируемых соотношением где являются независимыми случайными величинами с нулевым средним значением. Оценка кубического сглаживающего сплайна функции определяется как единственный минимизатор в пространстве Соболева на компактном интервале [1] [2]
Примечания:
- — параметр сглаживания, контролирующий компромисс между точностью данных и грубостью оценки функции. Это часто оценивается с помощью обобщенной перекрестной проверки, [3] или по ограниченной предельной вероятности (REML) [ нужна ссылка ] который использует связь между сплайновым сглаживанием и байесовской оценкой (штраф за сглаживание можно рассматривать как вызванный априорным значением ). [4]
- Интеграл часто вычисляется по всей действительной линии, хотя также возможно ограничить диапазон до диапазона .
- Как (без сглаживания) сглаживающий сплайн сходится к интерполяционному сплайну .
- Как (бесконечное сглаживание), штраф за шероховатость становится первостепенным, и оценка сходится к линейной оценке методом наименьших квадратов .
- Штраф за шероховатость, основанный на второй производной, является наиболее распространенным в современной статистической литературе, хотя этот метод можно легко адаптировать к штрафам, основанным на других производных.
- В ранней литературе с равноотстоящими друг от друга упорядоченными , в качестве штрафа использовались разности второго или третьего порядка, а не производные. [5]
- Цель сглаживания штрафной суммы квадратов можно заменить штрафной целью правдоподобия , в которой сумма квадратов заменяется другой мерой точности данных, основанной на логарифмическом правдоподобии. [1] Член суммы квадратов соответствует штрафному правдоподобию с гауссовским предположением о .
Вывод кубического сглаживающего сплайна
[ редактировать ]Полезно подумать о настройке сглаживающего сплайна в два этапа:
- Сначала выведите значения .
- Из этих значений выведите для всех х .
Теперь сначала обработайте второй шаг.
Учитывая вектор из подогнанных значений часть суммы квадратов сплайнового критерия фиксируется. Остаётся только минимизировать , а минимайзер представляет собой натуральный кубический сплайн , интерполирующий точки . Этот интерполирующий сплайн является линейным оператором и может быть записан в виде
где представляют собой набор сплайновых базисных функций. В результате штраф за шероховатость имеет вид
элементы A где . Базисные функции и, следовательно, матрица A зависят от конфигурации переменных-предикторов. , но не по ответам или .
A — матрица размера n × n , заданная формулой .
Δ — это (n-2) × n матрица вторых разностей с элементами:
, ,
W представляет собой (n-2) × (n-2) симметричную трехдиагональную матрицу с элементами:
, и , расстояния между последовательными узлами (или значения x).
Теперь вернемся к первому шагу. Штрафную сумму квадратов можно записать как
где .
Минимизация более путем дифференцирования против . Это приводит к: [6] и
Подход Де Бура
[ редактировать ]Подход Де Бура использует ту же идею: найти баланс между гладкой кривой и близостью к заданным данным. [7]
где представляет собой параметр, называемый гладким фактором и принадлежащий интервалу , и – величины, контролирующие степень сглаживания (они представляют собой вес каждой точки ). На практике, поскольку кубические сплайны , чаще всего используются обычно . Решение для был предложен Кристианом Рейншем в 1967 году. [8] Для , когда подходы , сходится к «естественному» сплайн-интерполянту к заданным данным. [7] Как подходы , сходится к прямой (самая гладкая кривая). Поскольку найдено подходящее значение это задача проб и ошибок, избыточная константа введено для удобства. [8] используется для численного определения значения так что функция соответствует следующему условию:
Алгоритм, описанный де Буром, начинается с и увеличивает пока условие не будет выполнено. [7] Если представляет собой оценку стандартного отклонения для , константа рекомендуется выбирать в интервале . Имея означает, что решением является «естественный» сплайн-интерполянт. [8] Увеличение означает, что мы получим более гладкую кривую, отойдя дальше от заданных данных.
Многомерные сплайны
[ редактировать ]Существует два основных класса методов обобщения сглаживания по скаляру. к сглаживанию по вектору . Первый подход просто обобщает штраф за сглаживание сплайнов на многомерные условия. Например, если попытаться оценить мы могли бы использовать штраф за сплайн тонкой пластины и найти минимизация
Подход с использованием тонких пластинчатых сплайнов можно обобщить для сглаживания по отношению к более чем двум измерениям и другим порядкам дифференцирования штрафа. [1] По мере увеличения размерности возникают некоторые ограничения на дифференциал наименьшего порядка, который можно использовать: [1] но на самом деле это оригинальная статья Дюшона, [9] дает немного более сложные штрафы, позволяющие обойти это ограничение.
Сплайны тонких пластин изотропны, а это означает, что если мы повернём системе координат оценка не изменится, но мы также предполагаем, что один и тот же уровень сглаживания подходит во всех направлениях. Это часто считается разумным при сглаживании относительно пространственного положения, но во многих других случаях изотропия не является подходящим предположением и может привести к чувствительности к явно произвольному выбору единиц измерения. Например, при сглаживании по расстоянию и времени изотропный сглаживатель даст разные результаты, если расстояние измеряется в метрах, а время в секундах, и то, что произойдет, если мы изменим единицы измерения на сантиметры и часы.
Второй класс обобщений многомерного сглаживания имеет дело непосредственно с проблемой масштабной инвариантности, используя конструкции сплайнов тензорного произведения. [10] [11] [12] Такие сплайны имеют штрафы за сглаживание при наличии нескольких параметров сглаживания, и это цена, которую приходится платить, не предполагая, что одинаковая степень сглаживания подходит во всех направлениях.
Связанные методы
[ редактировать ]Сглаживающие сплайны связаны, но отличаются от:
- Регрессионные сплайны . В этом методе данные аппроксимируются набором базисных функций сплайна с уменьшенным набором узлов, обычно по методу наименьших квадратов. Штраф за шероховатость не используется. (См. также сплайны многомерной адаптивной регрессии .)
- Штрафные сплайны . Это сочетает в себе уменьшенное количество узлов регрессионных сплайнов со штрафом за шероховатость за счет сглаживания сплайнов. [13] [14]
- Тонкие пластинчатые сплайны и метод эластичных карт для обучения многообразиям . Этот метод сочетает в себе штраф по методу наименьших квадратов за ошибку аппроксимации со штрафом за изгиб и растяжение аппроксимирующего многообразия и использует грубую дискретизацию задачи оптимизации.
Исходный код
[ редактировать ]Исходный код сглаживания сплайнов можно найти в примерах из Карла де Бура книги «Практическое руководство по сплайнам» . Примеры приведены на Фортран языке программирования . Обновленные источники доступны также на официальном сайте Карла де Бура [1] .
Ссылки
[ редактировать ]- ^ Jump up to: а б с д Грин, ПиДжей; Сильверман, BW (1994). Непараметрическая регрессия и обобщенные линейные модели: подход к штрафу за шероховатость . Чепмен и Холл.
- ^ Хасти, Ти Джей; Тибширани, Р.Дж. (1990). Обобщенные аддитивные модели . Чепмен и Холл. ISBN 978-0-412-34390-2 .
- ^ Крэйвен, П.; Вахба, Г. (1979). «Сглаживание зашумленных данных с помощью сплайн-функций». Нумерическая математика . 31 (4): 377–403. дои : 10.1007/bf01404567 .
- ^ Кимельдорф, Г.С.; Вахба, Г. (1970). «Соответствие между байесовской оценкой случайных процессов и сглаживанием сплайнами» . Анналы математической статистики . 41 (2): 495–502. дои : 10.1214/aoms/1177697089 .
- ^ Уиттакер, ET (1922). «О новой методике выпуска». Труды Эдинбургского математического общества . 41 : 63–75.
- ^ Родригес, Герман (весна 2001 г.). «Сглаживание и непараметрическая регрессия» (PDF) . 2.3.1. Расчет. п. 12 . Проверено 28 апреля 2024 г.
{{cite web}}
: CS1 maint: местоположение ( ссылка ) - ^ Jump up to: а б с Де Бур, К. (2001). Практическое руководство по сплайнам (пересмотренное издание) . Спрингер. стр. 207–214. ISBN 978-0-387-90356-9 .
- ^ Jump up to: а б с Рейнш, Кристиан Х (1967). «Сглаживание сплайн-функциями». Численная математика . 10 (3): 177–183. дои : 10.1007/BF02162161 .
- ^ Ж. Дюшон, 1976, Сплайны, минимизирующие полунормы, инвариантные к вращению, в пространствах Соболева. стр. 85–100, В: Конструктивная теория функций нескольких переменных, Oberwolfach 1976, В. Шемпп и К. Целлер , ред., Конспекты лекций по математике, Vol. 571, Шпрингер, Берлин, 1977 г.
- ^ Вахба, Грейс. Сплайновые модели для данных наблюдений . СИАМ.
- ^ Гу, Чонг (2013). Сглаживание сплайновых моделей ANOVA (2-е изд.) . Спрингер.
- ^ Вуд, СН (2017). Обобщенные аддитивные модели: введение в R (2-е изд.) . Чепмен и Холл/CRC. ISBN 978-1-58488-474-3 .
- ^ Эйлерс, PHC и Маркс Б. (1996). «Гибкое сглаживание с помощью B-сплайнов и штрафов». Статистическая наука . 11 (2): 89–121.
- ^ Руперт, Дэвид; Ванд, член парламента; Кэрролл, Р.Дж. (2003). Полупараметрическая регрессия . Издательство Кембриджского университета. ISBN 978-0-521-78050-6 .
Дальнейшее чтение
[ редактировать ]- Вахба, Г. (1990). Сплайновые модели для данных наблюдений . СИАМ, Филадельфия.
- Грин П.Дж. и Сильверман Б.В. (1994). Непараметрическая регрессия и обобщенные линейные модели . ЦРК Пресс.
- Де Бур, К. (2001). Практическое руководство по сплайнам (пересмотренное издание) . Спрингер.