Jump to content

Сглаживающий сплайн

Сглаживающие сплайны представляют собой оценки функций, , полученное из набора зашумленных наблюдений цели , чтобы сбалансировать согласия меру к с производной мерой гладкости . Они обеспечивают средство для сглаживания шумов. данные. Самый знакомый пример — кубический сглаживающий сплайн, но существует множество других возможностей, в том числе и для случая, когда является векторной величиной.

Определение кубического сплайна

[ редактировать ]

Позволять быть набором наблюдений, моделируемых соотношением где являются независимыми случайными величинами с нулевым средним значением. Оценка кубического сглаживающего сплайна функции определяется как единственный минимизатор в пространстве Соболева на компактном интервале [1] [2]

Примечания:

  • — параметр сглаживания, контролирующий компромисс между точностью данных и грубостью оценки функции. Это часто оценивается с помощью обобщенной перекрестной проверки, [3] или по ограниченной предельной вероятности (REML) [ нужна ссылка ] который использует связь между сплайновым сглаживанием и байесовской оценкой (штраф за сглаживание можно рассматривать как вызванный априорным значением ). [4]
  • Интеграл часто вычисляется по всей действительной линии, хотя также возможно ограничить диапазон до диапазона .
  • Как (без сглаживания) сглаживающий сплайн сходится к интерполяционному сплайну .
  • Как (бесконечное сглаживание), штраф за шероховатость становится первостепенным, и оценка сходится к линейной оценке методом наименьших квадратов .
  • Штраф за шероховатость, основанный на второй производной, является наиболее распространенным в современной статистической литературе, хотя этот метод можно легко адаптировать к штрафам, основанным на других производных.
  • В ранней литературе с равноотстоящими друг от друга упорядоченными , в качестве штрафа использовались разности второго или третьего порядка, а не производные. [5]
  • Цель сглаживания штрафной суммы квадратов можно заменить штрафной целью правдоподобия , в которой сумма квадратов заменяется другой мерой точности данных, основанной на логарифмическом правдоподобии. [1] Член суммы квадратов соответствует штрафному правдоподобию с гауссовским предположением о .

Вывод кубического сглаживающего сплайна

[ редактировать ]

Полезно подумать о настройке сглаживающего сплайна в два этапа:

  1. Сначала выведите значения .
  2. Из этих значений выведите для всех х .

Теперь сначала обработайте второй шаг.

Учитывая вектор из подогнанных значений часть суммы квадратов сплайнового критерия фиксируется. Остаётся только минимизировать , а минимайзер представляет собой натуральный кубический сплайн , интерполирующий точки . Этот интерполирующий сплайн является линейным оператором и может быть записан в виде

где представляют собой набор сплайновых базисных функций. В результате штраф за шероховатость имеет вид

элементы A где . Базисные функции и, следовательно, матрица A зависят от конфигурации переменных-предикторов. , но не по ответам или .

A матрица размера n × n , заданная формулой .

Δ — это (n-2) × n матрица вторых разностей с элементами:

, ,

W представляет собой (n-2) × (n-2) симметричную трехдиагональную матрицу с элементами:

, и , расстояния между последовательными узлами (или значения x).

Теперь вернемся к первому шагу. Штрафную сумму квадратов можно записать как

где .

Минимизация более путем дифференцирования против . Это приводит к: [6] и

Подход Де Бура

[ редактировать ]

Подход Де Бура использует ту же идею: найти баланс между гладкой кривой и близостью к заданным данным. [7]

где представляет собой параметр, называемый гладким фактором и принадлежащий интервалу , и – величины, контролирующие степень сглаживания (они представляют собой вес каждой точки ). На практике, поскольку кубические сплайны , чаще всего используются обычно . Решение для был предложен Кристианом Рейншем в 1967 году. [8] Для , когда подходы , сходится к «естественному» сплайн-интерполянту к заданным данным. [7] Как подходы , сходится к прямой (самая гладкая кривая). Поскольку найдено подходящее значение это задача проб и ошибок, избыточная константа введено для удобства. [8] используется для численного определения значения так что функция соответствует следующему условию:

Алгоритм, описанный де Буром, начинается с и увеличивает пока условие не будет выполнено. [7] Если представляет собой оценку стандартного отклонения для , константа рекомендуется выбирать в интервале . Имея означает, что решением является «естественный» сплайн-интерполянт. [8] Увеличение означает, что мы получим более гладкую кривую, отойдя дальше от заданных данных.

Многомерные сплайны

[ редактировать ]

Существует два основных класса методов обобщения сглаживания по скаляру. к сглаживанию по вектору . Первый подход просто обобщает штраф за сглаживание сплайнов на многомерные условия. Например, если попытаться оценить мы могли бы использовать штраф за сплайн тонкой пластины и найти минимизация

Подход с использованием тонких пластинчатых сплайнов можно обобщить для сглаживания по отношению к более чем двум измерениям и другим порядкам дифференцирования штрафа. [1] По мере увеличения размерности возникают некоторые ограничения на дифференциал наименьшего порядка, который можно использовать: [1] но на самом деле это оригинальная статья Дюшона, [9] дает немного более сложные штрафы, позволяющие обойти это ограничение.

Сплайны тонких пластин изотропны, а это означает, что если мы повернём системе координат оценка не изменится, но мы также предполагаем, что один и тот же уровень сглаживания подходит во всех направлениях. Это часто считается разумным при сглаживании относительно пространственного положения, но во многих других случаях изотропия не является подходящим предположением и может привести к чувствительности к явно произвольному выбору единиц измерения. Например, при сглаживании по расстоянию и времени изотропный сглаживатель даст разные результаты, если расстояние измеряется в метрах, а время в секундах, и то, что произойдет, если мы изменим единицы измерения на сантиметры и часы.

Второй класс обобщений многомерного сглаживания имеет дело непосредственно с проблемой масштабной инвариантности, используя конструкции сплайнов тензорного произведения. [10] [11] [12] Такие сплайны имеют штрафы за сглаживание при наличии нескольких параметров сглаживания, и это цена, которую приходится платить, не предполагая, что одинаковая степень сглаживания подходит во всех направлениях.

[ редактировать ]

Сглаживающие сплайны связаны, но отличаются от:

Исходный код

[ редактировать ]

Исходный код сглаживания сплайнов можно найти в примерах из Карла де Бура книги «Практическое руководство по сплайнам» . Примеры приведены на Фортран языке программирования . Обновленные источники доступны также на официальном сайте Карла де Бура [1] .

  1. ^ Jump up to: а б с д Грин, ПиДжей; Сильверман, BW (1994). Непараметрическая регрессия и обобщенные линейные модели: подход к штрафу за шероховатость . Чепмен и Холл.
  2. ^ Хасти, Ти Джей; Тибширани, Р.Дж. (1990). Обобщенные аддитивные модели . Чепмен и Холл. ISBN  978-0-412-34390-2 .
  3. ^ Крэйвен, П.; Вахба, Г. (1979). «Сглаживание зашумленных данных с помощью сплайн-функций». Нумерическая математика . 31 (4): 377–403. дои : 10.1007/bf01404567 .
  4. ^ Кимельдорф, Г.С.; Вахба, Г. (1970). «Соответствие между байесовской оценкой случайных процессов и сглаживанием сплайнами» . Анналы математической статистики . 41 (2): 495–502. дои : 10.1214/aoms/1177697089 .
  5. ^ Уиттакер, ET (1922). «О новой методике выпуска». Труды Эдинбургского математического общества . 41 : 63–75.
  6. ^ Родригес, Герман (весна 2001 г.). «Сглаживание и непараметрическая регрессия» (PDF) . 2.3.1. Расчет. п. 12 . Проверено 28 апреля 2024 г. {{cite web}}: CS1 maint: местоположение ( ссылка )
  7. ^ Jump up to: а б с Де Бур, К. (2001). Практическое руководство по сплайнам (пересмотренное издание) . Спрингер. стр. 207–214. ISBN  978-0-387-90356-9 .
  8. ^ Jump up to: а б с Рейнш, Кристиан Х (1967). «Сглаживание сплайн-функциями». Численная математика . 10 (3): 177–183. дои : 10.1007/BF02162161 .
  9. ^ Ж. Дюшон, 1976, Сплайны, минимизирующие полунормы, инвариантные к вращению, в пространствах Соболева. стр. 85–100, В: Конструктивная теория функций нескольких переменных, Oberwolfach 1976, В. Шемпп и К. Целлер , ред., Конспекты лекций по математике, Vol. 571, Шпрингер, Берлин, 1977 г.
  10. ^ Вахба, Грейс. Сплайновые модели для данных наблюдений . СИАМ.
  11. ^ Гу, Чонг (2013). Сглаживание сплайновых моделей ANOVA (2-е изд.) . Спрингер.
  12. ^ Вуд, СН (2017). Обобщенные аддитивные модели: введение в R (2-е изд.) . Чепмен и Холл/CRC. ISBN  978-1-58488-474-3 .
  13. ^ Эйлерс, PHC и Маркс Б. (1996). «Гибкое сглаживание с помощью B-сплайнов и штрафов». Статистическая наука . 11 (2): 89–121.
  14. ^ Руперт, Дэвид; Ванд, член парламента; Кэрролл, Р.Дж. (2003). Полупараметрическая регрессия . Издательство Кембриджского университета. ISBN  978-0-521-78050-6 .

Дальнейшее чтение

[ редактировать ]
  • Вахба, Г. (1990). Сплайновые модели для данных наблюдений . СИАМ, Филадельфия.
  • Грин П.Дж. и Сильверман Б.В. (1994). Непараметрическая регрессия и обобщенные линейные модели . ЦРК Пресс.
  • Де Бур, К. (2001). Практическое руководство по сплайнам (пересмотренное издание) . Спрингер.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a4a0553b3a4faf0d75609489c190eb8f__1715916480
URL1:https://arc.ask3.ru/arc/aa/a4/8f/a4a0553b3a4faf0d75609489c190eb8f.html
Заголовок, (Title) документа по адресу, URL1:
Smoothing spline - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)