~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ DBBA820B6F05C77E82F4F266A34AE013__1715477340 ✰
Заголовок документа оригинал.:
✰ Loss function - Wikipedia ✰
Заголовок документа перевод.:
✰ Функция потерь — Википедия, бесплатная энциклопедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Objective_function ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/db/13/dbba820b6f05c77e82f4f266a34ae013.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/db/13/dbba820b6f05c77e82f4f266a34ae013__translat.html ✰
Дата и время сохранения документа:
✰ 12.06.2024 02:19:06 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 12 May 2024, at 04:29 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Функция потерь — Википедия, бесплатная энциклопедия Jump to content

Функция потерь

Из Википедии, бесплатной энциклопедии
(Перенаправлено из целевой функции )

В математической оптимизации и теории принятия решений функция потерь или функция затрат (иногда также называемая функцией ошибок). [1] — это функция, которая отображает событие или значения одной или нескольких переменных в действительное число, интуитивно представляющее некоторую «стоимость», связанную с событием. Задача оптимизации направлена ​​на минимизацию функции потерь. Целевая функция — это либо функция потерь, либо ее противоположность (в определенных областях ее по-разному называют функцией вознаграждения , функцией прибыли , функцией полезности , функцией приспособленности и т. д.), и в этом случае она должна быть максимизирована. Функция потерь может включать члены нескольких уровней иерархии.

используется функция потерь В статистике обычно для оценки параметра , а рассматриваемое событие является некоторой функцией разницы между расчетными и истинными значениями для экземпляра данных. Эта концепция, старая еще со времен Лапласа , была вновь введена в статистику Абрахамом Вальдом в середине 20-го века. [2] в контексте экономики это Например, обычно экономические издержки или сожаления . В классификации — это наказание за неправильную классификацию примера. В актуарной науке он используется в контексте страхования для моделирования пособий, выплачиваемых сверх премий, особенно после работ Харальда Крамера в 1920-х годах. [3] При оптимальном управлении потеря — это штраф за неспособность достичь желаемого значения. В управлении финансовыми рисками эта функция сопоставляется с денежными потерями.

Сравнение общих функций потерь, используемых для регрессии

Примеры [ править ]

Сожаление [ править ]

Леонард Дж. Сэвидж утверждал, что при использовании небайесовских методов, таких как минимакс , функция потерь должна основываться на идее сожаления , т. е. потеря, связанная с решением, должна быть разницей между последствиями лучшего решения, которое могло быть принято. было бы принято, если бы были известны основные обстоятельства и решение, которое фактически было принято до того, как они стали известны.

Квадратичная функция потерь [ править ]

Использование квадратичной функции потерь является обычным явлением, например, при использовании наименьших квадратов методов . Часто она более математически понятна, чем другие функции потерь, из-за свойств дисперсий , а также из-за того, что она симметрична: ошибка выше целевого значения вызывает те же потери, что и та же величина ошибки ниже целевого значения. Если целью является t , то квадратичная функция потерь равна

для некоторой константы C ; значение константы не влияет на решение, и его можно игнорировать, установив его равным 1. Это также известно как квадрат потери ошибки ( SEL ). [1]

Многие распространенные статистические данные , включая t-тесты , модели регрессии , планирование экспериментов и многое другое, используют наименьших квадратов методы , применяемые с использованием теории линейной регрессии , которая основана на квадратичной функции потерь.

Квадратичная функция потерь также используется в линейно-квадратичных задачах оптимального управления . В этих задачах даже при отсутствии неопределенности может оказаться невозможным достичь желаемых значений всех целевых переменных. Часто потери выражаются в виде квадратичной формы отклонений интересующих переменных от их желаемых значений; этот подход является приемлемым, поскольку он приводит к линейным условиям первого порядка . В контексте стохастического управления используется математическое ожидание квадратичной формы. Квадратичные потери придают большее значение выбросам, чем истинным данным, из-за их квадратичного характера, поэтому такие альтернативы, как потери Хубера , Log-Coch и SMAE, используются, когда данные имеют много больших выбросов.

Эффект от использования различных функций потерь, когда данные имеют выбросы.

Функция потери 0-1 [ править ]

В статистике и теории принятия решений часто используемой функцией потерь является функция потерь 0–1.

используя обозначение скобок Айверсона , т.е. оно оценивается как 1, когда , и 0 в противном случае.

Построение функций потерь и целевых функций [ править ]

Во многих приложениях целевые функции, в том числе функции потерь как частный случай, определяются постановкой задачи. В других ситуациях предпочтение лица, принимающего решения, должно быть выявлено и представлено скалярной функцией (также называемой функцией полезности ) в форме, подходящей для оптимизации — проблема, которую Рагнар Фриш подчеркнул в своей лекции, получившей Нобелевскую премию. [4] Существующие методы построения целевых функций собраны в материалах двух специализированных конференций. [5] [6] В частности, Андраник Тангян показал, что наиболее полезные целевые функции — квадратичные и аддитивные — определяются несколькими точками безразличия. Он использовал это свойство в моделях для построения этих целевых функций на основе порядковых или кардинальных данных, полученных с помощью компьютерных интервью с лицами, принимающими решения. [7] [8] Среди прочего он построил целевые функции для оптимального распределения бюджетов 16 Вестфальских университетов. [9] и европейские субсидии на выравнивание уровня безработицы в 271 регионе Германии. [10]

убыток Ожидаемый

поскольку оно зависит от результата случайной величины X. В некоторых контекстах значение функции потерь само по себе является случайной величиной ,

Статистика [ править ]

И частотная , и байесовская статистическая теория предполагают принятие решения на основе ожидаемого значения функции потерь; однако эта величина определяется по-разному в рамках двух парадигм.

Ожидаемые потери по частоте [ править ]

Сначала мы определяем ожидаемые потери в частотном контексте. принятия ожидаемого значения относительно распределения вероятностей θ P Его получают путем наблюдаемых данных X . Это также называется функцией риска. [11] [12] [13] [14] решающего правила δ и параметра θ . решающее правило зависит от результата X. Здесь Функция риска определяется следующим образом:

Здесь θ — фиксированное, но, возможно, неизвестное состояние природы, X — вектор наблюдений, стохастически полученных из популяции , — математическое ожидание по всем значениям совокупности X , dP θ вероятностная мера в пространстве событий X (параметризованная θ вычисляется по всей опоре X. ) , а интеграл

Байесовский риск [ править ]

В байесовском подходе математическое ожидание рассчитывается с использованием априорного распределения π * параметра θ :

где m(x) известно как вероятность прогнозирования , при этом θ было «интегрировано», π * (θ | x) — апостериорное распределение, порядок интегрирования изменен. Затем следует выбрать действие * который минимизирует эти ожидаемые потери, называемые риском Байеса. [12] . В последнем уравнении подынтегральная функция внутри dx известна как апостериорный риск , и его минимизация относительно решения a также минимизирует общий байесовский риск. Это оптимальное решение , * известно как правило Байеса (правило решения) — оно минимизирует средние потери для всех возможных состояний природы θ, для всех возможных (взвешенных по вероятности) результатов данных. Одним из преимуществ байесовского подхода является то, что для получения равномерно оптимального действия нужно только выбрать оптимальное действие на основе фактических наблюдаемых данных, тогда как выбор фактического частотного оптимального правила принятия решения как функции всех возможных наблюдений является гораздо более сложной проблемой. . Не менее важно и то, что правило Байеса отражает рассмотрение результатов потерь при различных состояниях природы, θ.

Примеры в статистике [ править ]

выбор в неопределенности условиях Экономический

В экономике принятие решений в условиях неопределенности часто моделируется с использованием функции полезности фон Неймана-Моргенштерна неопределенной переменной, представляющей интерес, такой как богатство на конец периода. Поскольку значение этой переменной неопределенно, то же самое относится и к значению функции полезности; максимизируется ожидаемая ценность полезности.

Правила принятия решений [ править ]

Решающее правило делает выбор, используя критерий оптимальности. Некоторые часто используемые критерии:

  • Минимакс : выберите правило принятия решения с наименьшими наихудшими потерями, то есть минимизируйте наихудшие (максимально возможные) потери:
  • Инвариантность : выберите правило принятия решения, которое удовлетворяет требованию инвариантности.
  • Выберите правило принятия решения с наименьшими средними потерями (т.е. минимизируйте ожидаемое значение функции потерь):

Выбор функции потерь [ править ]

Надлежащая статистическая практика требует выбора средства оценки, соответствующего фактическому приемлемому отклонению, наблюдаемому в контексте конкретной прикладной задачи. Таким образом, при прикладном использовании функций потерь выбор статистического метода для моделирования прикладной проблемы зависит от знания потерь, которые будут понесены из-за неправильного решения в конкретных обстоятельствах проблемы. [15]

Типичный пример включает оценку « местоположения ». При типичных статистических предположениях среднее или среднее значение — это статистика для оценки местоположения, которая минимизирует ожидаемые потери, возникающие при использовании функции потерь с квадратичной ошибкой , а медиана — это оценка, которая минимизирует ожидаемые потери, возникающие при использовании функции потерь с абсолютной разностью. И все же другие оценки были бы оптимальны при других, менее распространенных обстоятельствах.

В экономике, когда агент нейтральен к риску , целевая функция просто выражается как ожидаемое значение денежной величины, такой как прибыль, доход или богатство на конец периода. Для агентов , не склонных к риску или любящих риск , потери измеряются как отрицательная функция полезности , а целевой функцией, подлежащей оптимизации, является ожидаемое значение полезности.

Возможны и другие меры затрат, например, смертность или заболеваемость в области общественного здравоохранения или техники безопасности .

Для большинства алгоритмов оптимизации желательно иметь глобально непрерывную и дифференцируемую функцию потерь .

Двумя наиболее часто используемыми функциями потерь являются квадрат потерь , и абсолютная потеря , . Однако абсолютные потери имеют тот недостаток, что они не дифференцируемы при . Квадрат потерь имеет тот недостаток, что в нем доминируют выбросы — при суммировании по набору 's (как в ), окончательная сумма, как правило, является результатом нескольких особенно больших значений a , а не выражением среднего значения a .

Выбор функции потерь не является произвольным. Она очень ограничительна, и иногда функция потерь может характеризоваться желательными свойствами. [16] К числу принципов выбора относятся, например, требование полноты класса симметричной статистики в случае иид- наблюдений, принцип полной информации и некоторые другие.

У. Эдвардс Деминг и Нассим Николас Талеб утверждают, что эмпирическая реальность, а не хорошие математические свойства, должна быть единственной основой для выбора функций потерь, а реальные потери часто математически неточны, не дифференцируемы, непрерывны, симметричны и т. д. Например, человек, который прибывает до закрытия ворот самолета, все равно может успеть на самолет, но человек, который прибывает после, не может, из-за непостоянства и асимметрии, из-за которых прибытие с небольшим опозданием обходится гораздо дороже, чем прибытие немного раньше. При дозировании лекарств цена слишком малого количества лекарства может заключаться в отсутствии эффективности, тогда как цена слишком большого количества может заключаться в переносимой токсичности, что является еще одним примером асимметрии. Движение транспорта, трубы, балки, экология, климат и т. д. могут до определенного момента выдерживать повышенную нагрузку или нагрузку с незначительными заметными изменениями, а затем подвергаться заклиниванию или катастрофически ломаться. Такие ситуации, утверждают Деминг и Талеб, часто встречаются в реальных задачах, возможно, даже чаще, чем классические случаи гладких, непрерывных, симметричных дифференциалов. [17]

См. также [ править ]

Ссылки [ править ]

  1. ^ Перейти обратно: а б Хасти, Тревор; Тибширани, Роберт ; Фридман, Джером Х. (2001). Элементы статистического обучения . Спрингер. п. 18. ISBN  0-387-95284-5 .
  2. ^ Уолд, А. (1950). Статистические функции принятия решений . Уайли.
  3. ^ Крамер, Х. (1930). К математической теории риска . Центральная трикерия.
  4. ^ Фриш, Рагнар (1969). «От утопической теории к практическим приложениям: случай эконометрики». Лекция о Нобелевской премии . Проверено 15 февраля 2021 г.
  5. ^ Тангиан, Андраник; Грубер, Йозеф (1997). Построение скалярнозначных целевых функций. Материалы третьей международной конференции по эконометрическим моделям принятия решений: построение скалярнозначных целевых функций, Университет Хагена, состоявшейся в Католической академии Шверте 5–8 сентября 1995 г. Конспект лекций по экономике и математическим системам. Том. 453. Берлин: Шпрингер. дои : 10.1007/978-3-642-48773-6 . ISBN  978-3-540-63061-6 .
  6. ^ Тангиан, Андраник; Грубер, Йозеф (2002). Построение и применение целевых функций. Материалы четвертой международной конференции по построению и применению эконометрических моделей принятия решений, Университет Хагена, состоявшейся в Хаус Нордхелле, 28–31 августа 2000 г. Конспект лекций по экономике и математическим системам. Том. 510. Берлин: Шпрингер. дои : 10.1007/978-3-642-56038-5 . ISBN  978-3-540-42669-1 .
  7. ^ Тангиан, Андраник (2002). «Построение квазивогнутой квадратичной целевой функции на основе интервью с лицом, принимающим решения». Европейский журнал операционных исследований . 141 (3): 608–640. дои : 10.1016/S0377-2217(01)00185-0 . S2CID   39623350 .
  8. ^ Тангиан, Андраник (2004). «Модель порядкового построения аддитивных целевых функций». Европейский журнал операционных исследований . 159 (2): 476–512. дои : 10.1016/S0377-2217(03)00413-2 . S2CID   31019036 .
  9. ^ Тангиан, Андраник (2004). «Перераспределение университетских бюджетов с учетом статус-кво». Европейский журнал операционных исследований . 157 (2): 409–428. дои : 10.1016/S0377-2217(03)00271-6 .
  10. ^ Тангиан, Андраник (2008). «Многокритериальная оптимизация региональной политики занятости: симуляционный анализ для Германии» . Обзор городского и регионального развития . 20 (2): 103–122. дои : 10.1111/j.1467-940X.2008.00144.x .
  11. ^ Никулин, М.С. (2001) [1994], «Риск статистической процедуры» , Энциклопедия Математики , EMS Press
  12. ^ Бергер, Джеймс О. (1985). Статистическая теория принятия решений и байесовский анализ (2-е изд.). Нью-Йорк: Springer-Verlag. Бибкод : 1985sdtb.book.....B . ISBN  978-0-387-96098-2 . МР   0804611 .
  13. ^ ДеГрут, Моррис (2004) [1970]. Оптимальные статистические решения . Библиотека классической литературы Уайли. ISBN  978-0-471-68029-1 . МР   2288194 .
  14. ^ Роберт, Кристиан П. (2007). Байесовский выбор . Тексты Springer в статистике (2-е изд.). Нью-Йорк: Спрингер. дои : 10.1007/0-387-71599-1 . ISBN  978-0-387-95231-4 . МР   1835885 .
  15. ^ Пфанзагль, Дж. (1994). Параметрическая статистическая теория . Берлин: Вальтер де Грюйтер. ISBN  978-3-11-013863-4 .
  16. ^ Подробная информация о математических принципах выбора функции потерь приведена в главе 2 книги. Клебанов Б.; Рачев, Светлозат Т.; Фабоцци, Фрэнк Дж. (2009). Робастные и неробастные модели в статистике . Нью-Йорк: Nova Scientific Publishers, Inc. (и ссылки там).
  17. ^ Деминг, В. Эдвардс (2000). Выход из кризиса . Массачусетский технологический институт Пресс. ISBN  9780262541152 .

Дальнейшее чтение [ править ]

  • Горовиц, Энн Р. (1987). «Функции потерь и государственная политика». Журнал макроэкономики . 9 (4): 489–504. дои : 10.1016/0164-0704(87)90016-4 .
  • Во, Роджер Н. (1976). «Асимметричные функции полезности политика и оптимальная политика в условиях неопределенности». Эконометрика . 44 (1): 53–66. дои : 10.2307/1911380 . JSTOR   1911380 .
Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: DBBA820B6F05C77E82F4F266A34AE013__1715477340
URL1:https://en.wikipedia.org/wiki/Objective_function
Заголовок, (Title) документа по адресу, URL1:
Loss function - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)