Теория причинно-следственного решения
Причинная теория принятия решений (CDT) — это школа мысли в рамках теории принятия решений , которая утверждает, что, когда рациональный агент сталкивается с набором возможных действий, он должен выбрать действие, которое приводит к наилучшему ожидаемому результату . CDT контрастирует с теорией принятия доказательных решений (EDT), которая рекомендует действия, которые будут указывать на лучший результат, если кто-то получит «новости» о том, что они были предприняты. [1] Другими словами, EDT рекомендует «делать то, чему вы больше всего хотите научиться». [2] : 7
Неофициальное описание
[ редактировать ]Неформально теория причинного решения рекомендует агенту принять решение с наилучшими ожидаемыми причинными последствиями. Например: если употребление яблока сделает вас счастливым, а употребление апельсина — грустным, то разумнее будет съесть яблоко. Одной из сложностей является понятие ожидаемых причинных последствий. Представьте, что съев хорошее яблоко, вы будете счастливы, а съев плохое яблоко, вы расстроитесь, но вы не уверены, хорошее это яблоко или плохое. В этом случае вы не знаете причинных последствий употребления яблока. Вместо этого вы работаете, исходя из ожидаемых причинных эффектов, где они будут зависеть от трех вещей: (1) насколько вероятно, что яблоко, по вашему мнению, будет хорошим, и насколько вероятно, что оно будет плохим; (2) насколько счастливым вы получаете хорошее яблоко; и (3) как вам грустно есть плохое яблоко. Говоря неформально, теория причинных решений советует агенту принять решение с наилучшими ожидаемыми причинными последствиями.
Формальное описание
[ редактировать ]В статье 1981 года Аллан Гиббард и Уильям Харпер объяснили теорию причинно-следственных решений как максимизацию ожидаемой полезности. действия «рассчитано на основе вероятностей контрфактических событий »: [3]
где это желательность результата и – это контрфактическая вероятность того, что, если были сделаны, тогда выдержал бы.
Отличие от теории доказательного принятия решений
[ редактировать ]Дэвид Льюис доказал [4] что вероятность условного не всегда равна условной вероятности . [5] (см. также результат Льюиса о тривиальности ). Если бы это было так, теория причинных решений была бы эквивалентна теории доказательных решений, которая использует условные вероятности.
Гиббард и Харпер показали, что если мы примем две аксиомы (одна из которых связана со спорным принципом условно исключенного среднего [6] ), то независимость статистическая и достаточно, чтобы гарантировать, что . Однако бывают случаи, когда действия и условные обозначения не являются независимыми. Гиббард и Харпер приводят пример, в котором царь Давид хочет Вирсавию, но опасается, что ее вызов спровоцирует восстание.
Кроме того, Дэвид изучил работы по психологии и политологии, которые учат его следующему: у королей есть два типа личности: харизматичный и нехаризматический. Степень харизмы короля зависит от его генетической структуры и опыта раннего детства и не может быть изменена во взрослом возрасте. Итак, харизматические короли склонны действовать справедливо, а нехаризматические короли несправедливы. Успешные восстания против харизматических королей редки, тогда как успешные восстания против нехаризматических королей случаются часто. Однако несправедливые действия сами по себе не приводят к успешным восстаниям; Причина, по которой нехаризматические короли склонны к успешным восстаниям, заключается в том, что они ведут себя подло и неблагородно. Дэвид не знает, харизматичен ли он или нет; он знает, что несправедливо посылать за чужой женой. (стр. 164)
В этом случае теория доказательного решения рекомендует Дэвиду воздерживаться от Вирсавии, в то время как теория причинно-следственного решения, отмечая, что вопрос о том, является ли Дэвид харизматичным или нехаризматичным, не может быть изменен, рекомендует послать за ней.
Когда приходится выбирать между теорией причинного решения и теорией доказательного решения, философы обычно отдают предпочтение теории причинного решения. [7] Согласно опросу профессиональных философов, опубликованному в 2021 году, 27,1% философов выбрали EDT, а 29,9% из них выбрали CDT. [8]
Мысленные эксперименты
[ редактировать ]Различные теории принятия решений часто рассматриваются в рекомендациях к действию в различных мысленных экспериментах .
Парадокс Ньюкомба
[ редактировать ]В парадоксе Ньюкомба есть предсказатель, игрок и две коробки, обозначенные А и В. Предсказатель способен надежно предсказать выбор игрока, скажем, с точностью 99%. Игроку предоставляется выбор: взять только ящик B или взять оба ящика A и B. Игрок знает следующее: [9]
- Коробка А прозрачна и всегда содержит видимую 1000 долларов.
- Поле B непрозрачно, и его содержимое уже задано предиктором:
- Если предсказатель предсказал, что игрок возьмет обе коробки A и B, то коробка B ничего не содержит.
- Если предсказатель предсказал, что игрок возьмет только коробку B, то в коробке B находится 1 000 000 долларов.
Делая выбор, игрок не знает, что предсказал предсказатель или что содержит ящик B. Должен ли игрок взять обе коробки или только коробку B?
Теория причинного решения рекомендует в этом сценарии брать оба ящика, поскольку в момент, когда игрок должен принять решение, предсказатель уже сделал предсказание (следовательно, действие игрока не повлияет на результат).
И наоборот, теория доказательного принятия решений (EDT) рекомендовала бы, чтобы игрок взял только ящик B, поскольку взятие только ящика B является убедительным доказательством того, что предсказатель ожидал, что игрок возьмет только ящик B, и поэтому весьма вероятно, что ящик B содержит 1 000 000 долларов. . И наоборот, решение взять обе коробки является убедительным доказательством того, что предсказатель знал, что игрок возьмет обе коробки; поэтому мы должны ожидать, что ящик B ничего не содержит. [10] : 22
Критика
[ редактировать ]Неясность
[ редактировать ]Теория причинно-следственной теории принятия решений (CDT) сама по себе не определяет, какой алгоритм использовать для расчета контрфактических вероятностей. [6] Одним из предложений является метод «изображения», предложенный Льюисом: [11] Чтобы оценить , переместите вероятностную массу из каждого возможного мира в самый близкий мир в котором держится, предполагая возможно. Однако эта процедура требует, чтобы мы знали, во что бы мы поверили, если бы были уверены в ; это само по себе условие, которому мы могли бы присвоить вероятность меньше 1, что приведет к регрессу. [6]
Контрпримеры
[ редактировать ]Существует бесчисленное множество «контрпримеров», когда, как утверждается, прямое применение CDT не приводит к обоснованному «разумному» решению. Философ Энди Иган утверждает, что это происходит из-за фундаментального разрыва между интуитивным рациональным правилом «делай то, что ожидаешь, приведет к лучшим результатам» и алгоритмом CDT «делай то, что дает наилучший ожидаемый результат, сохраняя фиксированными наши первоначальные взгляды на вероятная причинная структура мира». С этой точки зрения, именно требование CDT «фиксировать безоговорочную уверенность агента в гипотезах зависимости» приводит к иррациональным решениям. [12]
Одним из первых предполагаемых контрпримеров является проблема Ньюкомба . [ нужна ссылка ] Поскольку ваш выбор одного или двух ящиков не может причинно повлиять на предположение Предсказателя, теория причинных решений рекомендует стратегию двух ящиков. [3] Однако в результате вы получите только 1000 долларов, а не 1 000 000 долларов. Философы расходятся во мнениях, является ли «один бокс» или «два бокса» «рациональной» стратегией. [13] Подобные опасения могут возникнуть даже в таких, казалось бы, простых проблемах, как дилемма заключенного . [14] особенно когда вы играете против своего «близнеца», чей выбор сотрудничать или отступать сильно коррелирует, но не обусловлен вашим собственным выбором. [15]
В сценарии «Смерть в Дамаске» антропоморфная «Смерть» предсказывает, где вы будете завтра, и идет ждать вас там. Как и в задаче Ньюкомба, мы постулируем, что Смерть является надежным предсказателем. Агент CDT не сможет обработать корреляцию и, как следствие, может принять иррациональные решения: [12] [16] [17]
Недавно было предложено несколько вариантов «Смерти в Дамаске», в которых следование рекомендациям CDT добровольно теряет деньги или, соответственно, отказывается от гарантированного вознаграждения. [18] [19] [20] Одним из примеров является состязательное предложение: [19] «Предлагаются две коробки. Покупатель может купить одну коробку или ни одну из них, но не обе. Каждая из двух коробок стоит 1 доллар. Вчера продавец положил по 3 доллара в каждую коробку, которую, по ее прогнозам, покупатель не приобретет. и покупатель верит, что прогноз продавца верен с вероятностью 0,75». Принимая точку зрения покупателя, CDT приходит к выводу, что по крайней мере в одной коробке содержится 3 доллара. Следовательно, средняя коробка содержит как минимум 1,50 доллара причинно-следственной ожидаемой ценности, что превышает стоимость. Следовательно, CDT требует покупки одной из двух коробок. Однако это выгодно продавцу.
Еще один недавний контрпример — «Кнопка психопата»: [12] [21]
Пол обсуждает, стоит ли нажимать кнопку «убить всех психопатов». По его мнению, было бы намного лучше жить в мире без психопатов. К сожалению, Пол вполне уверен, что на такую кнопку нажмет только психопат. Пол очень сильно предпочитает жить в мире психопатов смерти. Должен ли Пол нажать кнопку?
По словам Игана, «почти все» согласны с тем, что Полу не следует нажимать кнопку, однако CDT поддерживает ее нажатие. [12]
Философ Джим Джойс, возможно, самый выдающийся современный защитник CDT, [22] утверждает, что CDT, естественно, способен принимать во внимание любую «информацию о том, что человек склонен или может сделать, в качестве доказательства». [23] [24]
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ Ахмед, Ариф (2021). Теория доказательного принятия решений . Издательство Кембриджского университета. п. 7. ISBN 9781108607865 .
- ^ Ахмед, Ариф (2021). Теория доказательного принятия решений . Издательство Кембриджского университета. ISBN 9781108607865 .
- ^ Jump up to: а б Гиббард, А.; Харпер, В.Л. (1981), «Контрфакты и два вида ожидаемой полезности», Если: условные обозначения, убеждения, решение, шанс и время : 153–190.
- ^ Льюис, Д. (1976), «Вероятности кондиционалов и условные вероятности», The Philosophical Review , 85 (3): 297–315, doi : 10.2307/2184045 , JSTOR 2184045
- ^ Фактически, Льюис доказал более сильный результат: «если класс вероятностных функций замкнут при условии кондиционализации, то не может быть никакой условной вероятности для этого класса, если класс не состоит полностью из тривиальных вероятностных функций», где тривиальная функция вероятности - это одна что «никогда не присваивает положительную вероятность более чем двум несовместимым альтернативам и, следовательно, является не более чем четырехзначным [...]».
- ^ Jump up to: а б с Шаффер, Майкл Джон (2009), «Теория принятия решений, интеллектуальное планирование и контрфактические действия» , Minds and Machines , 19 (1): 61–92, doi : 10.1007/s11023-008-9126-2 , S2CID 13484119
- ^ Вейрих, Пол, «Теория причинно-следственных решений», Стэнфордская энциклопедия философии (зимнее издание 2016 г.), Эдвард Н. Залта (ред.), URL = plato
Стэнфорд .edu /архивы /win2016 /записи /решение-причинное / - ^ Яден, Дэвид (2021). «Психология философии: связь философских взглядов с психологическими особенностями профессиональных философов». Философская психология . 34 (5): 721, 755. doi : 10.1080/09515089.2021.1915972 . S2CID 235441755 .
- ^ Вулперт, Д.Х.; Бенфорд, Г. (июнь 2013 г.). «Урок парадокса Ньюкомба». Синтезируйте . 190 (9): 1637–1646. дои : 10.1007/s11229-011-9899-3 . JSTOR 41931515 . S2CID 113227 .
- ^ Ахмед, Ариф (2021). Теория доказательного принятия решений . Издательство Кембриджского университета. ISBN 9781108607865 .
- ^ Льюис, Д. (1981), «Теория причинно-следственных решений» (PDF) , Австралазийский философский журнал , 59 (1): 5–30, doi : 10.1080/00048408112340011 , получено 29 мая 2009 г.
- ^ Jump up to: а б с д Иган, А. (2007), «Некоторые контрпримеры теории причинно-следственных решений» (PDF) , The Philosophical Review , 116 (1): 93–114, CiteSeerX 10.1.1.642.5936 , doi : 10.1215/00318108-2006-023 , заархивировано из оригинала (PDF) 11 марта 2017 г. , получено 27 июля 2017 г.
- ^ Беллос, Алекс (28 ноября 2016 г.). «Проблема Ньюкомба разделяет философов. На чьей стороне вы?» . Хранитель . Проверено 27 июля 2017 г.
- ^ Льюис, Д. (1979), «Дилемма заключенных - проблема Ньюкомба», Philosophy & Public Relations , 8 (3): 235–240, JSTOR 2265034
- ^ Ховард, СП (май 1988 г.). «Сотрудничество в дилемме узника». Теория и решение . 24 (3): 203–213. дои : 10.1007/BF00148954 . S2CID 121119727 .
- ^ Мичем, Кристофер Дж.Г. «Привязка и ее последствия». Философские исследования 149.1 (2010): 49-71.
- ^ Харпер, Уильям (январь 1984 г.). «Теория ратифицируемости и причинного решения: комментарии к Иллсу и Зайденфельду». PSA: Материалы проводимого раз в два года собрания Ассоциации философии науки . 1984 (2): 213–228. doi : 10.1086/psaprocbienmeetp.1984.2.192506 . S2CID 123368403 .
- ^ Спенсер, Дж. (2020), «Аргумент против теории причинно-следственных решений» (PDF) , Анализ , 81 : 52–61, doi : 10.1093/analys/anaa037 , получено 23 апреля 2021 г.
- ^ Jump up to: а б Остерхельд, К.; Конитцер, В. (2021), «Извлечение денег из теоретиков причинно-следственных решений», The Philosophical Quarterly , 71 (4), doi : 10.1093/pq/pqaa086
- ^ Джойс, Джеймс М., Еще одно опровержение теории причинно-следственных решений? (PDF) (слайды презентации) , получено 23 апреля 2021 г.
- ^ Гривз, Хилари. «Эпистемическая теория принятия решений». Разум 122.488 (2013): 915-952.
- ^ Веджвуд, Ральф. «Решение Гэндальфа проблемы Ньюкомба». Синтез (2013): 1-33.
- ^ Вейрих, Пол, «Теория причинно-следственных решений», Стэнфордская энциклопедия философии (зимнее издание 2016 г.), Эдвард Н. Залта (ред.), URL = plato
Стэнфорд .edu /архивы /win2016 /записи /решение-причинное / - ^ Джойс, Джеймс М. «Сожаление и нестабильность в теории причинно-следственных решений». Синтез 187.1 (2012): 123-145.