Тест Салли-Энн

Тест Салли-Энн — это психологический тест , первоначально задуманный Дэниелом Деннеттом и используемый в психологии развития способностей человека для измерения социальных когнитивных приписывать ложные убеждения другим. ^{[ 1 ]} На основе более раннего новаторского исследования Виммера и Пернера (1983): ^{[ 2 ]} тест Салли-Энн был назван так Саймоном Бароном-Коэном , Аланом М. Лесли и Утой Фрит (1985), которые разработали тест дальше; ^{[ 3 ]} в 1988 году Лесли и Фрит повторили эксперимент с актерами-людьми (а не с куклами) и получили аналогичные результаты. ^{[ 4 ]}

Описание теста

Чтобы разработать эффективный тест, Baron-Cohen et al. модифицировал парадигму кукольной игры Уиммера и Пернера (1983), в которой куклы представляют собой осязаемых персонажей истории, а не гипотетических персонажей чистого повествования.

В процессе тестирования после знакомства с куклами ребенку задается контрольный вопрос на запоминание их названий ( Вопрос на называние ). Затем разыгрывается короткая сценка; Салли берет шарик и прячет его в корзину. Затем она «выходит» из комнаты и идет на прогулку. Пока ее нет, Энн достает шарик из корзины Салли и кладет его в свою коробку. Затем снова представляют Салли и ребенку задают ключевой вопрос, вопрос убеждения : «Где Салли будет искать свой шарик?» ^{[ 3 ]}

Барона-Коэна, Лесли и Фрита В исследовании теории разума при аутизме 61 ребенок — 20 из которых был диагностирован аутизмом по установленным критериям, 14 — с синдромом Дауна и 27 из которых были определены как клинически здоровые — были протестированы с помощью «Салли " и "Анна". ^{[ 3 ]}

Результаты

Чтобы участник прошел этот тест, он должен правильно ответить на вопрос об убеждениях , указав, что Салли считает, что шарик находится в ее собственной корзине. Этот ответ соответствует точке зрения Салли, но не соответствует точке зрения самого участника. Если участник не может принять альтернативную точку зрения, он укажет, что у Салли есть основания полагать, как и участник, что шарик сдвинулся. Таким образом, прохождение теста рассматривается как проявление понимания участником того, что у Салли есть свои собственные убеждения, которые могут не коррелировать с реальностью; это основное требование теории разума . ^{[ 5 ]}

В деле Барона-Коэна и др. (1985) 23 из 27 клинически здоровых детей (85%) и 12 из 14 детей с синдромом Дауна (86%) правильно ответили на вопрос об убеждениях . Однако только четверо из 20 детей с аутизмом (20%) ответили правильно. В целом, дети в возрасте до четырех лет, как и большинство детей-аутистов (старшего возраста), ответили на вопрос об убеждениях «коробкой Анны», по-видимому, не подозревая, что Салли не знает, что ее шарик переместили. ^{[ 3 ]}

Критика

Хотя данные Барона-Коэна и др. предположительно указывают на отсутствие теории разума у аутичных детей, существуют и другие возможные факторы, влияющие на них. Например, аутичные люди могут выполнить когнитивно более простое задание на запоминание, но языковые проблемы как у аутичных детей, так и у глухих контрольных детей, как правило, искажают результаты. ^{[ 6 ]}

Раффман, Гарнэм и Райдаут (2001) дополнительно исследовали связь между тестом Салли-Энн и аутизмом с точки зрения взгляда в глаза как социальной коммуникативной функции. Они добавили третье возможное место для шарика: карман сыщика. Когда дети с аутизмом и дети с умеренными нарушениями обучаемости были протестированы в этом формате, они обнаружили, что обе группы одинаково хорошо ответили на вопрос об убеждениях; однако участники с умеренными нарушениями обучаемости достоверно смотрели на правильное расположение шарика, а участники с аутизмом - нет, даже если участник с аутизмом отвечал на вопрос правильно. ^{[ 7 ]} Эти результаты могут быть выражением социальных недостатков, связанных с аутизмом.

Тагер-Флюсберг (2007) утверждает, что, несмотря на эмпирические результаты, полученные при выполнении задачи Салли-Энн, среди ученых растет неуверенность в важности лежащей в основе гипотезы теории разума об аутизме. Во всех проведенных исследованиях некоторые дети с аутизмом выполняли задания, основанные на ложных убеждениях, такие как Салли-Энн. ^{[ 8 ]}

У других гоминидов

Отслеживание глаз шимпанзе, бонобо и орангутанов предполагает, что все трое предвидят ложные убеждения субъекта в костюме Кинг-Конга и проходят тест Салли-Энн. ^{[ 9 ]}^{[ 10 ]}

Искусственный интеллект

Исследователи искусственного интеллекта и вычислительной когнитивной науки уже давно пытаются с помощью вычислений смоделировать способность человека рассуждать о (ложных) убеждениях других в таких задачах, как тест Салли-Энн. Для воспроизведения этой способности в компьютерах было предпринято множество подходов, в том числе подходы с использованием нейронных сетей. ^{[ 11 ]} распознавание эпистемического плана, ^{[ 12 ]} и байесовская теория разума. ^{[ 13 ]} Эти подходы обычно моделируют агентов как рационально выбирающих действия на основе своих убеждений и желаний, что можно использовать либо для прогнозирования их будущих действий (как в тесте Салли-Энн), либо для вывода об их текущих убеждениях и желаниях. В ограниченных настройках эти модели способны воспроизводить человеческое поведение при выполнении задач, подобных тесту Салли-Энн, при условии, что задачи представлены в машиночитаемом формате .

22 марта 2023 года исследовательская группа Microsoft опубликовала документ, показывающий, что на основе LLM система искусственного интеллекта GPT-4 может пройти тест Салли-Энн, который авторы интерпретируют как «предполагающее, что GPT-4 имеет очень продвинутый уровень теории разума». ^{[ 14 ]} Однако общность этого вывода оспаривается несколькими другими статьями, которые указывают, что способность GPT-4 рассуждать о убеждениях других агентов остается ограниченной (точность 59% по тесту ToMi ). ^{[ 15 ]} и не устойчив к «состязательным» изменениям теста Салли-Энн, с которым люди гибко справляются. ^{[ 16 ]}^{[ 17 ]} Хотя некоторые авторы утверждают, что производительность GPT-4 при выполнении задач, подобных Салли-Энн, можно повысить до 100% за счет улучшенных стратегий подсказок, ^{[ 18 ]} этот подход, по-видимому, повышает точность только до 73% в более крупном наборе данных ToMi. ^{[ 16 ]} В смежной работе исследователи обнаружили, что LLM не обладают подобной человеческой интуицией в отношении целей, которых достигают другие агенты. ^{[ 19 ]} и что они не делают достоверных выводов о целях других агентов на основе наблюдаемых действий. ^{[ 20 ]} Таким образом, степень, в которой LLM, такие как GPT-4, могут осуществлять социальное мышление, остается активной областью исследований.

Ссылки

^ Виммер, Хайнц; Пернер, Йозеф (январь 1983 г.). «Убеждения об убеждениях: репрезентация и ограничивающая функция неправильных убеждений в понимании обмана детьми младшего возраста». Познание . 13 (1): 103–128. дои : 10.1016/0010-0277(83)90004-5 . ПМИД 6681741 . S2CID 17014009 .
^ Виммер и Пернер (1983). «Убеждения об убеждениях: репрезентация и сдерживающая функция неправильных убеждений в понимании обмана детьми младшего возраста. Познание, 13, 103-128» . {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
^ Jump up to: ^а ^б ^с ^д Барон-Коэн, Саймон; Лесли, Алан М.; Фрит, Юта (октябрь 1985 г.). «Есть ли у аутичного ребенка «теория разума»?». Познание . 21 (1): 37–46. дои : 10.1016/0010-0277(85)90022-8 . ПМИД 2934210 . S2CID 14955234 . PDF.
^ Лесли, Алан М.; Фрит, Юта (ноябрь 1988 г.). «Понимание детьми-аутистами того, что они видят, знают и верят». Британский журнал психологии развития . 6 (4): 315–324. дои : 10.1111/j.2044-835X.1988.tb01104.x .
^ Премак, Дэвид; Вудрафф, Гай (декабрь 1978 г.). «Есть ли у шимпанзе теория разума?» . Поведенческие и мозговые науки . 1 (4): 515–526. дои : 10.1017/S0140525X00076512 .
^ «Аутизм и теория разума: теория в переходном периоде» . www.jeramyt.org . Проверено 9 октября 2016 г.
^ Раффман, Тед; Гарнем, Венди; Райдаут, Пол (ноябрь 2001 г.). «Социальное понимание при аутизме: взгляд как мера основных идей». Журнал детской психологии и психиатрии . 42 (8): 1083–1094. дои : 10.1111/1469-7610.00807 . ПМИД 11806690 .
^ Тагер-Флюсберг, Хелен (декабрь 2007 г.). «Оценка гипотезы теории разума об аутизме». Современные направления психологической науки . 16 (6): 311–315. дои : 10.1111/j.1467-8721.2007.00527.x . S2CID 16474678 .
^ Крупенье, Кристофер; Кано, Фумихиро; Хирата, Сатоши; Позвони, Жозеп; Томаселло, Майкл (07 октября 2016 г.). «Обезьяны ожидают, что другие люди будут действовать в соответствии с ложными убеждениями» . Наука . 354 (6308): 110–114. Бибкод : 2016Sci...354..110K . doi : 10.1126/science.aaf8110 . hdl : 10161/13632 . ISSN 0036-8075 . ПМИД 27846501 .
^ Девлин, Ханна (06 октября 2016 г.). «Обезьяны могут угадывать, о чем думают другие, так же, как и люди, как показывают исследования» . Хранитель . ISSN 0261-3077 . Проверено 9 октября 2016 г.
^ Рабиновиц, Нил; Пербет, Фрэнк; Сонг, Фрэнсис; Чжан, Чиюань; Эслами, С.М. Али; Ботвиник, Мэтью (3 июля 2018 г.). «Машинная теория разума» . Материалы 35-й Международной конференции по машинному обучению . ПМЛР: 4218–4227.
^ Шво, Мааян; Классен, Торин К.; Сохраби, Ширин; Макилрайт, Шейла А. (13 мая 2020 г.). «Распознавание эпистемического плана» . Материалы 19-й Международной конференции по автономным агентам и мультиагентным системам . ААМАС '20. Ричленд, Южная Каролина: Международный фонд автономных агентов и мультиагентных систем: 1251–1259. ISBN 978-1-4503-7518-4 .
^ Бейкер, Крис Л.; Хара-Эттингер, Джулиан; Сакс, Ребекка; Тененбаум, Джошуа Б. (13 марта 2017 г.). «Рациональная количественная атрибуция убеждений, желаний и восприятий в ментализации человека» . Природа человеческого поведения . 1 (4): 1–10. дои : 10.1038/s41562-017-0064 . ISSN 2397-3374 . S2CID 3338320 .
^ Бубек, Себастьян; Чандрасекаран, Варун; Эльдан, Ронен; Герке, Джон; Хорвиц, Эрик; Камар, Эдже; Ли, Питер; Ли, Инь Тат; Ли, Юаньчжи; Лундберг, Скотт; Нори, Харша; Плита, Хамид; Рибейро, Марк Туллий; Чжан, И (2023). «Искры общего искусственного интеллекта: ранние эксперименты с GPT-4» arXiv : 2303.12712v5 [ cs.CL ].
^ Сап, Мартен; ЛеБрас, Ронан; Фрид, Дэниел; Чой, Еджин (2022). «Нейронная теория разума? О пределах социального интеллекта в больших LM». arXiv : 2210.13312 [ cs.CL ].
^ Jump up to: ^а ^б Шапира, Натали; Леви, Мош; Алави, Сейед Хосейн; Чжоу, Сюйхуэй; Чой, Еджин; Гольдберг, Йоав; Сап, Мартен; Шварц, Веред (2023). «Умный Ганс или нейронная теория разума? Стресс-тестирование социальных рассуждений в больших языковых моделях». arXiv : 2305.14763 [ cs.CL ].
^ Ульман, Томер (2023). «Большие языковые модели не справляются с тривиальными изменениями в задачах теории разума». arXiv : 2302.08399 [ cs.AI ].
^ Могаддам, Шима Рахими; Дорогая, Кристофер Дж. (2023). «Повышение производительности теории разума в больших языковых моделях с помощью подсказок». arXiv : 2304.11490 [ cs.AI ].
^ Руис, Лаура; Финдейс, Ардуин; Брэдли, Херби; Рахмани, Хосейн А.; Чхве, Кён Ван; Грефенштетт, Эдвард; Роктешель, Тим (29 июня 2023 г.). «Кодирует ли LLM выборочно цель достижения агента?» . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
^ Инь, Лэнс; Коллинз, Кэтрин М.; Вэй, Меган; Чжан, Седегао Э.; Чжи-Сюань, Тан; Веллер, Адриан; Тененбаум, Джошуа Б.; Вонг, Лайонел (2023). «Нейро-символическая машина обратного планирования (NIPE): моделирование вероятностных социальных выводов на основе лингвистических входных данных». arXiv : 2306.14325 [ cs.AI ].

[1] Виммер, Хайнц; Пернер, Йозеф (январь 1983 г.). «Убеждения об убеждениях: репрезентация и ограничивающая функция неправильных убеждений в понимании обмана детьми младшего возраста». Познание . 13 (1): 103–128. дои : 10.1016/0010-0277(83)90004-5 . ПМИД 6681741 . S2CID 17014009 .

[2] Виммер и Пернер (1983). «Убеждения об убеждениях: репрезентация и сдерживающая функция неправильных убеждений в понимании обмана детьми младшего возраста. Познание, 13, 103-128» . {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )

[baron-3] Jump up to: ^а ^б ^с ^д Барон-Коэн, Саймон; Лесли, Алан М.; Фрит, Юта (октябрь 1985 г.). «Есть ли у аутичного ребенка «теория разума»?». Познание . 21 (1): 37–46. дои : 10.1016/0010-0277(85)90022-8 . ПМИД 2934210 . S2CID 14955234 . PDF.

[4] Лесли, Алан М.; Фрит, Юта (ноябрь 1988 г.). «Понимание детьми-аутистами того, что они видят, знают и верят». Британский журнал психологии развития . 6 (4): 315–324. дои : 10.1111/j.2044-835X.1988.tb01104.x .

[5] Премак, Дэвид; Вудрафф, Гай (декабрь 1978 г.). «Есть ли у шимпанзе теория разума?» . Поведенческие и мозговые науки . 1 (4): 515–526. дои : 10.1017/S0140525X00076512 .

[6] «Аутизм и теория разума: теория в переходном периоде» . www.jeramyt.org . Проверено 9 октября 2016 г.

[7] Раффман, Тед; Гарнем, Венди; Райдаут, Пол (ноябрь 2001 г.). «Социальное понимание при аутизме: взгляд как мера основных идей». Журнал детской психологии и психиатрии . 42 (8): 1083–1094. дои : 10.1111/1469-7610.00807 . ПМИД 11806690 .

[8] Тагер-Флюсберг, Хелен (декабрь 2007 г.). «Оценка гипотезы теории разума об аутизме». Современные направления психологической науки . 16 (6): 311–315. дои : 10.1111/j.1467-8721.2007.00527.x . S2CID 16474678 .

[9] Крупенье, Кристофер; Кано, Фумихиро; Хирата, Сатоши; Позвони, Жозеп; Томаселло, Майкл (07 октября 2016 г.). «Обезьяны ожидают, что другие люди будут действовать в соответствии с ложными убеждениями» . Наука . 354 (6308): 110–114. Бибкод : 2016Sci...354..110K . doi : 10.1126/science.aaf8110 . hdl : 10161/13632 . ISSN 0036-8075 . ПМИД 27846501 .

[10] Девлин, Ханна (06 октября 2016 г.). «Обезьяны могут угадывать, о чем думают другие, так же, как и люди, как показывают исследования» . Хранитель . ISSN 0261-3077 . Проверено 9 октября 2016 г.

[11] Рабиновиц, Нил; Пербет, Фрэнк; Сонг, Фрэнсис; Чжан, Чиюань; Эслами, С.М. Али; Ботвиник, Мэтью (3 июля 2018 г.). «Машинная теория разума» . Материалы 35-й Международной конференции по машинному обучению . ПМЛР: 4218–4227.

[12] Шво, Мааян; Классен, Торин К.; Сохраби, Ширин; Макилрайт, Шейла А. (13 мая 2020 г.). «Распознавание эпистемического плана» . Материалы 19-й Международной конференции по автономным агентам и мультиагентным системам . ААМАС '20. Ричленд, Южная Каролина: Международный фонд автономных агентов и мультиагентных систем: 1251–1259. ISBN 978-1-4503-7518-4 .

[13] Бейкер, Крис Л.; Хара-Эттингер, Джулиан; Сакс, Ребекка; Тененбаум, Джошуа Б. (13 марта 2017 г.). «Рациональная количественная атрибуция убеждений, желаний и восприятий в ментализации человека» . Природа человеческого поведения . 1 (4): 1–10. дои : 10.1038/s41562-017-0064 . ISSN 2397-3374 . S2CID 3338320 .

[14] Бубек, Себастьян; Чандрасекаран, Варун; Эльдан, Ронен; Герке, Джон; Хорвиц, Эрик; Камар, Эдже; Ли, Питер; Ли, Инь Тат; Ли, Юаньчжи; Лундберг, Скотт; Нори, Харша; Плита, Хамид; Рибейро, Марк Туллий; Чжан, И (2023). «Искры общего искусственного интеллекта: ранние эксперименты с GPT-4» arXiv : 2303.12712v5 [ cs.CL ].

[15] Сап, Мартен; ЛеБрас, Ронан; Фрид, Дэниел; Чой, Еджин (2022). «Нейронная теория разума? О пределах социального интеллекта в больших LM». arXiv : 2210.13312 [ cs.CL ].

[:0-16] Jump up to: ^а ^б Шапира, Натали; Леви, Мош; Алави, Сейед Хосейн; Чжоу, Сюйхуэй; Чой, Еджин; Гольдберг, Йоав; Сап, Мартен; Шварц, Веред (2023). «Умный Ганс или нейронная теория разума? Стресс-тестирование социальных рассуждений в больших языковых моделях». arXiv : 2305.14763 [ cs.CL ].

[17] Ульман, Томер (2023). «Большие языковые модели не справляются с тривиальными изменениями в задачах теории разума». arXiv : 2302.08399 [ cs.AI ].

[18] Могаддам, Шима Рахими; Дорогая, Кристофер Дж. (2023). «Повышение производительности теории разума в больших языковых моделях с помощью подсказок». arXiv : 2304.11490 [ cs.AI ].

[19] Руис, Лаура; Финдейс, Ардуин; Брэдли, Херби; Рахмани, Хосейн А.; Чхве, Кён Ван; Грефенштетт, Эдвард; Роктешель, Тим (29 июня 2023 г.). «Кодирует ли LLM выборочно цель достижения агента?» . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )

[20] Инь, Лэнс; Коллинз, Кэтрин М.; Вэй, Меган; Чжан, Седегао Э.; Чжи-Сюань, Тан; Веллер, Адриан; Тененбаум, Джошуа Б.; Вонг, Лайонел (2023). «Нейро-символическая машина обратного планирования (NIPE): моделирование вероятностных социальных выводов на основе лингвистических входных данных». arXiv : 2306.14325 [ cs.AI ].

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]