Jump to content

Распознавание объектов (когнитивная наука)

Визуальное распознавание объектов означает способность идентифицировать объекты в поле зрения на основе визуального ввода. Одним из важных признаков визуального распознавания объектов является «инвариантность объекта» или способность идентифицировать объекты при изменениях в подробном контексте, в котором объекты рассматриваются, включая изменения в освещении, позе объекта и фоновом контексте. [1]

Основные этапы распознавания объектов

[ редактировать ]

Нейропсихологические данные подтверждают, что в процессе распознавания объектов выделяются четыре конкретных этапа. [2] [3] [4] Эти этапы таковы:

Этап 1. Обработка основных компонентов объекта, таких как цвет, глубина и форма.
Этап 2. Эти основные компоненты затем группируются на основе сходства, предоставляя информацию об отдельных границах визуальной формы. Впоследствии фигуры и фона . может иметь место сегрегация
3 этап. Визуальное представление сопоставляется со структурными описаниями в памяти.
Этап 4. К визуальному представлению применяются семантические атрибуты, придающие смысл и, следовательно, узнаваемость.

На этих этапах происходят более конкретные процессы для завершения различных компонентов обработки. Кроме того, другие существующие модели предлагают интегративные иерархии (сверху вниз и снизу вверх), а также параллельную обработку, в отличие от этой общей иерархии снизу вверх.

Иерархическая обработка распознавания

[ редактировать ]

Обработка визуального распознавания обычно рассматривается как восходящая иерархия, в которой информация обрабатывается последовательно с возрастающей сложностью. Во время этого процесса корковые процессоры более низкого уровня, такие как первичная зрительная кора , находятся в самом низу иерархии. Корковые процессоры более высокого уровня, такие как нижневисочная кора (ИТ), находятся наверху, где облегчается визуальное распознавание. [5] Широко признанной иерархической теорией «снизу вверх» является «Распутывающее описание» Джеймса ДиКарло. [6] при этом на каждом этапе иерархически организованного вентрального зрительного пути выполняются операции по постепенному преобразованию представлений объектов в легко извлекаемый формат. Напротив, все более популярной теорией обработки распознавания является теория нисходящей обработки. Одна модель, предложенная Моше Баром (2003), описывает «укороченный» метод, при котором ранние визуальные данные передаются и частично анализируются из ранней зрительной коры в префронтальную кору (ПФК). Возможные интерпретации грубого визуального ввода генерируются в ПФК, а затем отправляются в нижневисочную кору (ИТ), которая впоследствии активирует соответствующие представления объектов, которые затем включаются в более медленный восходящий процесс. Этот «ярлык» предназначен для минимизации количества представлений объектов, необходимых для сопоставления, тем самым облегчая распознавание объектов. [5] Исследования поражений подтвердили это предложение, обнаружив более медленное время ответа у людей с поражениями ПФК, что предполагает использование только восходящей обработки. [7]

Постоянство объектов и теории распознавания объектов

[ редактировать ]

Важным аспектом распознавания объектов является постоянство объекта: способность распознавать объект в различных условиях просмотра. Эти изменяющиеся условия включают ориентацию объекта, освещение и изменчивость объекта (размер, цвет и другие различия внутри категории). Чтобы зрительная система достигла постоянства объекта, она должна быть способна извлекать общность в описании объекта с разных точек зрения и в описаниях сетчатки.[9] Участники, выполнявшие задачи по категоризации и распознаванию во время прохождения функционального магнитного воздействия, обнаружили усиление кровотока, указывающее на активацию в определенных областях мозга. Задача категоризации заключалась в том, что участники помещали объекты из канонических или необычных представлений как внутренние или внешние объекты. Задача распознавания возникает путем предоставления участникам изображений, которые они просмотрели ранее. Половина этих изображений имела ту же ориентацию, что и ранее, а другая половина была представлена ​​с противоположной точки зрения. Области мозга, участвующие в умственном вращении, такие как вентральные и дорсальные зрительные пути и префронтальная кора, продемонстрировали наибольшее увеличение кровотока во время выполнения этих задач, демонстрируя, что они имеют решающее значение для способности рассматривать объекты под разными углами. [8] Было создано несколько теорий, чтобы дать представление о том, как можно достичь постоянства объекта с целью распознавания объектов, включая теории, инвариантные к точке обзора, теории, зависящие от точки зрения, и теории множественных представлений.

Теории, инвариантные к точке зрения

[ редактировать ]

Теории, инвариантные к точке зрения, предполагают, что распознавание объектов основано на структурной информации, например, об отдельных частях, что позволяет распознаванию происходить независимо от точки зрения объекта. Соответственно, распознавание возможно с любой точки зрения, поскольку отдельные части объекта можно повернуть, чтобы они соответствовали любому конкретному виду.[10] [ нужна ссылка ] Эта форма аналитического распознавания требует мало памяти, поскольку необходимо закодировать только структурные части, которые могут создавать многочисленные представления объектов посредством взаимосвязей этих частей и мысленного вращения. [ нужна ссылка ] Участникам исследования было представлено одно представление кодировки для каждого из 24 заранее выбранных объектов, а также пять изображений-заполнителей. Затем объекты были представлены в центральном поле зрения либо в той же ориентации, либо в ориентации, отличной от исходного изображения. Затем участников попросили назвать, были ли представлены одинаковые или разные виды этих объектов с ориентацией по глубине. [9] Та же процедура затем выполнялась при представлении изображений в левом или правом поле зрения. Прайминг, зависящий от точки зрения, наблюдался, когда тестовые изображения предъявлялись непосредственно правому полушарию, но не тогда, когда тестовые изображения предъявлялись непосредственно левому полушарию. Результаты подтверждают модель, согласно которой объекты хранятся способом, зависящим от точки зрения, поскольку результаты не зависели от того, можно ли восстановить тот же или другой набор частей из представлений с разной ориентацией. [9]

Представление 3-D модели

[ редактировать ]

Эта модель, предложенная Марром и Нисихарой ​​(1978), утверждает, что распознавание объекта достигается путем сопоставления представлений трехмерной модели, полученных из визуального объекта, с представлениями трехмерной модели, хранящимися в памяти в виде правил вертикальной формы. [ нужны разъяснения ] [10] С помощью компьютерных программ и алгоритмов И Юнфэн (2009) смог продемонстрировать способность человеческого мозга мысленно конструировать трехмерные изображения, используя только двумерные изображения, которые появляются на сетчатке. Их модель также демонстрирует высокую степень постоянства формы, сохраняющуюся между 2D-изображениями, что позволяет распознавать 3D-изображения. [10] Представления трехмерной модели объекта формируются путем сначала выявления вогнутостей объекта, которые разделяют стимул на отдельные части. Недавние исследования показывают, что область мозга, известная как каудальная внутритеменная область (CIP), отвечает за сохранение наклона и наклона плоской поверхности, которые позволяют распознавать вогнутость. [11] Розенбург и др. обезьянам имплантировали склеральную поисковую катушку для мониторинга положения глаз и одновременной регистрации активации отдельных нейронов внутри CIP. Во время эксперимента обезьяны сидели на расстоянии 30 см от ЖК-экрана, на котором отображались зрительные стимулы. Сигналы бинокулярного несоответствия отображались на экране путем отображения стимулов в виде зелено-красных анаглифов, а кривые наклона-наклона находились в диапазоне от 0 до 330. Одно испытание состояло из точки фиксации, а затем предъявления стимула в течение 1 секунды. Активацию нейронов затем регистрировали с помощью хирургически вставленных микроэлектродов. Эта одиночная активация нейронов для определенных вогнутостей объектов привела к открытию того, что каждая ось отдельной части объекта, содержащей вогнутости, находится в хранилищах памяти. [11] Идентификация главной оси объекта помогает в процессе нормализации посредством мысленного вращения, которое необходимо, поскольку в памяти хранится только каноническое описание объекта. Узнавание достигается, когда точка зрения наблюдаемого объекта мысленно поворачивается в соответствии с сохраненным каноническим описанием. [ нужна ссылка ]

Рисунок 1. Это изображение, созданное на основе теории распознавания компонентов Бидермана (1987), является примером того, как объекты могут быть разбиты на геоны.

Распознавание по компонентам

[ редактировать ]

Расширение модели Марра и Нисихары, теория распознавания по компонентам , предложенная Бидерманом (1987), предполагает, что визуальная информация, полученная от объекта, делится на простые геометрические компоненты, такие как блоки и цилиндры, также известные как « геоны ». (геометрические ионы), а затем сопоставляются с наиболее похожим представлением объекта, хранящимся в памяти, для обеспечения идентификации объекта (см. рисунок 1). [12]

Теории, зависящие от точки зрения

[ редактировать ]

Теории, зависящие от точки зрения, предполагают, что на распознавание объекта влияет точка обзора, с которой он рассматривается, подразумевая, что объекты, видимые с новых точек зрения, снижают точность и скорость идентификации объекта. [13] Эта теория распознавания основана на более целостной системе, а не на частях, предполагая, что объекты хранятся в памяти с разных точек зрения и углов. Эта форма распознавания требует много памяти, поскольку каждая точка зрения должна быть сохранена. Точность распознавания также зависит от того, насколько знакома наблюдаемая точка зрения на объект. [14]

Теория множественных представлений

[ редактировать ]

Эта теория предполагает, что распознавание объектов лежит в континууме точек зрения, где каждая точка зрения используется для разных типов распознавания. На одном полюсе этого континуума механизмы, зависящие от точки зрения, используются для различения внутри категории, тогда как на другом полюсе для категоризации объектов используются механизмы, инвариантные к точке зрения. [13]

Нейронные субстраты

[ редактировать ]
весь текст
Дорсальный поток показан зеленым цветом, а вентральный поток — фиолетовым.

Дорсальный и вентральный поток

[ редактировать ]

Визуальную обработку объектов в мозге можно разделить на два пути обработки: дорсальный поток (как/где), который простирается от зрительной коры до теменных долей , и вентральный поток (что), который простирается от зрительной коры до теменных долей. ( нижне-височная кора ИТ). Существование этих двух отдельных путей визуальной обработки было впервые предложено Унгерлейдером и Мишкиным (1982), которые на основании своих исследований поражений предположили, что дорсальный поток участвует в обработке визуальной пространственной информации, такой как локализация объекта (где), а вентральный поток участвует в обработке информации идентификации визуального объекта (что). [15] Со времени этого первоначального предложения было альтернативно предложено назвать дорсальный путь «путем «Как», поскольку обрабатываемая здесь зрительно-пространственная информация дает нам информацию о том, как взаимодействовать с объектами. [16] В целях распознавания объектов нейронный фокус находится на вентральном потоке .

Функциональная специализация вентрального потока

[ редактировать ]

Внутри вентрального потока при исследованиях функциональной визуализации наблюдались различные области предполагаемой функциональной специализации. Областями мозга, которые наиболее последовательно демонстрируют функциональную специализацию, являются веретенообразная область лица (FFA), которая демонстрирует повышенную активацию лиц по сравнению с объектами, парагиппокампальная область места (PPA) для сцен по сравнению с объектами, экстрастриарная область тела (EBA). для частей тела по сравнению с объектами, MT+/V5 для движущихся стимулов по сравнению со статическими стимулами и Латеральный затылочный комплекс (LOC) для различимых форм по сравнению с перемешанными стимулами. [17] (См. также: Нейронная обработка отдельных категорий объектов )

Структурная обработка: латеральный затылочный комплекс.

[ редактировать ]

Было обнаружено, что латеральный затылочный комплекс (LOC) особенно важен для распознавания объектов на структурном уровне восприятия. В событийно-связанном исследовании [fMRI-en], в котором изучалась адаптация нейронов, активируемых при визуальной обработке объектов, было обнаружено, что сходство формы объекта необходимо для последующей адаптации в LOC, но специфические особенности объекта, такие как края и контуры - нет. Это говорит о том, что активация в LOC представляет собой информацию о форме объекта более высокого уровня, а не простые функции объекта. [18] В соответствующем исследовании [fMRI-en] активация LOC, которая произошла независимо от визуальных сигналов представленного объекта, таких как движение, текстура или контрасты яркости, предполагает, что различные визуальные сигналы низкого уровня, используемые для определения объекта, сходятся в «предметных областях», чтобы помочь в процессе восприятия и распознавания. [19] Никакая из упомянутой информации о форме объекта более высокого уровня, по-видимому, не предоставляет какой-либо [семантической] информации об объекте, поскольку LOC показывает реакцию нейронов на различные формы, включая незнакомые, абстрактные объекты. [20]

Дальнейшие эксперименты показали, что LOC состоит из иерархической системы избирательности формы, что указывает на более высокую избирательную активацию в задних областях для фрагментов объектов, тогда как области [anterior-en] демонстрируют большую активацию для полных или частичных объектов. [21] Это согласуется с предыдущими исследованиями, которые предполагают иерархическое представление в вентральной височной коре, где первичная обработка функций происходит в задних областях, а интеграция этих функций в целый и значимый объект происходит в областях [anterior-en]. [22]

Семантическая обработка

[ редактировать ]

Семантические ассоциации позволяют быстрее распознавать объекты. Когда объект ранее был связан с каким-либо семантическим значением, люди более склонны правильно идентифицировать объект. Исследования показали, что семантические ассоциации позволяют гораздо быстрее распознавать объект, даже если объект рассматривается под разными углами. Когда объекты рассматриваются под все более и более отклоненными углами от традиционной плоскости зрения, объекты, которые имели выученные семантические ассоциации, имели более низкое время отклика по сравнению с объектами, которые не содержали никаких выученных семантических ассоциаций. [23] Таким образом, когда распознавание объектов становится все более трудным, семантические ассоциации позволяют распознавать его намного проще. Точно так же субъекта можно подготовить к распознаванию объекта, наблюдая за действием, которое просто связано с целевым объектом. Это показывает, что предметы обладают набором сенсорных, двигательных и смысловых ассоциаций, позволяющих человеку правильно распознавать предмет. [24] Это подтверждает утверждение о том, что мозг использует несколько частей при попытке точно идентифицировать объект.

Благодаря информации, полученной от [нейропсихологических] пациентов, была выявлена ​​диссоциация обработки распознавания между структурной и [семантической] обработкой, поскольку структурная, цветовая и ассоциативная информация могут избирательно нарушаться. В одном исследовании ПЭТ было обнаружено, что области, участвующие в ассоциативной семантической обработке, включают левую переднюю верхнюю/ среднюю височную извилину и левый височный полюс по сравнению со структурной и цветовой информацией, а также правый височный полюс по сравнению только с задачами по решению цвета. [25] Эти результаты показывают, что сохраненные перцептивные и семантические знания задействуют отдельные области коры при распознавании объектов, а также указывают на наличие полушарных различий в височных областях.

Исследования также предоставили данные, указывающие на то, что зрительная семантическая информация сходится в веретенообразных извилинах нижневисочных долей. В исследовании, в котором сравнивались семантические знания категорий и атрибутов, было обнаружено, что они играют разные роли в том, как они способствуют распознаванию. Для категориального сравнения латеральные области веретенообразной извилины активировались живыми объектами по сравнению с неживыми объектами, которые активировали медиальные области. При сравнении атрибутов было обнаружено, что правая веретенообразная извилина активировалась глобальной формой, по сравнению с локальными деталями, которые активировали левую веретенообразную извилину. Эти результаты позволяют предположить, что тип категории объекта определяет, какая область веретенообразной извилины активируется для обработки семантического распознавания, тогда как атрибуты объекта определяют активацию либо в левой, либо в правой веретенообразной извилине в зависимости от того, обрабатывается ли глобальная форма или локальные детали. . [26]

Кроме того, было высказано предположение, что активация в [передних-en] регионах веретенообразных извилин указывает на успешное распознавание. [27] Однако было обнаружено, что уровни активации зависят от семантической релевантности объекта. Термин семантическая релевантность здесь относится к «мере вклада семантических характеристик в основное значение понятия». [28] Результаты показали, что объекты с высокой семантической релевантностью, такие как артефакты , вызывают увеличение активации по сравнению с объектами с низкой семантической релевантностью, такими как природные объекты. [28] Это связано с предполагаемой повышенной трудностью различения природных объектов, поскольку они имеют очень схожие структурные свойства, что затрудняет их идентификацию по сравнению с артефактами. [27] Следовательно, чем легче идентифицировать объект, тем больше вероятность, что он будет успешно распознан.

Еще одним условием, влияющим на успешность распознавания объектов, является контекстуальное содействие . Считается, что во время задач распознавания объекта объект сопровождается «контекстным фреймом», который предлагает семантическую информацию о типичном контексте объекта. [29] Было обнаружено, что, когда объект находится вне контекста, производительность распознавания объекта снижается из-за более медленного времени отклика и большей неточности по сравнению с задачами распознавания, когда объект находился в соответствующем контексте. [29] На основании результатов исследования с использованием [fMRI-en] было высказано предположение, что в мозге существует «контекстная сеть» для контекстуально связанных объектов, активность которых в основном обнаруживается в парагиппокампальной коре (PHC) и ретросплениальном комплексе (RSC). . [30] Было обнаружено , что в PHC активность в парагиппокампальной области (PPA) предпочтительна сценам, а не объектам; однако было высказано предположение, что активность в PHC для одиночных объектов в задачах контекстуальной фасилитации может быть связана с последующим размышлением о пространственной сцене, в которой объект контекстуально представлен. Дальнейшие эксперименты показали, что активация была обнаружена как для непространственных, так и для пространственных контекстов в PHC, хотя активация из непространственных контекстов была ограничена [передним-en] PHC и задним PHC для пространственных контекстов. [30]

Память узнавания

[ редактировать ]

Когда кто-то видит объект, он знает, что это за объект, потому что видел его раньше; это память узнавания . Аномалии вентрального (что) потока зрительного пути влияют не только на нашу способность распознавать объект, но и на то, как объект нам представляется. Одной из примечательных характеристик памяти зрительного распознавания является ее замечательная емкость: даже после просмотра тысяч изображений в одном тесте люди выполняют последующие тесты на память с высокой точностью и запоминают значительные детали об изображениях, которые они видели. [31]

Контекст

[ редактировать ]

Контекст обеспечивает гораздо большую точность распознавания объектов. Когда опознаваемый объект размыт, точность распознавания значительно выше, если объект помещен в знакомый контекст. Кроме того, даже незнакомый контекст позволяет более точно распознать объект по сравнению с объектом, показываемым изолированно. [32] Это можно объяснить тем фактом, что объекты обычно видны в некоторой обстановке, а не в ее отсутствии вообще. Когда обстановка, в которой находится объект, знакома зрителю, становится намного легче определить, что это за объект. Хотя для правильного распознавания контекст не требуется, он является частью ассоциации, которую человек создает с определенным объектом.

Контекст становится особенно важным при распознавании лиц или эмоций. Когда эмоции на лице представлены без какого-либо контекста, способность человека точно описать отображаемую эмоцию значительно ниже, чем при наличии контекста. Этот феномен остается актуальным для всех возрастных групп и культур, а это означает, что контекст имеет важное значение для точного определения эмоций на лице для всех людей. [33]

Знакомство

[ редактировать ]

Знакомство — это механизм, не зависящий от контекста, в том смысле, что то, что человек узнает, просто кажется знакомым, не тратя время на попытки выяснить, в каком контексте он знает этот объект. [34] Вентро-латеральная область лобной доли участвует в кодировании памяти во время случайного обучения, а затем в поддержании и извлечении семантических воспоминаний. [34] Знакомство может вызывать процессы восприятия, отличные от процессов восприятия незнакомых объектов, а это означает, что наше восприятие конечного числа знакомых объектов уникально. [35] Отклонения от типичных точек зрения и контекста могут повлиять на эффективность распознавания объекта. [35] Было обнаружено, что знакомые объекты не только распознаются более эффективно, если смотреть со знакомой точки зрения, а не с незнакомой, но этот принцип применим и к новым объектам. Это приводит к мысли, что представления объектов в наш мозг организован более привычно, чем объекты, наблюдаемые в окружающей среде. [35] Распознавание во многом зависит не только от формы и/или вида объекта, но и от динамической информации. [36] Знакомство может улучшить восприятие динамических точечных светильников, движущихся объектов, пола лиц и распознавания лиц. [35]

Воспоминание

[ редактировать ]

Воспоминание имеет много общего со знакомством; однако он зависит от контекста и требует конкретной информации о запрашиваемом инциденте. [34]

Нарушения

[ редактировать ]

Потеря распознавания объектов называется зрительной объектной агнозией . Существуют две широкие категории агнозии зрительных объектов : апперцептивная и ассоциативная. Когда объектная агнозия возникает из-за поражения доминантного полушария, часто возникают глубокие сопутствующие речевые нарушения, включая потерю значения слов.

Последствия поражений вентрального русла

[ редактировать ]

Распознавание объектов — сложная задача, в которой задействованы несколько различных областей мозга, а не только одна. Если одна область повреждена, распознавание объектов может быть нарушено. Основная область распознавания объектов находится в височной доле . Например, было обнаружено, что поражение периринальной коры у крыс вызывает нарушения распознавания объектов, особенно с увеличением неопределенности признаков. [37] Неонатальные аспирационные поражения миндалевидного комплекса у обезьян, по-видимому, приводят к большей потере объектной памяти, чем ранние поражения гиппокампа. Однако у взрослых обезьян нарушение объектной памяти лучше объясняется повреждением периринальной и энторинальной коры , чем повреждением миндалевидных ядер. [38] Комбинированные поражения миндалевидного гиппокампа (A + H) у крыс ухудшали выполнение задачи по распознаванию объектов, когда интервалы удержания увеличивались за пределы 0 с и когда тестовые стимулы повторялись в течение сеанса. Повреждение [амигдалы-эн] или [гиппокампа-эн] не влияет на распознавание объектов, тогда как повреждение A + H вызывает явные нарушения. [39] В задаче по распознаванию объектов уровень дискриминации был значительно ниже при электролитическом поражении бледного шара (часть базальных ганглиев ) у крыс по сравнению с Substantia-Innominata/Ventral Pallidum, что, в свою очередь, было хуже по сравнению с контрольной и медиальной перегородкой/ Вертикальная диагональная полоса групп Брока; однако только globus pallidus не различал новые и знакомые предметы. [40] Эти поражения повреждают вентральный (какой) путь зрительной обработки объектов в головном мозге.

Зрительные агнозии

[ редактировать ]

Агнозия является редким явлением и может быть результатом инсульта, деменции, травмы головы, инфекции головного мозга или наследственной. [41] Апперцептивная агнозия – это дефицит восприятия объектов, приводящий к неспособности понимать значение объектов. [34] Аналогичным образом, ассоциативная зрительная агнозия – это неспособность понять значение предметов; однако на этот раз дефицит семантической памяти. [34] Обе эти агнозии могут повлиять на путь к распознаванию объектов, как в теории зрения Марра. В частности, в отличие от апперцептивной агнозии, пациенты с ассоциативным агнозием более успешно справляются с задачами рисования, копирования и сопоставления; однако эти пациенты демонстрируют, что они могут воспринимать, но не распознавать. [41] Интегративная агнозия (подвид ассоциативной агнозии) — неспособность объединить отдельные части в целостный образ. [34] При этих видах агнозий происходит повреждение вентрального (какого) потока пути зрительной обработки. Агнозия объектной ориентации — это неспособность определить ориентацию объекта, несмотря на адекватное распознавание объекта. [34] При этом типе агнозии происходит повреждение дорсального (где) потока пути зрительной обработки. Это может повлиять на распознавание объектов с точки зрения знакомства и даже в большей степени на незнакомые объекты и точки обзора. Трудность узнавания лиц можно объяснить прозопагнозией . Человек с прозопагнозией не может идентифицировать лицо, но все же способен воспринимать возраст, пол и выражение эмоций. [41] Область мозга, отвечающая за распознавание лиц, — это веретенообразная область лица . Прозопагнозию также можно разделить на апперцептивный и ассоциативный подтипы. Распознавание отдельных стульев, автомобилей, животных также может быть нарушено; следовательно, эти объекты имеют схожие с лицом особенности восприятия, которые распознаются в веретенообразной области лица. [41]

болезнь Альцгеймера

[ редактировать ]

Различие между категорией и атрибутом в семантическом представлении может помочь нам оценить семантическую функцию при старении и болезненных состояниях, влияющих на семантическую память, таких как болезнь Альцгеймера (БА). [42] Из-за дефицита семантической памяти люди с болезнью Альцгеймера испытывают трудности с распознаванием объектов, поскольку семантическая память , как известно, используется для извлечения информации для наименования и категоризации объектов. [43] Фактически, активно обсуждается, отражает ли дефицит семантической памяти при AD потерю семантических знаний для определенных категорий и понятий или потерю знаний о перцептивных особенностях и атрибутах. [42]

См. также

[ редактировать ]
  1. ^ Уллман, С. (1996) Видение высокого уровня, MIT Press
  2. ^ Хамфрис Г., Прайс К., Риддок Дж. (1999). «От объектов к именам: подход когнитивной нейробиологии». Психологические исследования . 62 (2–3): 118–130. дои : 10.1007/s004260050046 . ПМИД   10472198 . S2CID   13783299 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  3. ^ Риддок, М., и Хамфрис, Г. (2001). Распознавание объектов. В Б. Раппе (ред.), Справочнике по когнитивной нейропсихологии. Хов: Psychology Press.
  4. ^ Уорд, Дж. (2006). Руководство для студентов по когнитивной нейронауке. Нью-Йорк: Psychology Press.
  5. ^ Перейти обратно: а б Бар М (2003). «Корковый механизм запуска нисходящей помощи при распознавании визуальных объектов». Журнал когнитивной нейронауки . 15 (4): 600–609. CiteSeerX   10.1.1.296.3039 . дои : 10.1162/089892903321662976 . ПМИД   12803970 . S2CID   18209748 .
  6. ^ ДиКарло Джей-Джей, Кокс Д.Д. (2007). «Распутывание инвариантного распознавания объектов» . Тенденции Cogn Sci . 11 (8): 333–41. дои : 10.1016/j.tics.2007.06.010 . ПМИД   17631409 . S2CID   11527344 .
  7. ^ Ричер Ф., Буле К. (1999). «Фронтальные поражения и колебания в подготовке к ответу» (PDF) . Мозг и познание . 40 (1): 234–238. дои : 10.1006/brcg.1998.1067 . ПМИД   10373286 . Архивировано из оригинала (PDF) 18 января 2018 г. Проверено 17 января 2018 г.
  8. ^ Шенден, Халин (2008). «Там, где зрение встречается с памятью: префронтально-задние сети для постоянства зрительных объектов во время категоризации и распознавания». Нейропсихология и невролог . 18 (7): 1695–1711.
  9. ^ Перейти обратно: а б Бургунд, Э. Дарси; Марсолек, Чад Дж. (2000). «Инвариантное к точке обзора и зависящее от точки зрения распознавание объектов в диссоциируемых нейронных подсистемах» . Психономический бюллетень и обзор . 7 (3): 480–489. дои : 10.3758/BF03214360 . ISSN   1069-9384 . ПМИД   11082854 .
  10. ^ Перейти обратно: а б Юньфэн, И (2009). «Вычислительная модель, которая восстанавливает трехмерную форму объекта по одному двухмерному представлению на сетчатке» . Исследование зрения . 49 (9): 979–991. дои : 10.1016/j.visres.2008.05.013 . ПМИД   18621410 .
  11. ^ Перейти обратно: а б Розенберг, Ари (2013). «Визуальное представление ориентации трехмерных объектов в теменной коре» . Журнал неврологии . 33 (49): 19352–19361. doi : 10.1523/jneurosci.3174-13.2013 . ПМК   3850047 . ПМИД   24305830 .
  12. ^ Бидерман I (1987). «Распознавание по компонентам: теория понимания образа человека». Психологический обзор . 94 (2): 115–147. CiteSeerX   10.1.1.132.8548 . дои : 10.1037/0033-295x.94.2.115 . ПМИД   3575582 . S2CID   8054340 .
  13. ^ Перейти обратно: а б Тарр М., Балтофф Х. (1995). «Что лучше распознавание человеческих объектов описывается структурными описаниями геонов или множественными взглядами? Прокомментируйте Бидермана и Герхардштейна (1993)». Журнал экспериментальной психологии: человеческое восприятие и деятельность . 21 (6): 1494–1505. дои : 10.1037/0096-1523.21.6.1494 . ПМИД   7490590 .
  14. ^ Петерсон, Массачусетс, и Роудс, Г. (ред.). (2003). Восприятие лиц, предметов и сцен: аналитические и целостные процессы. Нью-Йорк: Издательство Оксфордского университета.
  15. ^ Унгерлейдер, Л.Г., Мишкин, М., 1982. Две корковые зрительные системы. В: Ингл, DJ, Гудейл, Массачусетс, Мэнсфилд, RJW (ред.), Анализ визуального поведения. InMIT Press, Кембридж, стр. 549–586.
  16. ^ Гудейл М., Милнер А. (1992). «Отдельные визуальные пути восприятия и действия». Тенденции в нейронауках . 15 (1): 20–25. CiteSeerX   10.1.1.207.6873 . дои : 10.1016/0166-2236(92)90344-8 . ПМИД   1374953 . S2CID   793980 .
  17. ^ Спиридон М., Фишл Б., Канвишер Н. (2006). «Расположение и пространственный профиль категорийных областей в экстрастриарной коре головного мозга человека» . Картирование человеческого мозга . 27 (1): 77–89. дои : 10.1002/hbm.20169 . ПМК   3264054 . ПМИД   15966002 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  18. ^ Курци З., Канвишер Н. (2001). «Представление воспринимаемой формы объекта латеральным затылочным комплексом человека» . Наука . 293 (5534): 1506–1509. Бибкод : 2001Sci...293.1506K . дои : 10.1126/science.1061133 . ПМИД   11520991 . S2CID   2942593 .
  19. ^ Гриль-Спектор К.; Кушнир Т.; Эдельман С.; Ицхак Ю.; Малах Р. (1998). «Кий-инвариантная активация в объектно-зависимых областях затылочной доли человека» . Нейрон . 21 (1): 191–202. дои : 10.1016/s0896-6273(00)80526-7 . ПМИД   9697863 .
  20. ^ Малах Р.; Реппас Дж.; Бенсон Р.; Квонг К.; Цзян Х.; Кеннеди В.; и др. (1995). «Предметная активность, выявленная методом функциональной магнитно-резонансной томографии в затылочной коре головного мозга человека» . Труды Национальной академии наук США . 92 (18): 8135–8139. Бибкод : 1995PNAS...92.8135M . дои : 10.1073/pnas.92.18.8135 . ПМК   41110 . ПМИД   7667258 .
  21. ^ Гриль-Спектор К., Курци З., Канвишер Н. (2001). «Латеральный затылочный комплекс и его роль в распознавании объектов» . Исследование зрения . 42 (10–11): 1409–1422. дои : 10.1016/s0042-6989(01)00073-6 . ПМИД   11322983 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  22. ^ Унгерлейдер Л.Г., Мишкин М., 1982. Две корковые зрительные системы. В: Ингл, DJ, Гудейл, Массачусетс, Мэнсфилд, RJW (ред.), Анализ визуального поведения. InMIT Press, Кембридж, стр. 549–586.
  23. ^ Коллинз и Керби (2013). «Концептуальные знания ослабляют зависимость от точки зрения при распознавании визуальных объектов». Визуальное познание . 21 (8): 945–960. дои : 10.1080/13506285.2013.836138 . S2CID   144846924 .
  24. ^ Хельбиг; и др. (2009). «Наблюдение за действием может способствовать визуальному распознаванию объектов» . Exp Brain Res . 200 (3–4): 251–8. дои : 10.1007/s00221-009-1953-8 . ПМК   2820217 . ПМИД   19669130 .
  25. ^ Келленбах М., Ховиус М., Паттерсон К. (2005). «ПЭТ-исследование визуальных и семантических знаний об объектах». Кортекс . 41 (2): 121–132. дои : 10.1016/s0010-9452(08)70887-6 . ПМИД   15714895 . S2CID   4476793 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  26. ^ Виренга К., Перлштейн В., Бенджамин М., Леонард К., Роти Л., Конвей Т.; и др. (2009). «Нейронные субстраты идентификации объектов: функциональная магнитно-резонансная томография свидетельствует о том, что категория и визуальный атрибут способствуют семантическому знанию». Журнал Международного нейропсихологического общества . 15 (2): 169–181. дои : 10.1017/s1355617709090468 . ПМИД   19232155 . S2CID   9987685 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  27. ^ Перейти обратно: а б Герлах С (2009). «Категорийность в визуальном распознавании объектов». Познание . 111 (3): 281–301. дои : 10.1016/j.cognition.2009.02.005 . ПМИД   19324331 . S2CID   13572437 .
  28. ^ Перейти обратно: а б Мечелли А., Сартори Г., Орланди П., Прайс К. (2006). «Семантическая релевантность объясняет эффекты категорий в медиальной веретенообразной извилине». НейроИмидж . 30 (3): 992–1002. doi : 10.1016/j.neuroimage.2005.10.017 . hdl : 11577/1565416 . ПМИД   16343950 . S2CID   17635735 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  29. ^ Перейти обратно: а б Бар М., Ульман С. (1996). «Пространственный контекст в распознавании». Восприятие . 25 (3): 343–352. дои : 10.1068/p250343 . ПМИД   8804097 . S2CID   10106848 .
  30. ^ Перейти обратно: а б Бар М., Аминофф Э. (2003). «Корковый анализ зрительного контекста» . Нейрон . 38 (2): 347–358. дои : 10.1016/s0896-6273(03)00167-3 . ПМИД   12718867 .
  31. ^ Брэди Т.Ф., Конкле Т., Альварес Г.А., Олива А. (2008). «Визуальная долговременная память обладает огромной емкостью для хранения деталей объектов» . Proc Natl Acad Sci США . 105 (38): 14325–9. Бибкод : 2008PNAS..10514325B . дои : 10.1073/pnas.0803390105 . ПМЦ   2533687 . ПМИД   18787113 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  32. ^ Баренхольц; и др. (2014). «Количественная оценка роли контекста в распознавании визуальных объектов». Визуальное познание . 22 : 30–56. дои : 10.1080/13506285.2013.865694 . S2CID   144891703 .
  33. ^ Теурел; и др. (2016). «Интеграция визуальной контекстной информации в распознавание эмоций по лицу у детей в возрасте от 5 до 15 лет». Журнал экспериментальной детской психологии . 150 : 252–271. дои : 10.1016/j.jecp.2016.06.004 . ПМИД   27367301 .
  34. ^ Перейти обратно: а б с д и ж г Уорд, Дж. (2006). Руководство для студентов по когнитивной нейронауке. Нью-Йорк: Psychology Press
  35. ^ Перейти обратно: а б с д Балтофф И., Ньюэлл Ф. (2006). «Роль знакомства в распознавании статических и динамических объектов». Зрительное восприятие - Основы зрения: процессы низкого и среднего уровня восприятия . Прогресс в исследованиях мозга. Том. 154. С. 315–325. дои : 10.1016/S0079-6123(06)54017-8 . hdl : 21.11116/0000-0004-9C5A-8 . ISBN  9780444529664 . ПМИД   17010720 .
  36. ^ Вуонг, К., и Тарр, М. (2004). Направление вращения влияет на распознавание объектов
  37. ^ Норман Г., Икотт М. (2004). «Нарушение распознавания объектов с увеличением уровня двусмысленности признаков у крыс с поражениями периринальной коры». Поведенческие исследования мозга . 148 (1–2): 79–91. дои : 10.1016/s0166-4328(03)00176-1 . ПМИД   14684250 . S2CID   42296072 .
  38. ^ Башевалье, Дж., Борегар, М., и Альварадо, MC (1999). Отдаленные эффекты неонатального повреждения гиппокампа и миндалевидного комплекса на дискриминацию и распознавание объектов у макак-резус. Поведенческая нейронаука , 113.
  39. ^ Агглтон Дж. П., Блиндт Х. С., Роулинз JNP (1989). «Влияние поражений миндалины и миндалины-гиппокампа на распознавание объектов и пространственную рабочую память у крыс». Поведенческая нейронаука . 103 (5): 962–974. дои : 10.1037/0735-7044.103.5.962 . ПМИД   2803563 . S2CID   18503443 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  40. ^ Эннасер А. (1998). «Влияние поражений безымянной субстанции / вентрального бледного шара, бледного шара и медиальной перегородки на способность крыс выполнять задачи по распознаванию объектов и радиальному лабиринту: лечение физостигмином и амфетамином». Фармакологические исследования . 38 (4): 251–263. дои : 10.1006/phrs.1998.0361 . ПМИД   9774488 .
  41. ^ Перейти обратно: а б с д Бауэр, Р.М. (2006). Агнозии. Округ Колумбия, США: Американская психологическая ассоциация: Вашингтон.
  42. ^ Перейти обратно: а б Хаджилу Б.Б., Done DJ (2007). «Доказательства разобщенности структурных и семантических знаний при деменции типа Альцгеймера (DAT)». Нейропсихология . 45 (4): 810–816. doi : 10.1016/j.neuropsychologia.2006.08.008 . ПМИД   17034821 . S2CID   21628550 .
  43. ^ Лаату С., Джейкка Х., Портин Р., Ринне Дж. (2003). «Визуальное распознавание объектов при ранней болезни Альцгеймера: дефицит семантической обработки» . Acta Neurologica Scandinavica . 108 (2): 82–89. дои : 10.1034/j.1600-0404.2003.00097.x . ПМИД   12859283 . S2CID   22741928 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2e05ad5de09a9674568d25fd388dc09c__1709994720
URL1:https://arc.ask3.ru/arc/aa/2e/9c/2e05ad5de09a9674568d25fd388dc09c.html
Заголовок, (Title) документа по адресу, URL1:
Object recognition (cognitive science) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)