Машинное восприятие
Машинное восприятие — это способность компьютерной системы интерпретировать данные таким же образом, как люди используют свои чувства для взаимодействия с окружающим миром. [1] [2] [3] Основной метод, с помощью которого компьютеры воспринимают окружающую среду и реагируют на нее, заключается в использовании подключенного оборудования . До недавнего времени ввод данных был ограничен клавиатурой или мышью, но достижения в области технологий, как в аппаратном, так и в программном обеспечении , позволили компьютерам воспринимать сенсорную информацию так же, как это делают люди. [1] [2]
Машинное восприятие позволяет компьютеру использовать этот сенсорный ввод, а также обычные вычислительные средства сбора информации , собирать информацию с большей точностью и представлять ее в более удобном для пользователя виде . [1] К ним относятся компьютерное зрение , машинный слух , машинное прикосновение и машинное обоняние , поскольку искусственные запахи на химическом составе , молекулярном , атомном уровне неразличимы и идентичны. [4] [5]
Конечная цель машинного восприятия — дать машинам возможность видеть , чувствовать и воспринимать мир так, как это делают люди, и, следовательно, дать им возможность объяснять по-человечески, почему они принимают свои решения, предупреждать нас, когда что-то терпит неудачу. и, что более важно, причина, по которой он терпит неудачу. [6] Эта цель очень похожа на предполагаемые цели искусственного интеллекта в целом, за исключением того, что машинное восприятие наделяет машины лишь ограниченной чувствительностью , а не наделяет машины полным сознанием , самосознанием и интенциональностью .
Машинное зрение
[ редактировать ]Компьютерное зрение — это область, включающая методы получения, обработки, анализа и понимания изображений и многомерных данных из реального мира для получения числовой или символической информации, например, в форме решений. Компьютерное зрение уже используется сегодня во многих приложениях, таких как распознавание лиц , географическое моделирование и даже эстетическое суждение. [7]
Однако машинам по-прежнему сложно точно интерпретировать визуальные данные, если они размыты и если точка зрения, с которой рассматривается стимул, часто меняется. Компьютерам также сложно определить правильную природу некоторых стимулов, если они перекрываются или плавно соприкасаются с другим стимулом. Это относится к принципу хорошего продолжения . Машины также испытывают трудности с восприятием и записью действия стимулов в соответствии с принципом видимого движения, который исследовали гештальт-психологи .
Машинный слух
[ редактировать ]Машинный слух, также известный как машинное прослушивание или компьютерное прослушивание , — это способность компьютера или машины воспринимать и обрабатывать звуковые данные, такие как речь или музыка. [8] [9] Эта область имеет широкий спектр применения, включая запись и сжатие музыки, синтез речи и распознавание речи . [10] Более того, эта технология позволяет машине воспроизвести способность человеческого мозга выборочно фокусироваться на определенном звуке на фоне множества других конкурирующих звуков и фонового шума. Эта особая способность называется « слуховым анализом сцены ». Технология позволяет машине сегментировать несколько потоков, происходящих одновременно. [8] [11] [12] Многие широко используемые устройства, такие как смартфоны, голосовые переводчики и автомобили, используют ту или иную форму машинного слуха. Однако современные технологии все еще иногда сталкиваются с проблемами сегментации речи . Это означает, что нужно слышать слова в предложениях, особенно если учитывать человеческий акцент.
Машинное прикосновение
[ редактировать ]
Машинное осязание — это область машинного восприятия, где тактильная информация обрабатывается машиной или компьютером. Приложения включают тактильное восприятие свойств поверхности и ловкость , благодаря чему тактильная информация может обеспечить интеллектуальные рефлексы и взаимодействие с окружающей средой. [13] (Этого можно было бы достичь путем измерения того, когда и где возникает трение, а также его характера и интенсивности). Однако машины до сих пор не способны измерить некоторые физические переживания человека, которые мы считаем обычными, включая физическую боль. Например, ученым еще предстоит изобрести механическую замену ноцицепторам в теле и мозге, которые отвечают за распознавание и измерение физического дискомфорта и страданий человека.
Машинное обоняние
[ редактировать ]Ученые разрабатывают компьютеры, известные как машины обоняния могут распознавать и измерять запахи , которые также . Переносимые по воздуху химические вещества обнаруживаются и классифицируются с помощью устройства, иногда называемого электронным носом . [14] [15]
Машинный вкус
[ редактировать ]Электронный язык – это инструмент, который измеряет и сравнивает вкусы . Согласно техническому отчету IUPAC, «электронный язык» как аналитический инструмент, включающий массив неселективных химических сенсоров с частичной специфичностью к различным компонентам раствора и соответствующий инструмент распознавания образов, способный распознавать количественный и качественный состав простых и сложных растворов. [16] [17]
Химические соединения, отвечающие за вкус, обнаруживаются вкусовыми рецепторами человека . Точно так же многоэлектродные датчики электронных приборов обнаруживают одни и те же растворенные органические и неорганические соединения . Подобно человеческим рецепторам, каждый сенсор имеет спектр реакций, отличающийся от другого. Информация, предоставляемая каждым датчиком, дополняет друг друга, а комбинация результатов всех датчиков создает уникальный отпечаток пальца. Большинство порогов обнаружения датчиков аналогичны человеческим рецепторам или превосходят их.
В биологическом механизме вкусовые сигналы преобразуются нервами головного мозга в электрические сигналы. Принцип действия датчиков электронного языка аналогичен: они генерируют электрические сигналы в виде вольтамперометрических и потенциометрических вариаций.
Восприятие и распознавание вкусовых качеств основаны на построении или распознавании мозгом активированных сенсорных нервных паттернов и вкусовых отпечатков продукта. электронного языка Этот шаг достигается с помощью статистического программного обеспечения , которое интерпретирует данные датчиков во вкусовые модели.Будущее
[ редактировать ]Помимо перечисленных выше, некоторые из будущих препятствий, которые науке о машинном восприятии еще предстоит преодолеть, включают, помимо прочего:
- Воплощенное познание . Теория, согласно которой познание представляет собой опыт всего тела и, следовательно, может существовать и, следовательно, быть измерено и проанализировано в полной мере только в том случае, если все необходимые человеческие способности и процессы работают вместе через взаимосознающую и поддерживающую сеть систем.
- Парадокс Моравеца (см. ссылку)
- Принцип подобия - у детей раннего возраста развивается способность определять, к какой семье относится вновь введенный стимул, даже если этот стимул отличается от членов, с которыми ребенок обычно ассоциирует указанную семью. (Примером может быть ребенок, который считает, что чихуахуа — это собака и домашний питомец, а не паразит.)
- Бессознательный вывод : естественное человеческое поведение, заключающееся в определении, опасен или нет новый стимул, что это такое, а затем как к нему относиться, не требуя при этом каких-либо новых сознательных усилий.
- Врожденная человеческая способность следовать принципу правдоподобия , чтобы со временем учиться на обстоятельствах и других людях.
- Теория распознавания по компонентам - способность мысленно анализировать и разбивать даже сложные механизмы на управляемые части, с которыми можно взаимодействовать. Например: человек видит и чашку, и части ручки, из которых состоит кружка, полная горячего какао, чтобы использовать ручку, чтобы держать кружку, чтобы не обжечься.
- Принцип свободной энергии - заблаговременное определение того, сколько энергии можно безопасно делегировать осознанию вещей вне себя без потери необходимой энергии, необходимой для поддержания своей жизни и удовлетворительного функционирования. Это позволяет обоим оптимально осознавать окружающий мир, не истощая свою энергию настолько, что они испытывают разрушительный стресс, усталость от принятия решений и / или истощение.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д Малкольм Татум (3 октября 2012 г.). «Что такое машинное восприятие» .
- ^ Jump up to: а б с Александр Серов (29 января 2013 г.). «Субъективная реальность и сильный искусственный интеллект». arXiv : 1301.6359 [ cs.AI ].
- ^ «Лаборатория машинного восприятия и когнитивной робототехники» . www.ccs.fau.edu . Проверено 18 июня 2016 г.
- ^ Хлопок2009-03-01T00:00:00+00:00, Саймон. «Если пахнет – это химия» . РСК Образование . Проверено 3 мая 2022 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ «Искусственные сети учатся пахнуть мозгом» . Новости Массачусетского технологического института | Массачусетский технологический институт . Проверено 3 мая 2022 г.
- ^ «Исследование машинного восприятия – ECE – Технологический институт Вирджинии» . www.ECE.VT.edu . Архивировано из оригинала 7 марта 2021 года . Проверено 10 января 2018 г.
- ^ Jump up to: а б Дхар, Сагник; Ордонес, Висенте; Берг, Тамара Л. (2011). «Описываемые атрибуты высокого уровня для прогнозирования эстетики и интересности» (PDF) . ЦВПР 2011 . стр. 1657–1664. дои : 10.1109/CVPR.2011.5995467 . HDL : 1951/55408 . ISBN 978-1-4577-0394-2 . S2CID 14609200 .
- ^ Jump up to: а б Тангиан ( Tangian ), Андраник (1993). Искусственное восприятие и распознавание музыки . Берлин-Гейдельберг: Springer.
- ^ Тангиан (Тангиан), Андраник (1994). «Принцип корреляции восприятия и его применение к распознаванию музыки». Музыкальное восприятие . 11 (4): 465–502. дои : 10.2307/40285634 . JSTOR 40285634 .
- ^ Jump up to: а б Лион, Ричард (2010). «Машинный слух: новая область [исследовательская DSP». Журнал обработки сигналов IEEE . 27 (5): 131–139. Бибкод : 2010ISPM...27..131L . дои : 10.1109/MSP.2010.937498 . S2CID 13143070 .
- ^ Тангиан, Андраник (2001). «Как мы думаем: моделирование взаимодействия памяти и мышления» . Когнитивная обработка . 2 : 117–151. дои : 10.5445/IR/1000133287 . S2CID 237995668 .
- ^ «Лаборатория машинного восприятия и когнитивной робототехники» . ccs.FAU.edu . Проверено 10 января 2018 г.
- ^ Флер, С.; Моринген, А.; Клацки, РЛ; Риттер, Х. (2020). «Обучение эффективному исследованию гаптической формы с помощью жесткой тактильной сенсорной матрицы, С. Флир, А. Моринген, Р. Клацки, Х. Риттер» . ПЛОС ОДИН . 15 (1): e0226880. дои : 10.1371/journal.pone.0226880 . ПМК 6940144 . ПМИД 31896135 .
- ^ «Использование искусственного интеллекта для запаха роз: исследование применяет машинное обучение к обонянию с возможными обширными применениями в ароматах и вкусах» . ScienceDaily . Проверено 3 мая 2022 г.
- ^ Марр, Бернард. «Искусственный интеллект развивает обоняние: что на практике может означать цифровой нос?» . Форбс . Проверено 3 мая 2022 г.
- ^ Власов Ю.; Легин А.; Рудницкая А.; Натале, К. Ди; Д'Амико, А. (1 января 2005 г.). «Неспецифические сенсорные матрицы («электронный язык») для химического анализа жидкостей (Технический отчет ИЮПАК)» . Чистая и прикладная химия . 77 (11): 1965–1983. дои : 10.1351/pac200577111965 . ISSN 0033-4545 . S2CID 109659409 .
- ^ Халилиан, Алиреза; Хан, доктор Раджибур Рахаман; Кан, Шин Вон (2017). «Высокочувствительный волоконно-оптический датчик вкуса с широким динамическим диапазоном и боковой полировкой». Датчики и исполнительные механизмы B: Химические вещества . 249 : 700–707. дои : 10.1016/j.snb.2017.04.088 .
- ^ Терк, Мэтью (2000). «Перцептивные медиа: машинное восприятие и взаимодействие человека с компьютером» (PDF) . Китайский журнал компьютеров . 12 . страницы 1235-1244