Распознавание слов
Часть серии о |
Чтение |
---|
Распознавание слов , согласно Информационной и коммуникационной системе грамотности (LINCS), — это «способность читателя правильно и практически без усилий распознавать написанные слова». Его иногда называют «распознаванием изолированных слов», поскольку оно предполагает способность читателя распознавать слова по отдельности из списка, не нуждаясь в похожих словах для контекстуальной помощи. [1] LINCS продолжает утверждать, что «быстрое и легкое распознавание слов является основным компонентом беглого чтения», и объясняет, что эти навыки можно улучшить, «практикуясь с карточками , списками и таблицами слов».
В своем обзоре науки обучения чтению в 1990 году психолог Мэрилин Джагер Адамс написала, что «единственный непреложный и необязательный факт об умелом чтении заключается в том, что оно предполагает относительно полную обработку отдельных печатных букв». [2] В статье «Наука распознавания слов» говорится, что «данные последних 20 лет работы в области когнитивной психологии указывают на то, что мы используем буквы внутри слова, чтобы распознать слово». Со временем были выдвинуты другие теории, предлагающие механизмы, с помощью которых слова распознаются изолированно, но одновременно быстро и точно. [3] Эти теории больше фокусируются на значении отдельных букв и распознавании формы букв (например, распознавании последовательных букв и распознавании параллельных букв). Другие факторы, такие как саккадические движения глаз и линейная связь между буквами, также влияют на то, как мы распознаем слова. [4]
В статье в ScienceDaily говорится, что «раннее распознавание слов является ключом к навыкам чтения на протяжении всей жизни». [5] Существуют разные способы развития этих навыков. Например, создание карточек со словами, которые появляются с высокой частотой, считается инструментом преодоления дислексии . [6] Утверждалось, что просодия — образцы ритма и звука, используемые в поэзии , — может улучшить распознавание слов. [7]
Распознавание слов — это способ чтения, основанный на непосредственном восприятии того, какое слово представляет собой знакомая группа букв. Этот процесс существует в отличие от фонетики и анализа слов как другой метод распознавания и вербализации визуального языка (т.е. чтения). [8] Распознавание слов осуществляется преимущественно автоматически. С другой стороны, фонетика и анализ слов основаны на когнитивном применении изученных грамматических правил для смешивания букв, звуков, графем и морфем .
Распознавание слов измеряется скоростью: слово с высоким уровнем распознавания читается быстрее, чем новое. [3] Такой способ тестирования предполагает, что не требуется понимание значения читаемых слов, а скорее умение распознавать их таким образом, чтобы обеспечить правильное произношение. Таким образом, контекст неважен, и распознавание слов часто оценивается по словам, представленным изолированно в таких форматах, как флэш-карточки. [8] Тем не менее, легкость распознавания слов, как и беглость речи , обеспечивает навыки, способствующие пониманию читаемого текста. [9]
Внутренняя ценность распознавания слов может быть очевидна из-за преобладания грамотности в современном обществе. Однако его роль может быть менее заметной в областях обучения грамоте, изучению второго языка и задержек в развитии чтения. Поскольку распознавание слов становится более понятным, могут быть открыты более надежные и эффективные формы обучения как для детей, так и для взрослых, изучающих грамотность на родном языке. Такая информация может также принести пользу изучающим второй язык, поскольку они освоят новые слова и буквенные символы. [10] Кроме того, лучшее понимание процессов, связанных с распознаванием слов, может позволить разработать более конкретные методы лечения людей с ограниченными возможностями чтения.
Теории
[ редактировать ]Форма Боума
[ редактировать ]Форма Боума, названная в честь голландского исследователя зрения Германа Баумы , относится к общему контуру или форме слова. [11] Герман Баума обсуждал роль «глобальной формы слова» в своем эксперименте по распознаванию слов, проведенном в 1973 году. [12] Теории формы бумы стали популярными в распознавании слов, предполагая, что люди узнают слова по форме, которую буквы образуют в группе относительно друг друга. [3] Это противоречит идее, что буквы читаются индивидуально. Вместо этого, благодаря предварительному воздействию, люди знакомятся с контурами и, таким образом, узнают их в следующий раз, когда им предлагают то же самое слово, или бума.
Более медленный темп, с которым люди читают слова, написанные полностью заглавными буквами или с чередованием прописных и строчных букв, подтверждает теорию бума. [3] Теория утверждает, что новая форма бумы, созданная путем замены строчных букв на прописные, препятствует способности человека запоминать. Джеймс Кеттелл также поддержал эту теорию в своем исследовании, которое доказало эффект, который он назвал превосходством слов. Это относилось к улучшенной способности людей различать буквы, если буквы были представлены внутри слова, а не как смесь случайных букв. Более того, многочисленные исследования показали, что читатели с меньшей вероятностью заметят слова с ошибками и одинаковой формой бума, чем слова с ошибками и другой формой бума.
Хотя эти эффекты последовательно воспроизводились, многие из их выводов были оспорены. Некоторые предполагают, что способность читать слова в верхнем регистре обусловлена количеством практики, которую человек имеет с ними. Люди, которые практикуются, быстрее читают слова в верхнем регистре, что противоречит важности бума. Кроме того, по мнению психологов Джеймса Макклелланда и Джеймса Джонсона, эффект словесного превосходства может быть результатом знакомства с фонетическими комбинациями букв, а не с очертаниями слов. [13]
Параллельное распознавание против последовательного распознавания
[ редактировать ]Распознавание параллельных букв сегодня является наиболее широко принятой психологами моделью распознавания слов. [3] В этой модели все буквы внутри группы воспринимаются одновременно для распознавания слов. Напротив, модель серийного распознавания предполагает, что буквы распознаются индивидуально, одна за другой, прежде чем интегрироваться для распознавания слов. Он предсказывает, что отдельные буквы идентифицируются быстрее и точнее, чем несколько букв вместе, как в слове. Однако эта модель была отвергнута, поскольку она не может объяснить эффект превосходства слов , который гласит, что читатели могут быстрее и точнее идентифицировать буквы в контексте слова, а не изолированно.
Нейронные сети
[ редактировать ]Более современный подход к распознаванию слов был основан на недавних исследованиях функционирования нейронов. [3] Считается, что визуальные аспекты слова, такие как горизонтальные и вертикальные линии или кривые, активируют рецепторы, распознающие слова. От этих рецепторов посылаются нервные сигналы, которые либо возбуждают, либо подавляют связи с другими словами в памяти человека. Слова, символы которых соответствуют визуальному представлению наблюдаемого слова, получают возбуждающие сигналы. По мере того как разум далее обрабатывает появление слова, тормозящие сигналы одновременно уменьшают активацию слов в памяти, имеющих непохожий внешний вид. Это нейронное усиление связей с соответствующими буквами и словами, а также одновременное ослабление ассоциаций с нерелевантными в конечном итоге активирует правильное слово как часть распознавания слова в нейронной сети.
Физиологическая основа
[ редактировать ]Мозг
[ редактировать ]Используя позитронно-эмиссионную томографию (ПЭТ) и потенциалы, связанные с событиями , исследователи обнаружили две отдельные области в веретенообразной извилине , которые специфически реагируют на строки букв. Задняя веретенообразная извилина реагирует на слова и неслова, независимо от их смыслового контекста. [14] На переднюю веретенообразную извилину влияет семантический контекст, а также то, являются ли комбинации букв словами или псевдословами (новые комбинации букв, имитирующие фонетические соглашения, например, шинг). Эта роль передней веретенообразной извилины может коррелировать с более высокой обработкой концепции и значения слова. Обе эти области отличаются от областей, которые реагируют на другие типы сложных стимулов, таких как лица или цветные узоры, и являются частью функционально специализированного вентрального пути. В течение 100 миллисекунд (мс) после фиксации слова область левой нижневисочной коры обрабатывает его поверхностную структуру. Семантическая информация начинает обрабатываться через 150 мс и свидетельствует о широко распространенной активации кортикальной сети. Через 200 мс происходит интеграция различных видов информации. [15]
Точность, с которой читатели распознают слова, зависит от стимулируемой области сетчатки. [16] Чтение на английском языке выборочно тренирует определенные области левого полушария сетчатки для обработки этого типа зрительной информации, делая эту часть зрительного поля оптимальной для распознавания слов. По мере того как слова выходят из этой оптимальной области, точность распознавания слов снижается. Благодаря такому обучению в соответствующем левом полушарии головного мозга развивается эффективная нервная организация . [16]
Саккадические движения и фиксации глаз.
[ редактировать ]Глаза совершают короткие, незаметные движения, называемые саккадами, примерно три-четыре раза в секунду. [17] Саккады разделены фиксациями — моментами, когда глаза неподвижны. Во время саккад снижается зрительная чувствительность, что называется саккадическим подавлением. Это гарантирует, что большая часть восприятия зрительной информации происходит во время фиксаций. Однако лексическая обработка продолжается во время саккад. Время и точность распознавания слов зависят от того, на каком месте слова в данный момент фиксируется глаз. Распознавание происходит быстрее и точнее при фиксации в середине слова. Это происходит из-за снижения остроты зрения, в результате чего буквы располагаются дальше от фиксированного места и их становится труднее увидеть. [18]
Частотные эффекты
[ редактировать ]Эффект частоты слов предполагает, что слова, которые чаще всего встречаются в печатном языке, легче распознать, чем слова, которые встречаются реже. [19] Распознавание этих слов происходит быстрее и точнее, чем других слов. Эффект частоты слов является одним из наиболее надежных и наиболее часто встречающихся эффектов в современной литературе по распознаванию слов. Это сыграло роль в развитии многих теорий, таких как форма бума . Более того, эффект частоты соседства гласит, что распознавание слов происходит медленнее и менее точно, если у цели есть орфографический сосед, частота которого выше его самой. Орфографические соседи — это слова одинаковой длины, отличающиеся только одной буквой этого слова. [19]
Реальные приложения
[ редактировать ]Межбуквенное расстояние
[ редактировать ]Шрифты с засечками , то есть: шрифты с небольшими придатками в конце штрихов, затрудняют лексический доступ. Распознавание слов при использовании шрифтов без засечек происходит быстрее в среднем на 8 мс. [20] Эти шрифты имеют значительно больший межбуквенный интервал, и исследования показали, что ответы на слова с увеличенным межбуквенным интервалом были быстрее, независимо от частоты и длины слова. [21] Это демонстрирует обратную зависимость между продолжительностью фиксации и небольшим увеличением межбуквенного расстояния. [22] скорее всего, из-за снижения латерального торможения в нейронной сети. [20] Когда буквы расположены дальше друг от друга, более вероятно, что люди сосредоточат свою фиксацию в начале слов, тогда как интервал между буквами по умолчанию в программном обеспечении для обработки текста способствует фиксации в центре слов. [22]
Инструменты и измерения
[ редактировать ]И ПЭТ, и функциональная магнитно-резонансная томография (фМРТ) используются для изучения активации различных частей мозга, пока участники выполняют задачи, связанные с чтением. [23] Однако магнитоэнцефалография (МЭГ) и электроэнцефалография (ЭЭГ) обеспечивают более точные временные измерения, записывая потенциалы, связанные с событием, каждую миллисекунду. Хотя определение места возникновения электрических реакций может быть проще с помощью МЭГ, ЭЭГ является более распространенной формой исследования распознавания слов. Потенциалы, связанные с событиями, помогают измерить как силу, так и задержку активности мозга в определенных областях во время чтения. Кроме того, сочетая полезность потенциалов, связанных с событиями, с мониторингом движений глаз, исследователи могут коррелировать фиксации во время чтения с распознаванием слов в мозгу в режиме реального времени. Поскольку саккады и фиксации указывают на распознавание слов, электроокулография (ЭОГ) используется для измерения движений глаз и количества времени, необходимого для лексического доступа к целевым словам. Это было продемонстрировано исследованиями, в которых более длинные и менее распространенные слова вызывают более длительную фиксацию, а более мелкие и менее важные слова могут вообще не фиксироваться во время чтения предложения.
Обучение
[ редактировать ]По данным веб-сайта LINCS, роль распознавания слов приводит к различиям между привычками взрослых и привычками детей, которые учатся читать. [8] Многие неграмотные взрослые, обучающиеся чтению, больше полагаются на распознавание слов, чем на акустику и анализ слов. Плохие читатели, имеющие предварительные знания о целевых словах, могут распознавать слова и делать меньше ошибок, чем плохие читатели, не имеющие предварительных знаний. [24] Вместо того, чтобы смешивать звуки отдельных букв, взрослые учащиеся с большей вероятностью будут распознавать слова автоматически. [8] Однако это может привести к ошибкам, когда похожее по написанию, но другое слово ошибочно принимается за слово, знакомое читателю. Считается, что подобные ошибки происходят из-за опыта и воздействия учащегося. Младшие и новые учащиеся, как правило, больше сосредотачиваются на выводах текста и меньше полагаются на базовые знания или опыт. Плохие читатели с предварительным знанием используют семантические аспекты слова, тогда как опытные читатели полагаются только на графическую информацию для распознавания слова. [24] Однако практика и улучшение навыков, как правило, приводят к более эффективному использованию сочетания навыков чтения и базовых знаний для эффективного распознавания слов. [8]
Роль частотного эффекта была широко включена в процесс обучения. [8] Хотя метод анализа слов чрезвычайно полезен, многие слова не имеют правильных грамматических структур и легче включаются в лексическую память благодаря автоматическому распознаванию слов. Чтобы облегчить это, многие эксперты в области образования подчеркивают важность повторения при изучении слов. При этом используется эффект частоты, увеличивая знакомство читателя с целевым словом и тем самым улучшая как будущую скорость, так и точность чтения. Это повторение может осуществляться в форме карточек, отслеживания слов, чтения вслух, изображения слова и других форм практики, которые улучшают связь визуального текста с запоминанием слов. [25]
Роль технологий
[ редактировать ]Развитие технологий во многом способствовало прогрессу в понимании и исследованиях распознавания слов. Новые возможности распознавания слов сделали компьютерные программы обучения более эффективными и надежными. [8] Усовершенствованная технология позволила отслеживать саккадические движения глаз людей во время чтения. Это способствовало пониманию того, как определенные модели движений глаз улучшают распознавание и обработку слов. Более того, изменения могут быть одновременно внесены в текст, находящийся за пределами зоны внимания читателя, без ведома читателя. Это дало больше информации о том, на чем фокусируется взгляд, когда человек читает, и где проходят границы внимания.
Обладая этой дополнительной информацией, исследователи предложили новые модели распознавания слов, которые можно запрограммировать в компьютерах. В результате компьютеры теперь могут имитировать то, как человек будет воспринимать язык и новые слова и реагировать на них. [8] Эта технология продвинулась до такой степени, что модели обучения грамоте могут быть продемонстрированы в цифровом виде. Например, компьютер теперь может имитировать прогресс обучения ребенка и устанавливать общие языковые правила, когда ему предоставляется список слов с ограниченным количеством объяснений. Тем не менее, поскольку ни одна универсальная модель еще не согласована, возможность обобщения моделей распознавания слов и их моделирования может быть ограничена. [26]
Несмотря на отсутствие консенсуса относительно параметров моделирования, любой прогресс в области распознавания слов будет полезен для будущих исследований относительно того, какие стили обучения могут быть наиболее успешными в классах. Также существует корреляция между способностью к чтению, развитием разговорной речи и неспособностью к обучению. Таким образом, достижения в любой из этих областей могут способствовать пониманию взаимосвязанных вопросов. [27] В конечном счете, развитие распознавания слов может способствовать прорыву между «учиться читать» и «читать, чтобы учиться». [28]
Ссылки
[ редактировать ]- ^ «Стратегии оценки и профили чтения» . Архивировано из оригинала 13 мая 2017 г. Проверено 4 декабря 2011 г.
- ^ Адамс, Мэрилин Джагер (1990). Начинаем читать: думаем и учимся печати . Кембридж: MIT Press. п. 105 . ISBN 978-0-262-51076-9 .
- ^ Перейти обратно: а б с д и ж (Ларсен, 2004 г.)
- ^ «Наука распознавания слов» . Майкрософт .
- ^ «Раннее распознавание слов является ключом к навыкам чтения на протяжении всей жизни, говорит новое исследование» . www.sciencedaily.com . Проверено 9 января 2017 г.
- ^ «Навыки распознавания слов на флэш-картах при дислексии» . Архивировано из оригинала 22 декабря 2016 г. Проверено 4 декабря 2011 г.
- ^ ftp://128.46.154.21/harper/muri/Chen_PDSR_SP04.pdf [ постоянная мертвая ссылка ]
- ^ Перейти обратно: а б с д и ж г час (Бакалея, 2002)
- ^ (Люкнер и Урбах, 2012)
- ^ (Эверсон, 2011)
- ^ (Ранум, 1998)
- ^ (Бума и Боухаус, 1979)
- ^ (Макклелланд и Джонстон, 1977)
- ^ (Ноубл, Труетт и Маккарти, 1994)
- ^ (Хаук, Дэвис, Форд, Пулвермюллер и Марслен-Уилсон, 2006)
- ^ Перейти обратно: а б (Mishkin, Mortimer, Forgays & Donald, 1952)
- ^ (Ирвин, 1998)
- ^ (Назир, Хеллер и Сассман, 1992 г.)
- ^ Перейти обратно: а б (Грейнджер, 1990)
- ^ Перейти обратно: а б (Морет-Татай и Переа, 2011 г.)
- ^ (Переаа, Морет-Татая и Гомеск, 2011)
- ^ Перейти обратно: а б (Переа и Гомес, 2012 г.)
- ^ (Серено и Рейнер, 2003)
- ^ Перейти обратно: а б (Прибе, Кинан и Миллер, 2010 г.)
- ^ (Информационная и коммуникационная система грамотности)
- ^ (Дэвис и Мермельштейн, 1980)
- ^ (Скарборо, 2009)
- ^ (Кэмпбелл, Келли, Маллис, Мартин и Сэйнсбери, 2001, стр.6)
Цитаты
[ редактировать ]- Баума Х. и Боуус Д. (1979). Визуальное распознавание трехбуквенных слов, полученное в результате распознавания составляющих букв» Perception & Psychophysicals 25 (1), 12-22. Получено с http://alexandria.tue.nl/repository/freearticles/734512.pdf.
- Кэмпбелл, младший, Келли, Д.Л., Маллис, И.В.С., Мартин, М.О., и Сэйнсбери, М. (2001). Рамки и спецификации для оценки детей 2001 . (2-е изд., стр. 6). Честнат-Хилл, Массачусетс, США: Международный учебный центр, Педагогическая школа Линча, Бостонский колледж. Получено с http://timssandpirls.bc.edu/pirls2001i/pdf/PIRLS_frame2.pdf.
- Дэвис, С.Б.; Мермельштейн, П. (1980). «Сравнение параметрических представлений для распознавания односложных слов в непрерывно произносимых предложениях». Транзакции IEEE по акустике, речи и обработке сигналов . 28 (4): 357–366. CiteSeerX 10.1.1.462.5073 . дои : 10.1109/tassp.1980.1163420 .
- Эверсон, Мэн (2011). «Распознавание слов среди изучающих китайский язык как иностранный: исследование взаимосвязи между называнием и знанием». Журнал современного языка . 82 (2): 194–204. дои : 10.1111/j.1540-4781.1998.tb01192.x .
- Грейнджер, Дж (1990). «Влияние частоты слов и частоты соседства на лексическое решение и наименование» (PDF) . Журнал памяти и языка . 29 (2): 228–244. дои : 10.1016/0749-596x(90)90074-a .
- Хаук, О.; Дэвис, Миннесота; Форд, М.; Пулвермюллер, Ф.; Марслен-Уилсон, WD (2006). «Временной ход визуального распознавания слов, выявленный с помощью линейного регрессионного анализа данных ERP» (PDF) . НейроИмидж . 30 (4): 1383–1400. doi : 10.1016/j.neuroimage.2005.11.048 . ПМИД 16460964 . S2CID 17367093 .
- Ирвин, Д. (1998). «Лексическая обработка при саккадических движениях глаз». Когнитивная психология . 36 (1): 1–27. дои : 10.1006/cogp.1998.0682 . ПМИД 9679075 . S2CID 25066325 .
- Круденье, К. (2002). Научно-обоснованные принципы обучения чтению базового образования взрослых (Договор № ЭД-01-ПО-1037). Получено с веб-сайта Национального института грамотности: http://lincs.ed.gov/publications/pdf/adult_ed_02.pdf.
- Ларсен, К. (2004, июль). Наука распознавания слов. Advanced Reading Technology, корпорация Microsoft, получено с http://www.microsoft.com/typography/ctfonts/wordrecognition.aspx.
- Информационно-коммуникационная система грамотности. (без даты). Навыки печати (алфавит). Получено с http://lincs.ed.gov/readingprofiles/MC_Word_Recognition.htm. Архивировано 13 мая 2017 г. в Wayback Machine.
- Лакнер, Дж.Л.; Урбах, Дж. (2012). «Беглое чтение и глухие или слабослышащие студенты: синтез исследования». Коммуникативные расстройства Ежеквартально . 33 (4): 230–241. дои : 10.1177/1525740111412582 . S2CID 145617612 .
- Макклелланд, Дж.Л.; Джонстон, Дж. К. (1977). «Роль знакомых единиц в восприятии слов и неслов» (PDF) . Восприятие и психофизика . 22 (3): 249–261. дои : 10.3758/bf03199687 . S2CID 144497014 .
- Мишкин, Мортимер; Форгайс; Дональд (1952). «Распознавание слов как функция или локус сетчатки» . Журнал экспериментальной психологии . 43 (1): 43–48. дои : 10.1037/h0061361 . ПМИД 14907990 .
- Море-Татай, К.; Переа, М. (2011). «Дают ли засечки преимущество в распознавании письменных слов?» (PDF) . Журнал когнитивной психологии . 23 (5): 619–624. дои : 10.1080/20445911.2011.546781 . S2CID 8427809 .
- Назир, Т.А.; Хеллер, Д.; Сассман, К. (1992). «Видимость букв и распознавание слов: оптимальное положение просмотра печатных слов» . Восприятие и психофизика . 52 (3): 315–328. дои : 10.3758/bf03209148 . ПМИД 1408642 .
- Нобре, А.; Труэтт, А.; Маккарти, Г. (1994). «Распознавание слов в нижней височной доле человека» (PDF) . Природа . 372 (6503): 260–3. Бибкод : 1994Natur.372..260N . дои : 10.1038/372260a0 . ПМИД 7969469 . S2CID 11167389 .
- Переа, М; Гомес, П. (2012). «Незначительное увеличение межбуквенного интервала облегчает кодирование слов при обычном чтении» . ПЛОС ОДИН . 7 (10): е47568. Бибкод : 2012PLoSO...747568P . дои : 10.1371/journal.pone.0047568 . ПМЦ 3474730 . ПМИД 23082178 .
- Переаа, М.; Море-Татая, К.; Гомеск, П. (2011). «Влияние межбуквенного расстояния на визуальное распознавание слов». Акта Психологика . 137 (3): 345–351. CiteSeerX 10.1.1.389.137 . дои : 10.1016/j.actpsy.2011.04.003 . ПМИД 21545978 .
- Прибе, С.Дж.; Кинан, Дж. М.; Миллер, AC (2010). «Как предварительные знания влияют на идентификацию и понимание слов» . Чтение и письмо . 7 : 581–6. дои : 10.1007/s11145-010-9260-0 . ПМК 3142886 . ПМИД 21799586 .
- Ранум, О. (1998). «Пространство между словами» Пола Сенгера. Получено с http://www.ranumspanat.com/htmlpages/saenger.html .
- Скарборо, HS (2009). Связь ранней речи и грамотности с более поздними нарушениями чтения (не)способностями: доказательства, теория и практика. В книге Ф. Флетчер-Кэмпбелл, Дж. Солер и Г. Рид (ред.), «Подход к трудностям в развитии грамотности: оценка, педагогика и программы» (1-е изд., стр. 23–38). Получено с https://books.google.com/books?id=sfKpsYBGX2MC&dq=reading&pg=PA23 задержек и языка&ots=rwlKKbBdkp&sig=CfBJDpub7IyfHyf9Et6B9TlpZNk.
- Серено, Южная Каролина; Рейнер, К. (2003). «Измерение распознавания слов при чтении: движения глаз и потенциалы, связанные с событиями». Тенденции в когнитивных науках . 7 (11): 489–493. дои : 10.1016/j.tics.2003.09.010 . PMID 14585445 . S2CID 7156916 .