Распознавание слов

Из Википедии, бесплатной энциклопедии

Распознавание слов , согласно Информационной и коммуникационной системе грамотности (LINCS), — это «способность читателя правильно и практически без усилий распознавать написанные слова». Его иногда называют «распознаванием изолированных слов», поскольку оно предполагает способность читателя распознавать слова по отдельности из списка, не нуждаясь в похожих словах для контекстуальной помощи. [1] LINCS продолжает утверждать, что «быстрое и легкое распознавание слов является основным компонентом беглого чтения», и объясняет, что эти навыки можно улучшить, «практикуясь с карточками , списками и таблицами слов».

В своем обзоре науки обучения чтению в 1990 году психолог Мэрилин Джагер Адамс написала, что «единственный непреложный и необязательный факт об умелом чтении заключается в том, что оно предполагает относительно полную обработку отдельных печатных букв». [2] В статье «Наука распознавания слов» говорится, что «данные последних 20 лет работы в области когнитивной психологии указывают на то, что мы используем буквы внутри слова, чтобы распознать слово». Со временем были выдвинуты другие теории, предлагающие механизмы, с помощью которых слова распознаются изолированно, но одновременно быстро и точно. [3] Эти теории больше фокусируются на значении отдельных букв и распознавании формы букв (например, распознавании последовательных букв и распознавании параллельных букв). Другие факторы, такие как саккадические движения глаз и линейная связь между буквами, также влияют на то, как мы распознаем слова. [4]

В статье в ScienceDaily говорится, что «раннее распознавание слов является ключом к навыкам чтения на протяжении всей жизни». [5] Существуют разные способы развития этих навыков. Например, создание карточек со словами, которые появляются с высокой частотой, считается инструментом преодоления дислексии . [6] Утверждалось, что просодия — образцы ритма и звука, используемые в поэзии , — может улучшить распознавание слов. [7]

Распознавание слов — это способ чтения, основанный на непосредственном восприятии того, какое слово представляет собой знакомая группа букв. Этот процесс существует в отличие от фонетики и анализа слов как другой метод распознавания и вербализации визуального языка (т.е. чтения). [8] Распознавание слов осуществляется преимущественно автоматически. С другой стороны, фонетика и анализ слов основаны на когнитивном применении изученных грамматических правил для смешивания букв, звуков, графем и морфем .

Распознавание слов измеряется скоростью: слово с высоким уровнем распознавания читается быстрее, чем новое. [3] Такой способ тестирования предполагает, что не требуется понимание значения читаемых слов, а скорее умение распознавать их таким образом, чтобы обеспечить правильное произношение. Таким образом, контекст неважен, и распознавание слов часто оценивается по словам, представленным изолированно в таких форматах, как флэш-карточки. [8] Тем не менее, легкость распознавания слов, как и беглость речи , обеспечивает навыки, способствующие пониманию читаемого текста. [9]

Внутренняя ценность распознавания слов может быть очевидна из-за преобладания грамотности в современном обществе. Однако его роль может быть менее заметной в областях обучения грамоте, изучению второго языка и задержек в развитии чтения. Поскольку распознавание слов становится более понятным, могут быть открыты более надежные и эффективные формы обучения как для детей, так и для взрослых, изучающих грамотность на родном языке. Такая информация может также принести пользу изучающим второй язык, поскольку они освоят новые слова и буквенные символы. [10] Кроме того, лучшее понимание процессов, связанных с распознаванием слов, может позволить разработать более конкретные методы лечения людей с ограниченными возможностями чтения.

Теории [ править ]

Форма Боума [ править ]

Форма Боума, названная в честь голландского исследователя зрения Германа Баумы , относится к общему контуру или форме слова. [11] Герман Баума обсуждал роль «глобальной формы слова» в своем эксперименте по распознаванию слов, проведенном в 1973 году. [12] Теории формы бумы стали популярными в распознавании слов, предполагая, что люди узнают слова по форме, которую буквы образуют в группе относительно друг друга. [3] Это противоречит идее, что буквы читаются индивидуально. Вместо этого, благодаря предварительному воздействию, люди знакомятся с контурами и, таким образом, узнают их в следующий раз, когда им предлагают то же самое слово, или бума.

Более медленный темп, с которым люди читают слова, написанные полностью заглавными буквами или с чередованием прописных и строчных букв, подтверждает теорию бума. [3] Теория утверждает, что новая форма бумы, созданная путем замены строчных букв на прописные, препятствует способности человека запоминать. Джеймс Кеттелл также поддержал эту теорию в своем исследовании, которое доказало эффект, который он назвал превосходством слов. Это относилось к улучшенной способности людей различать буквы, если буквы были представлены внутри слова, а не как смесь случайных букв. Более того, многочисленные исследования показали, что читатели с меньшей вероятностью заметят слова с ошибками, имеющие похожую форму бума, чем слова с ошибкой, имеющие другую форму бума.

Хотя эти эффекты последовательно воспроизводились, многие из их выводов были оспорены. Некоторые предполагают, что способность читать слова в верхнем регистре обусловлена ​​количеством практики, которую человек имеет с ними. Люди, которые практикуются, быстрее читают слова в верхнем регистре, что противоречит важности бума. Кроме того, по мнению психологов Джеймса Макклелланда и Джеймса Джонсона, эффект словесного превосходства может быть результатом знакомства с фонетическими комбинациями букв, а не с очертаниями слов. [13]

Параллельное распознавание распознавания против последовательного

Распознавание параллельных букв сегодня является наиболее широко принятой психологами моделью распознавания слов. [3] В этой модели все буквы внутри группы воспринимаются одновременно для распознавания слов. Напротив, модель последовательного распознавания предполагает, что буквы распознаются индивидуально, одна за другой, прежде чем интегрироваться для распознавания слов. Он предсказывает, что отдельные буквы идентифицируются быстрее и точнее, чем несколько букв вместе, как в слове. Однако эта модель была отвергнута, поскольку она не может объяснить эффект превосходства слов , который гласит, что читатели могут быстрее и точнее идентифицировать буквы в контексте слова, а не изолированно.

Нейронные сети [ править ]

Более современный подход к распознаванию слов был основан на недавних исследованиях функционирования нейронов. [3] Считается, что визуальные аспекты слова, такие как горизонтальные и вертикальные линии или кривые, активируют рецепторы, распознающие слова. От этих рецепторов посылаются нервные сигналы, которые либо возбуждают, либо подавляют связи с другими словами в памяти человека. Слова, символы которых соответствуют визуальному представлению наблюдаемого слова, получают возбуждающие сигналы. По мере того, как разум далее обрабатывает появление слова, тормозящие сигналы одновременно уменьшают активацию слов в памяти, имеющих непохожий внешний вид. Это нейронное усиление связей с соответствующими буквами и словами, а также одновременное ослабление ассоциаций с нерелевантными в конечном итоге активирует правильное слово как часть распознавания слова в нейронной сети.

Физиологическая основа [ править ]

Мозг [ править ]

Используя позитронно-эмиссионную томографию (ПЭТ) и потенциалы, связанные с событиями , исследователи обнаружили две отдельные области в веретенообразной извилине , которые специфически реагируют на строки букв. Задняя веретенообразная извилина реагирует на слова и неслова, независимо от их смыслового контекста. [14] На переднюю веретенообразную извилину влияет семантический контекст, а также то, являются ли комбинации букв словами или псевдословами (новые комбинации букв, имитирующие фонетические соглашения, например шинг). Эта роль передней веретенообразной извилины может коррелировать с более высокой обработкой концепции и значения слова. Обе эти области отличаются от областей, которые реагируют на другие типы сложных стимулов, таких как лица или цветные узоры, и являются частью функционально специализированного вентрального пути. В течение 100 миллисекунд (мс) после фиксации слова область левой нижневисочной коры обрабатывает его поверхностную структуру. Семантическая информация начинает обрабатываться через 150 мс и свидетельствует о широко распространенной активации кортикальной сети. Через 200 мс происходит интеграция различных видов информации. [15]

Точность, с которой читатели распознают слова, зависит от стимулируемой области сетчатки. [16] Чтение на английском языке выборочно тренирует определенные области левого полушария сетчатки для обработки этого типа зрительной информации, делая эту часть зрительного поля оптимальной для распознавания слов. По мере того как слова выходят из этой оптимальной области, точность распознавания слов снижается. Благодаря такому обучению в соответствующем левом полушарии головного мозга развивается эффективная нервная организация . [16]

глаз фиксации Саккадические движения и

Глаза совершают короткие, незаметные движения, называемые саккадами, примерно три-четыре раза в секунду. [17] Саккады разделены фиксациями — моментами, когда глаза неподвижны. Во время саккад снижается зрительная чувствительность, что называется саккадическим подавлением. Это гарантирует, что большая часть восприятия зрительной информации происходит во время фиксаций. Однако лексическая обработка продолжается во время саккад. Время и точность распознавания слов зависят от того, на каком месте слова в данный момент фиксируется глаз. Распознавание происходит быстрее и точнее при фиксации в середине слова. Это происходит из-за снижения остроты зрения, в результате чего буквы располагаются дальше от фиксированного места и их становится труднее увидеть. [18]

Частотные эффекты

Эффект частоты слов предполагает, что слова, которые чаще всего встречаются в печатном языке, легче распознать, чем слова, которые встречаются реже. [19] Распознавание этих слов происходит быстрее и точнее, чем других слов. Эффект частоты слов является одним из наиболее надежных и наиболее часто встречающихся эффектов в современной литературе по распознаванию слов. Это сыграло роль в развитии многих теорий, таких как форма бума . Кроме того, эффект частоты соседства гласит, что распознавание слов происходит медленнее и менее точно, если у цели есть орфографический сосед, частота которого выше его самой. Орфографические соседи — это слова одинаковой длины, отличающиеся только одной буквой этого слова. [19]

Реальные приложения [ править ]

Межбуквенный интервал [ править ]

Шрифты с засечками , то есть: шрифты с небольшими придатками в конце штрихов, затрудняют лексический доступ. происходит быстрее Распознавание слов при использовании шрифтов без засечек в среднем на 8 мс. [20] Эти шрифты имеют значительно больший межбуквенный интервал, и исследования показали, что ответы на слова с увеличенным межбуквенным интервалом были быстрее, независимо от частоты и длины слова. [21] Это демонстрирует обратную зависимость между продолжительностью фиксации и небольшим увеличением межбуквенного расстояния. [22] скорее всего, из-за снижения латерального торможения в нейронной сети. [20] Когда буквы расположены дальше друг от друга, более вероятно, что люди сосредоточат свою фиксацию в начале слов, тогда как интервал между буквами по умолчанию в программном обеспечении для обработки текста способствует фиксации в центре слов. [22]

Инструменты и измерения [ править ]

И ПЭТ, и функциональная магнитно-резонансная томография (фМРТ) используются для изучения активации различных частей мозга, пока участники выполняют задачи, связанные с чтением. [23] Однако магнитоэнцефалография (МЭГ) и электроэнцефалография (ЭЭГ) обеспечивают более точные временные измерения, записывая потенциалы, связанные с событиями, каждую миллисекунду. Хотя определение места возникновения электрических реакций может быть проще с помощью МЭГ, ЭЭГ является более распространенной формой исследования распознавания слов. Потенциалы, связанные с событиями, помогают измерить как силу, так и задержку активности мозга в определенных областях во время чтения. Кроме того, сочетая полезность потенциалов, связанных с событиями, с мониторингом движений глаз, исследователи могут коррелировать фиксации во время чтения с распознаванием слов в мозгу в режиме реального времени. Поскольку саккады и фиксации указывают на распознавание слов, электроокулография (ЭОГ) используется для измерения движений глаз и количества времени, необходимого для лексического доступа к целевым словам. Это было продемонстрировано исследованиями, в которых более длинные и менее распространенные слова вызывают более длительную фиксацию, а более мелкие и менее важные слова могут вообще не фиксироваться во время чтения предложения.

Обучение [ править ]

По данным веб-сайта LINCS, роль распознавания слов приводит к различиям между привычками взрослых и привычками детей, которые учатся читать. [8] Многие неграмотные взрослые, обучающиеся чтению, больше полагаются на распознавание слов, чем на акустику и анализ слов. Плохие читатели, имеющие предварительные знания о целевых словах, могут распознавать слова и делать меньше ошибок, чем плохие читатели, не имеющие предварительных знаний. [24] Вместо того, чтобы смешивать звуки отдельных букв, взрослые учащиеся с большей вероятностью будут распознавать слова автоматически. [8] Однако это может привести к ошибкам, когда похожее по написанию, но другое слово ошибочно принимается за слово, знакомое читателю. Считается, что подобные ошибки происходят из-за опыта и воздействия учащегося. Младшие и новые учащиеся, как правило, больше сосредотачиваются на выводах из текста и меньше полагаются на базовые знания или опыт. Плохие читатели с предварительным знанием используют семантические аспекты слова, тогда как опытные читатели полагаются только на графическую информацию для распознавания слова. [24] Однако практика и улучшение навыков, как правило, приводят к более эффективному использованию сочетания навыков чтения и базовых знаний для эффективного распознавания слов. [8]

Роль частотного эффекта была широко включена в процесс обучения. [8] Хотя метод анализа слов чрезвычайно полезен, многие слова не имеют правильных грамматических структур и легче включаются в лексическую память благодаря автоматическому распознаванию слов. Чтобы облегчить это, многие эксперты в области образования подчеркивают важность повторения при изучении слов. При этом используется эффект частоты, увеличивая знакомство читателя с целевым словом и тем самым улучшая как будущую скорость, так и точность чтения. Это повторение может осуществляться в форме карточек, отслеживания слов, чтения вслух, изображения слова и других форм практики, которые улучшают связь визуального текста с запоминанием слов. [25]

Роль технологий [ править ]

Развитие технологий во многом способствовало прогрессу в понимании и исследованиях распознавания слов. Новые возможности распознавания слов сделали компьютерные программы обучения более эффективными и надежными. [8] Усовершенствованная технология позволила отслеживать саккадические движения глаз людей во время чтения. Это способствовало пониманию того, как определенные модели движений глаз улучшают распознавание и обработку слов. Более того, изменения могут быть одновременно внесены в текст, находящийся за пределами зоны внимания читателя, без ведома читателя. Это дало больше информации о том, на чем фокусируется взгляд, когда человек читает, и где проходят границы внимания.

Обладая этой дополнительной информацией, исследователи предложили новые модели распознавания слов, которые можно запрограммировать в компьютерах. В результате компьютеры теперь могут имитировать то, как человек будет воспринимать язык и новые слова и реагировать на них. [8] Эта технология продвинулась до такой степени, что модели обучения грамоте могут быть продемонстрированы в цифровом формате. Например, компьютер теперь может имитировать прогресс обучения ребенка и устанавливать общие языковые правила, когда ему предоставляется список слов с ограниченным количеством объяснений. Тем не менее, поскольку ни одна универсальная модель еще не согласована, возможность обобщения моделей распознавания слов и их моделирования может быть ограничена. [26]

Несмотря на отсутствие консенсуса относительно параметров моделирования, любой прогресс в области распознавания слов будет полезен для будущих исследований относительно того, какие стили обучения могут быть наиболее успешными в классах. Также существует корреляция между способностью к чтению, развитием разговорной речи и неспособностью к обучению. Таким образом, достижения в любой из этих областей могут способствовать пониманию взаимосвязанных вопросов. [27] В конечном счете, развитие распознавания слов может способствовать прорыву между «учиться читать» и «чтением, чтобы учиться». [28]

Ссылки [ править ]

  1. ^ «Стратегии оценки и профили чтения» . Архивировано из оригинала 13 мая 2017 г. Проверено 4 декабря 2011 г.
  2. ^ Адамс, Мэрилин Джагер (1990). Начинаем читать: думаем и учимся печати . Кембридж: MIT Press. п. 105 . ISBN  978-0-262-51076-9 .
  3. ^ Перейти обратно: а б с д Это ж (Ларсен, 2004 г.)
  4. ^ «Наука распознавания слов» . Майкрософт .
  5. ^ «Раннее распознавание слов является ключом к навыкам чтения на протяжении всей жизни, говорит новое исследование» . www.sciencedaily.com . Проверено 9 января 2017 г.
  6. ^ «Навыки распознавания слов на флэш-картах при дислексии» . Архивировано из оригинала 22 декабря 2016 г. Проверено 4 декабря 2011 г.
  7. ^ ftp://128.46.154.21/harper/muri/Chen_PDSR_SP04.pdf [ постоянная мертвая ссылка ]
  8. ^ Перейти обратно: а б с д Это ж г час (Бакалея, 2002)
  9. ^ (Люкнер и Урбах, 2012)
  10. ^ (Эверсон, 2011)
  11. ^ (Ранум, 1998)
  12. ^ (Бума и Боухаус, 1979)
  13. ^ (Макклелланд и Джонстон, 1977)
  14. ^ (Ноубл, Труетт и Маккарти, 1994)
  15. ^ (Хаук, Дэвис, Форд, Пулвермюллер и Марслен-Уилсон, 2006)
  16. ^ Перейти обратно: а б (Mishkin, Mortimer, Forgays & Donald, 1952)
  17. ^ (Ирвин, 1998)
  18. ^ (Назир, Хеллер и Сассман, 1992 г.)
  19. ^ Перейти обратно: а б (Грейнджер, 1990)
  20. ^ Перейти обратно: а б (Морет-Татай и Переа, 2011 г.)
  21. ^ (Переаа, Морет-Татая и Гомес, 2011)
  22. ^ Перейти обратно: а б (Переа и Гомес, 2012 г.)
  23. ^ (Серено и Рейнер, 2003)
  24. ^ Перейти обратно: а б (Прибе, Кинан и Миллер, 2010 г.)
  25. ^ (Информационная и коммуникационная система грамотности)
  26. ^ (Дэвис и Мермельштейн, 1980)
  27. ^ (Скарборо, 2009)
  28. ^ (Кэмпбелл, Келли, Маллис, Мартин и Сэйнсбери, 2001, стр.6)

Цитаты [ править ]