Проверка грамматики
Средство проверки грамматики , с точки зрения вычислений , — это программа или часть программы, которая пытается проверить письменный текст на грамматическую правильность . Средства проверки грамматики чаще всего реализуются как функция более крупной программы, например текстового процессора , но также доступны как отдельное приложение , которое можно активировать из программ, работающих с редактируемым текстом.
Реализация средства проверки грамматики использует обработку естественного языка . [ 1 ] [ 2 ]
История
[ редактировать ]Самыми ранними «программами проверки грамматики» были программы, которые проверяли пунктуацию и несоответствия стиля, а не полный спектр возможных грамматических ошибок. Первая система называлась Writer's Workbench и представляла собой набор инструментов для письма, включенных в системы Unix еще в 1970-х годах. [ 3 ] [ 4 ] Весь пакет Writer's Workbench включал несколько отдельных инструментов для проверки различных проблем с письмом. Инструмент «Диккция» проверял наличие в тексте многословных, банальных, клишированных или неправильно использованных фраз. Инструмент выводит список сомнительных фраз и предлагает предложения по улучшению написания. Инструмент «стиль» анализировал стиль написания данного текста. Он выполнил ряд тестов на читаемость текста и выдал результаты, а также предоставил некоторую статистическую информацию о предложениях текста.
Компания Aspen Software из Альбукерке, штат Нью-Мексико, выпустила самую раннюю версию программы проверки дикции и стиля для персональных компьютеров Grammatik в 1981 году. Grammatik была впервые доступна для Radio Shack — TRS-80 , а вскоре появились версии для CP/M и IBM. ПК . Компания Reference Software International из Сан-Франциско, Калифорния, приобрела Grammatik в 1985 году. Разработка Grammatik продолжалась, и она стала настоящей программой проверки грамматики, которая могла обнаруживать ошибки письма, помимо простой проверки стиля.
Другие ранние программы проверки дикции и стиля включали Punctuation & Style , Correct Grammar , RightWriter и PowerEdit . [ 5 ] Хотя все самые ранние программы начинались как простые программы проверки дикции и стиля, все они в конечном итоге добавили различные уровни языковой обработки и развили некоторый уровень настоящих возможностей проверки грамматики.
До 1992 года программы проверки грамматики продавались как дополнительные программы. В то время существовало большое количество различных программ обработки текста, причем WordPerfect и Microsoft Word занимали лидирующие позиции на рынке. В 1992 году Microsoft решила добавить проверку грамматики в качестве функции Word и лицензировала CorrecText, программу проверки грамматики от Houghton Mifflin , которая еще не продавалась как отдельный продукт. WordPerfect отреагировал на шаг Microsoft, приобретя Reference Software, и прямой потомок Grammatik до сих пор включен в состав WordPerfect.
С 2019 года средства проверки грамматики встроены в такие системы, как Google Docs и Sapling.ai. [ 6 ] расширения для браузера, такие как Grammarly и Qordoba , настольные приложения, такие как Ginger , с открытым исходным кодом, бесплатное программное обеспечение такое как LanguageTool , [ 7 ] и плагины текстового редактора, подобные тем, которые доступны в WebSpellChecker Software.
Технические проблемы
[ редактировать ]Самые ранние программы стиля письма проверяли наличие многословных, банальных , клишированных в тексте или неправильно использованных фраз. Этот процесс был основан на простом сопоставлении с образцом . Сердцем программы был список из многих сотен или тысяч фраз, которые многие эксперты считают плохим написанием. В список сомнительных фраз включены альтернативные формулировки каждой фразы. Программа проверки просто разбивает текст на предложения, проверяет совпадения в словаре фраз, отмечает подозрительные фразы и показывает альтернативу. Эти программы также могут выполнять некоторые механические проверки. Например, они обычно отмечают двойные слова, двойную пунктуацию, некоторые ошибки в использовании заглавных букв и другие простые механические ошибки.
Настоящая проверка грамматики более сложна. Хотя язык программирования имеет очень специфический синтаксис и грамматику, это не относится к естественным языкам . Можно написать довольно полную формальную грамматику для естественного языка, но в реальном использовании обычно бывает так много исключений, что формальная грамматика оказывает минимальную помощь при написании средства проверки грамматики. Одной из наиболее важных частей программы проверки грамматики естественного языка является словарь всех слов языка, а также частей речи каждого слова. Тот факт, что естественное слово может использоваться в качестве любой из нескольких частей речи (например, слово «свободно» используется в качестве прилагательного, наречия, существительного или глагола) значительно увеличивает сложность любой программы проверки грамматики.
Программа проверки грамматики найдет каждое предложение в тексте, найдет каждое слово в словаре, а затем попытается преобразовать предложение в форму, соответствующую грамматике. Используя различные правила, программа затем может обнаруживать различные ошибки, например, согласование времен , чисел, порядка слов и так далее. Также в тексте можно обнаружить некоторые стилистические проблемы. Например, некоторые популярные руководства по стилю, такие как «Элементы стиля», не рекомендуют чрезмерное использование пассивного залога . Специалисты по проверке грамматики могут попытаться идентифицировать пассивные предложения и предложить альтернативу с активным залогом.
Элементы программного обеспечения, необходимые для проверки грамматики, тесно связаны с некоторыми проблемами разработки, которые необходимо решить для программного обеспечения для распознавания речи . При распознавании голоса синтаксический анализ можно использовать, чтобы предсказать, какое слово, скорее всего, имеется в виду, на основе части речи и положения в предложении. При проверке грамматики синтаксический анализ используется для обнаружения слов, которые не соответствуют принятому использованию грамматики.
Недавно, [ когда? ] исследования были сосредоточены на разработке алгоритмов, которые могут распознавать грамматические ошибки на основе контекста окружающих слов. [ нужны разъяснения ]
Критика
[ редактировать ]Программы проверки грамматики считаются своего рода средством письма на иностранном языке , которое не носители языка могут использовать для корректуры своих текстов, поскольку такие программы пытаются выявлять синтаксические ошибки. [ 8 ] Однако, как и в случае с другими компьютеризированными средствами письма, такими как программы проверки орфографии , популярные программы проверки грамматики часто подвергаются критике, когда они не могут обнаружить ошибки и неправильно помечают правильный текст как ошибочный. Лингвист Джеффри К. Пуллум утверждал в 2007 году, что они, как правило, настолько неточны, что приносят больше вреда, чем пользы: «по большей части, если вы примете советы компьютерного специалиста по проверке грамматики в своей прозе, это сделает ее намного хуже, а иногда и до смешного бессвязной. " [ 9 ]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Викрант Бхатеджа; Жоау Мануэль Р.С. Таварес; Б. Падмаджа Рани; В. Камакши Прасад; К. Сруджан Раджу (23 июля 2018 г.). Материалы Второй международной конференции по вычислительному интеллекту и информатике: ICCII 2017 . Спрингер. ISBN 978-981-10-8228-3 .
- ^ Роберт Дейл; Герман Мойсль; Гарольд Сомерс (25 июля 2000 г.). Справочник по обработке естественного языка . ЦРК Пресс. ISBN 978-0-8247-9000-4 .
- ^ «Идеи — О’Рейли Медиа» . www.linuxdevcenter.com .
- ^ «Поваренная книга Linux: советы и методы для повседневного использования — грамматика и справочник» . dsl.org .
- ^ Inc, InfoWorld Media Group (28 октября 1991 г.). Инфомир . InfoWorld Media Group, Inc. с. 68 - через Интернет-архив.
{{cite book}}
:|last=
имеет общее имя ( справка ) - ^ «Sapling | Помощник по написанию ИИ для команд, работающих с клиентами | На 60 % больше предложений | Попробуйте бесплатно» . саженец.ай .
- ^ «Чем проверка грамматики Google Docs отличается от ее альтернатив» . Техреспублика . 4 апреля 2019 г.
- ^ Рамирес Бустаманте, Флора; Санчес Леон, Фернандо (5 августа 1996 г.). «GramCheck: средство проверки грамматики и стиля» (PDF) . Колинг '96: 175–181. arXiv : cmp-lg/9607001 . Бибкод : 1996cmp.lg....7001R . дои : 10.3115/992628.992661 . S2CID 12829285 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Джеффри К. Пуллум (26 октября 2007 г.). «Обезьяны проверят твою грамматику» . Языковой журнал . Проверено 8 марта 2010 г.