Машиночитаемый словарь

Из Википедии, бесплатной энциклопедии

Машиночитаемый словарь ( MRD ) — это словарь , который хранится в виде машиночитаемых данных, а не печатается на бумаге. Это электронный словарь и лексическая база данных .

Машиночитаемый словарь — это словарь в электронной форме, который можно загрузить в базу данных и запрашивать с помощью прикладного программного обеспечения. Это может быть толковый словарь для одного языка или многоязычный словарь для поддержки переводов между двумя или более языками или их комбинацией. Программное обеспечение для перевода между несколькими языками обычно использует двунаправленные словари. MRD может представлять собой словарь с собственной структурой, который запрашивается специальным программным обеспечением (например, онлайн через Интернет), или это может быть словарь с открытой структурой, доступный для загрузки в компьютерные базы данных и, таким образом, его можно использовать с помощью различного программного обеспечения. Приложения. Обычные словари содержат леммы с различными описаниями. Машиночитаемый словарь может иметь дополнительные возможности, поэтому его иногда называют интеллектуальным словарем. Примером умного словаря является словарь английского языка Gellish с открытым исходным кодом .
Термин словарь также используется для обозначения электронного словаря или лексикона , который используется, например, в средствах проверки правописания . Если словари организованы в иерархию понятий (или терминов) подтипов-супертипов, то это называется таксономией . Если она содержит и другие отношения между понятиями, то она называется онтологией . Поисковые системы могут использовать словарь, таксономию или онтологию для оптимизации результатов поиска. Специализированные электронные словари — это морфологические словари или синтаксические словари.

Термин MRD часто противопоставляется словарю НЛП в том смысле, что MRD — это электронная форма словаря, который раньше печатался на бумаге. Напротив, хотя оба термина используются программами, термин «словарь НЛП» предпочтительнее, когда словарь был создан с нуля с учетом НЛП. Стандарт ISO для MRD и NLP способен представлять обе структуры и называется Lexical Markup Framework . [1]

История [ править ]

Первыми широко распространенными MRD были «Седьмой университетский словарь Мерриам-Вебстера» (W7) и «Новый карманный словарь Мерриам-Вебстера» (MPD). Оба были созданы в рамках финансируемого государством проекта System Development Corporation под руководством Джона Олни. Их набирали вручную, поскольку наборных лент ни одной книги не было. Первоначально каждый из них распространялся на нескольких катушках магнитной ленты в виде изображений карточек, где каждое отдельное слово каждого определения было на отдельной перфокарте с многочисленными специальными кодами, указывающими детали его использования в печатном словаре. Олни изложил грандиозный план анализа определений в словаре, но его проект истек, прежде чем анализ удалось провести. Роберт Амслер из Техасского университета в Остине возобновил анализ и завершил таксономическое описание Карманного словаря при финансовой поддержке Национального научного фонда , однако срок его проекта истек до того, как таксономические данные удалось распространить. Рой Берд и др. в IBM Yorktown Heights возобновили анализ Седьмого университетского колледжа Вебстера после работы Амслера. Наконец, в 1980-х годах, начиная с первоначальной поддержки Bellcore, а затем финансируемой различными федеральными агентствами США, включая NSF, ARDA , DARPA , DTO и REFLEX , Джордж Армитидж Миллер и Кристиана Феллбаум из Принстонского университета завершили создание и широкое распространение словаря и его таксономии в проекте WordNet , который сегодня является наиболее широко распространенным ресурсом компьютерной лексикологии.

Ссылки [ править ]

  1. ^ Гил Франкопуло (под редакцией) LMF Lexical Markup Framework, ISTE / Wiley 2013 ( ISBN   978-1-84821-430-9 )