~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ DBD7495A032564D4BE913C442BBEEA45__1712787660 ✰
Заголовок документа оригинал.:
✰ WordNet - Wikipedia ✰
Заголовок документа перевод.:
✰ ВордНет — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/WordNet ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/db/45/dbd7495a032564d4be913c442bbeea45.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/db/45/dbd7495a032564d4be913c442bbeea45__translat.html ✰
Дата и время сохранения документа:
✰ 18.06.2024 22:57:51 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 11 April 2024, at 01:21 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

ВордНет — Википедия Jump to content

ВордНет

Из Википедии, бесплатной энциклопедии
ВордНет
Разработчики) Университет Принстон
Начальная версия середина 1980-х
Стабильная версия
3.1 / июнь 2011 г .; 13 лет назад ( 2011-06 ) [1]
Написано в Пролог
Операционная система Юникс, Линукс, Солярис, Windows
Размер 16 МБ (включая 155 327 слов, организованных в 175 979 синсетов, всего 207 016 смысловых пар)
Доступно в Более 200 языков
Тип Лексическая база данных
Лицензия BSD-подобный
Веб-сайт Wordnet .Принстон .edu

WordNet представляет собой лексическую базу данных семантических отношений между словами , которая связывает слова в семантические отношения, включая синонимы , гипонимы и меронимы . Синонимы сгруппированы в синсеты с краткими определениями и примерами использования. Таким образом, его можно рассматривать как комбинацию и расширение словаря и тезауруса . Хотя он доступен пользователям-человекам через веб-браузер , [2] его основное использование — автоматический анализ текста и приложения искусственного интеллекта . Впервые он был создан на английском языке. [3] а английская база данных WordNet и программные инструменты были выпущены под лицензией типа BSD и доступны для бесплатной загрузки с этого веб-сайта WordNet. Сейчас сети WordNets существуют более чем на 200 языках. [4]

История и члены команды [ править ]

WordNet был впервые создан в 1985 году только на английском языке в когнитивных наук Лаборатории Принстонского университета под руководством психологии профессора Джорджа Армитиджа Миллера . Позже режиссером фильма стала Кристиан Феллбаум . Первоначально проект финансировался Управлением военно-морских исследований США, а затем и другими правительственными агентствами США, включая DARPA , Национальный научный фонд , Управление прорывных технологий (ранее Управление перспективных исследований и разработок) и REFLEX. Джордж Миллер и Кристиан Феллбаум получили в 2006 году премию Антонио Замполли за работу с WordNet.

Глобальная ассоциация WordNet — это некоммерческая организация, которая предоставляет платформу для обсуждения, обмена и объединения сетей WordNet для всех языков мира. Кристиана Фельбаум и Пик Т.Й.М. Воссен являются ее сопрезидентами. [5]

Содержимое базы данных [ править ]

Пример записи «Гамбургер» в WordNet

База данных содержит 155 327 слов, организованных в 175 979 синсетов , что в общей сложности составляет 207 016 пар слов; в сжатом около 12 мегабайт . виде он имеет размер [6]

Он включает в себя лексические категории существительные , глаголы , прилагательные и наречия, но игнорирует предлоги , определители и другие служебные слова.

Слова из одной и той же лексической категории, являющиеся примерно синонимами, группируются в синсеты , которые включают в себя простые слова, а также словосочетания , такие как «поесть вне дома» и «автобаза». Различные значения многозначной словоформы относятся к разным синсетам. Значение синсета дополнительно поясняется с помощью краткого определяющего толкования и одного или нескольких примеров использования. Пример синсета прилагательных:

хороший, правильный, спелый – (наиболее подходящий или подходящий для определенной цели; «хорошее время для посадки помидоров»; «подходящее время для действий»; «настало время для великих социологических перемен»)

Все синсеты связаны семантическими отношениями. Эти отношения, которые не все характерны для всех лексических категорий, включают:

  • Существительные
    • гиперним : Y является гипернимом X , если каждый X является (видом) Y ( собака является гипернимом собаки )
    • гипоним : Y является гипонимом X , если каждый Y является (видом) X ( собака — это гипоним слова «собака» )
    • Координатный термин : Y является координатным термином X , если X и Y имеют общий гиперним ( волк — это координатный термин слова «собака» , а «собака» — координатный термин слова «волк» )
    • холоним : Y является холонимом X , если X является частью Y ( здание является холонимом окна )
    • мероним : Y является меронимом X , если Y является частью X ( окно — это мероним здания )
  • Глаголы
    • гиперним : глагол Y является гипернимом глагола X , если деятельность X представляет собой (вид) Y ( воспринимать — гипероним слова слушать )
    • тропоним : глагол Y является тропонимом глагола X, если действие Y выполняет X каким-либо образом ( шепелявить — тропоним слова говорить )
    • следствие : глагол Y влечет за собой глагол X , если, делая X, вы должны делать Y ( спать влечет за собой храп )
    • Координационный термин : глагол Y является координатным термином глагола X , если X и Y имеют общий гиперним ( шепелявить - это координатный термин для кричать , а кричать - это координатный термин для шепелявить )

Эти семантические отношения сохраняются между всеми членами связанных синсетов. Отдельные члены синсета (слова) также могут быть связаны лексическими отношениями. Например, (в одном смысле) существительное «директор» связано (в одном смысле) с глаголом «прямой», от которого оно образовано, посредством «морфосемантической» связи.

Морфологические функции программного обеспечения, распространяемого вместе с базой данных, пытаются вывести или основу слова из лемму ввода пользователя. Неправильные формы сохраняются в списке, и при поиске «ate» возвращается, например, «eat».

Структура знаний [ править ]

И существительные, и глаголы организованы в иерархии, определяемые гиперонима или IS A. отношениями Например, одно значение слова «собака» соответствует иерархии гиперонимов; слова на том же уровне представляют членов синсета. Каждый набор синонимов имеет уникальный индекс.

  • собака, домашняя собака, Canis familiaris
    • собачий, псовый
      • плотоядное животное
        • плацентарный, плацентарные млекопитающие, плацентарные млекопитающие, плацентарные млекопитающие
          • млекопитающее
            • позвоночное животное, краниатный
              • хордовые
                • животное, животное существо, зверь, животное, существо, фауна
                  • ...

На верхнем уровне эти иерархии организованы в 25 начальных «деревьев» для существительных и 15 для глаголов ( они называются лексикографическими файлами на начальном уровне ). Все они связаны с уникальным синсетом для начинающих, «сущностью». Иерархия существительных гораздо глубже, чем иерархия глаголов.

Прилагательные не организованы в иерархические деревья. Вместо этого два «центральных» антонима, таких как «горячий» и «холодный», образуют бинарные полюса, в то время как «спутниковые» синонимы, такие как «дымящийся» и «холодный», соединяются со своими соответствующими полюсами посредством отношений «сходства». Таким образом, прилагательные можно представить как «гантели», а не как «деревья».

Психолингвистические аспекты [ править ]

Первоначальной целью проекта WordNet было создание лексической базы данных, которая бы соответствовала теориям семантической памяти человека, разработанным в конце 1960-х годов. Психологические эксперименты показали, что говорящие организовали свои знания концепций по экономической иерархической схеме. Время извлечения информации, необходимое для доступа к концептуальным знаниям, по-видимому, напрямую связано с количеством иерархий, которые говорящему необходимо «пройти», чтобы получить доступ к знаниям. Таким образом, выступающие могли быстрее убедиться в том, что канарейки умеют петь, поскольку канарейки являются певчими птицами, но им требовалось немного больше времени, чтобы убедиться в том, что канарейки умеют летать (где им нужно было получить доступ к понятию «птица» на вышестоящем уровне) и еще больше времени, чтобы убедиться, что канарейки умеют петь. проверить, есть ли у канареек кожа (требуется поиск по нескольким уровням гипонимии, вплоть до «животное»). [7] Хотя такие психолингвистические эксперименты и лежащие в их основе теории подвергались критике, некоторые организации WordNet согласуются с экспериментальными данными. Например, аномическая афазия избирательно влияет на способность говорящих произносить слова из определенной семантической категории, иерархии WordNet. Антонимические прилагательные (центральные прилагательные WordNet в структуре гантели) встречаются гораздо чаще, чем случайно, и этот факт справедлив для многих языков.

Как лексическая онтология [ править ]

WordNet иногда называют онтологией, и это настойчивое утверждение, которого не делают его создатели. Отношения гиперонимов и гипонимов между синсетами существительных можно интерпретировать как отношения специализации между концептуальными категориями. Другими словами, WordNet можно интерпретировать и использовать как лексическую онтологию в смысле информатики . Однако перед использованием такую ​​онтологию следует исправить, поскольку она содержит сотни основных семантических несоответствий; например, существуют (i) общие специализации для исключительных категорий и (ii) дублирование в иерархии специализаций. Более того, преобразование WordNet в лексическую онтологию, пригодную для представления знаний, обычно также должно включать (i) разграничение отношений специализации на отношения subtypeOf и instanceOf и (ii) связывание интуитивно понятных уникальных идентификаторов с каждой категорией. Хотя такие исправления и преобразования были выполнены и задокументированы в рамках интеграции WordNet 1.7 в совместно обновляемую базу знаний WebKB-2, [8] большинство проектов, заявляющих о повторном использовании WordNet для приложений, основанных на знаниях (обычно для поиска информации, ориентированной на знания), просто повторно используют его напрямую.

WordNet также был преобразован в формальную спецификацию с помощью гибридной методологии «снизу вверх» и «сверху вниз» для автоматического извлечения из нее ассоциативных отношений и интерпретации этих ассоциаций в терминах набора концептуальных отношений, формально определенных в основополагающей онтологии DOLCE . [9]

В большинстве работ, утверждающих, что WordNet интегрирован в онтологии, содержание WordNet не просто корректировалось, когда это казалось необходимым; вместо этого он был сильно переосмыслен и обновлен, когда это было необходимо. Так было, например, при реструктуризации онтологии верхнего уровня WordNet. [10] согласно подходу, основанному на OntoClean , или когда он использовался в качестве первоисточника для построения нижних классов онтологии SENSUS.

Ограничения [ править ]

Наиболее широко обсуждаемое ограничение WordNet (и связанных с ним ресурсов, таких как ImageNet ) заключается в том, что некоторые семантические отношения больше подходят для конкретных концепций, чем для абстрактных концепций. [11] Например, легко создать отношения гипонимов/гипернимов, чтобы отразить, что « хвойное дерево » — это тип « дерева », «дерево» — это тип « растения », а «растение» — это тип « организма ». «, но сложно классифицировать такие эмоции, как «страх» или «счастье», на одинаково глубокие и четко определенные гипонимно-гиперонимические отношения.

Многие концепции в WordNet специфичны для определенных языков, и наиболее точное сопоставление между языками составляет 94%. [12] Синонимы, гипонимы, меронимы и антонимы встречаются во всех языках, в которых есть WordNet, но другие семантические отношения зависят от языка. [13] Это ограничивает совместимость между языками. Однако это также делает WordNet ресурсом для выявления и изучения различий между языками, поэтому это не обязательно является ограничением для всех случаев использования.

WordNet не включает информацию об этимологии или произношении слов и содержит лишь ограниченную информацию об использовании. WordNet стремится охватить большинство повседневных слов и не включает в себя много терминологии, специфичной для предметной области.

WordNet — это наиболее часто используемый вычислительный лексикон английского языка для устранения смысловой неоднозначности (WSD), задачи, направленной на присвоение слов в тексте соответствующих контексту значений (т. е. членов синсета). [14] Однако утверждалось, что WordNet кодирует слишком мелкие смысловые различия. Эта проблема не позволяет системам WSD достичь уровня производительности, сравнимого с уровнем производительности людей, которые не всегда соглашаются, когда сталкиваются с задачей выбора смысла из словаря, соответствующего слову в контексте. Проблема детализации была решена путем предложения методов кластеризации , которые автоматически группируют схожие значения одного и того же слова. [15] [16] [17]

Оскорбительный контент [ править ]

WordNet включает слова, которые могут быть восприняты как уничижительные или оскорбительные. [18] Интерпретация слова может меняться со временем и между социальными группами , поэтому WordNet не всегда может определить слово как « уничижительное » или «оскорбительное» изолированно. Поэтому люди, использующие WordNet, должны применять свои собственные методы для определения оскорбительных или уничижительных слов.

Однако это ограничение справедливо и для других лексических ресурсов, таких как словари и тезаурусы , которые также содержат уничижительные и оскорбительные слова. Некоторые словари указывают слова, которые являются уничижительными , но не включают все контексты, в которых слова могут быть приемлемыми или оскорбительными для различных социальных групп. Поэтому люди, использующие словари, должны применять свои собственные методы для выявления всех оскорбительных слов.

Лицензионные и WordNets сети открытые

Некоторые сети слов впоследствии были созданы для других языков. В опросе 2012 года перечислены словесные сети и их доступность. [19] Стремясь пропагандировать использование сетей WordNet, глобальное сообщество WordNet постепенно перелицензировало свои сети WordNet на открытый домен, где исследователи и разработчики могут легко получать доступ к сетям WordNet и использовать их в качестве языковых ресурсов для предоставления онтологических и лексических знаний при обработке естественного языка. (НЛП) задачи.

Открытая многоязычная сеть WordNet [20] обеспечивает доступ к открытым лицензированным сетям Wordnet на различных языках, все из которых связаны с Princeton Wordnet of English (PWN). Цель состоит в том, чтобы упростить использование сетей Wordnet на нескольких языках.

Приложения [ править ]

WordNet использовался для ряда целей в информационных системах, включая устранение смысловой неоднозначности слов , поиск информации , автоматическую классификацию текста , автоматическое обобщение текста , машинный перевод и даже автоматическое создание кроссвордов.

Обычно WordNet используется для определения сходства между словами. Были предложены различные алгоритмы, в том числе измерение расстояния между словами и синсетами в структуре графа WordNet, например, путем подсчета количества ребер среди синсетов. Интуиция подсказывает, что чем ближе два слова или синсета, тем ближе их значение. Ряд алгоритмов сходства слов на основе WordNet реализован в пакете Perl под названием WordNet::Similarity. [21] и в пакете Python под названием NLTK . [22] Другие более сложные методы сходства на основе WordNet включают ADW, [23] реализация которого доступна на Java . WordNet также можно использовать для связывания других словарей. [24]

Интерфейсы [ править ]

Принстон ведет список связанных проектов. [25] который включает ссылки на некоторые широко используемые интерфейсы прикладного программирования, доступные для доступа к WordNet с использованием различных языков программирования и сред.

Связанные проекты и расширения [ править ]

WordNet подключен к нескольким базам данных Семантической сети . WordNet также часто используется повторно посредством сопоставлений между синсетами WordNet и категориями из онтологий. Чаще всего сопоставляются только категории верхнего уровня WordNet.

WordNet ассоциация Глобальная

Глобальная ассоциация WordNet (GWA) [26] — это общественная и некоммерческая организация, которая предоставляет платформу для обсуждения, обмена и объединения сетей Wordnet для всех языков мира. GWA также способствует стандартизации сетей слов на разных языках, чтобы обеспечить единообразие при перечислении синсетов на человеческих языках. GWA ведет список сетей Wordnet, разработанных по всему миру. [27]

Другие языки [ править ]

  • Арабский WordNet : [28] [29] WordNet для арабского языка.
  • Арабская онтология — лингвистическая онтология, имеющая ту же структуру, что и wordnet, и сопоставленная с ней.
  • Проект БалкаНет [30] создала сети WordNets для шести европейских языков (болгарского, чешского, греческого, румынского, турецкого и сербского). Для этого проекта был разработан свободно доступный редактор WordNet на основе XML. Этот редактор – VisDic – больше не находится в активной разработке, но все еще используется для создания различных сетей WordNet. Его преемник, DEBVisDic, представляет собой клиент-серверное приложение и в настоящее время используется для редактирования нескольких сетей WordNet (голландский в проекте Cornetto, польский, венгерский, несколько африканских языков, китайский).
  • BulNet — это болгарская версия WordNet, разработанная на кафедре компьютерной лингвистики Института болгарского языка Болгарской академии наук. [31]
  • CWN (Китайская сеть Wordnet или китайская словарная сеть) при поддержке Национального университета Тайваня . [32]
  • ЕвроВордНет Проект [33] создал WordNets для нескольких европейских языков и связал их вместе; Однако они не доступны в свободном доступе. Проект Global Wordnet пытается координировать создание и объединение «сетей слов» для всех языков. [34] Oxford University Press , издатель Оксфордского словаря английского языка , озвучил планы по созданию собственного онлайн-конкурента WordNet. [ нужна цитата ]
  • FinnWordNet — это финская версия WordNet, в которой были переведены все записи оригинального английского WordNet. [35]
  • GermaNet — это немецкая версия WordNet, разработанная Тюбингенским университетом. [36]
  • ИндоВордНет [37] представляет собой связанную лексическую базу знаний 18 зарегистрированных языков Индии, а именно ассамского , бенгальского , бодо , гуджарати , хинди , каннада , кашмири , конкани , малаялам , мейтей (манипури), маратхи , непальского , одиа , пенджаби , санскрита , Тамильский , телугу и урду
  • JAWS (просто еще одно подмножество WordNet), еще одна французская версия WordNet. [38] построено с использованием Викисловаря и семантических пространств
  • WordNet Bahasa : WordNet для малайского и индонезийского языков, разработанный Технологическим университетом Наньян .
  • Малаялам WordNet , разработанный Кочинским университетом науки и технологий . [39]
  • Многоязычный центральный репозиторий (MCR) интегрирует в одну и ту же структуру Wordnet сети EuroWordNet с испанского, каталонского, баскского, галисийского и португальского языков, а также с английского. [40]
  • Проект MultiWordNet, [41] многоязычная WordNet, направленная на создание итальянской WordNet, тесно связанной с Princeton WordNet.
  • OpenDutchWordNet, [42] это голландская лексико-семантическая база данных.
  • OpenWN-PT — это бразильско-португальская версия оригинального WordNet, которую можно бесплатно загрузить по лицензии CC-BY-SA. [43]
  • plWordNet [44] — это польскоязычная версия WordNet, разработанная Вроцлавским технологическим университетом .
  • ПолНет [45] представляет собой польскоязычную версию WordNet, разработанную Университетом Адама Мицкевича в Познани (распространяется под лицензией CC BY-NC-ND 3.0).

Такие проекты, как BalkaNet и EuroWordNet, сделали возможным создание автономных сетей Word, связанных с исходной сетью. Двумя такими проектами были российский WordNet, патронируемый Петербургским государственным университетом путей сообщения. [46] и под руководством С.А. Яблонского, [47] и Русснет, [48] Санкт -Петербургского государственного университета .

  • UWN — это автоматически создаваемая многоязычная база лексических знаний, расширяющая WordNet и позволяющая охватить более миллиона слов на многих разных языках. [49]
  • WOLF (WordNet Libre du Français), французская версия WordNet. [50]

Связанные данные [ править ]

  • БабельНет , [51] очень большая многоязычная семантическая сеть с миллионами концепций, полученных путем интеграции WordNet и Wikipedia с использованием алгоритма автоматического сопоставления.
  • Онтология СУМО [52] имеет полное ручное картографирование [1] [53] между всеми синсетами WordNet и всеми SUMO (включая его онтологии предметной области, когда WordNet содержит смысл слова для данного термина SUMO), который доступен для просмотра, например, [2] .
  • ОпенЦик , [54] открытая онтологий и база знаний повседневного здравого смысла, содержащая 12 000 терминов, связанных с наборами синонимов WordNet.
  • СЛАДКИЙ , [55] — это первый модуль библиотеки фундаментальных онтологий WonderWeb (WFOL). Эта верхняя онтология была разработана в свете строгих онтологических принципов, вдохновленных философской традицией, с четкой ориентацией на язык и познание. ОнтоВордНет [56] является результатом экспериментального согласования верхнего уровня WordNet с DOLCE. Предполагается, что такое согласование может привести к созданию «онтологически подслащенной» WordNet, которая должна быть концептуально более строгой, когнитивно прозрачной и эффективной для использования в нескольких приложениях.
  • ДБпедия , [57] база данных структурированной информации, связанная с WordNet.
  • Расширенная сеть WordNet [58] — это проект Техасского университета в Далласе , целью которого является улучшение WordNet путем семантического анализа глосс, что делает информацию, содержащуюся в этих определениях, доступной для автоматических систем обработки знаний. Он доступен бесплатно по лицензии, аналогичной лицензии WordNet.
  • был В рамках проекта GCIDE создан словарь путем объединения общедоступного словаря Вебстера 1913 года с некоторыми определениями WordNet и материалами, предоставленными добровольцами. Он был выпущен под с авторским левом лицензией GPL .
  • ImageNet — это база данных изображений, организованная в соответствии с иерархией WordNet (в настоящее время только существительные), в которой каждый узел иерархии представлен миллионами изображений. [59] В настоящее время он имеет в среднем более 500 изображений на узел.
  • BioWordnet, биомедицинское расширение Wordnet, было заброшено из-за проблем со стабильностью версий. [60]
  • WikiTax2WordNet, сопоставление синсетов WordNet и категорий Википедии . [61]
  • WordNet++ — ресурс, включающий более миллиона семантических ребер, взятых из Википедии и соединяющий пары синсетов WordNet. [62]
  • SentiWordNet, ресурс для поддержки приложений для анализа мнений, полученный путем маркировки всех синсетов WordNet 3.0 в соответствии с их предполагаемой степенью позитивности, негативности и нейтральности. [63]
  • ColorDict — это приложение Android для мобильных телефонов, использующих базы данных Wordnet и другие базы данных, например Wikipedia.
  • UBY-LMF — база данных из 10 ресурсов, включая WordNet.

Связанные проекты [ править ]

  • FrameNet — это лексическая база данных, которая имеет некоторое сходство с WordNet и ссылается на него.
  • Структура лексической разметки (LMF) — это стандарт ISO, определенный в ISO/TC37 для определения общей стандартизированной структуры для создания словарей, включая WordNet. Подмножество LMF для Wordnet называется Wordnet-LMF. Реализация была сделана в рамках проекта КИОТО. [64]
  • Программа UNL — проект под эгидой ООН, направленный на объединение лексикосемантических данных многих языков для использования в системах машинного перевода и извлечения информации .
  • Meaning Monkey — бесплатный онлайн-словарь, основанный на базе данных WordNet.
  • Dictionary.video — это видеословарь, посвященный произношению. Его текстовая часть расширена из WordNet.

Распределения [ править ]

База данных WordNet распространяется как пакет словарей (обычно один файл) для следующего программного обеспечения:

См. также [ править ]

Ссылки [ править ]

  1. ^ «Новости ВордНет» .
  2. ^ «Поиск в WordNet — 3.1» .
  3. ^ Г. А. Миллер, Р. Беквит, К. Д. Феллбаум, Д. Гросс, К. Миллер. 1990. WordNet: лексическая онлайн-база данных. Межд. Дж. Лексикограф. 3, 4, стр. 235–244.
  4. ^ «Сети WordNet в мире» . Глобальная ассоциация WordNet . Проверено 19 января 2020 г.
  5. ^ «О Глобальной ассоциации WordNet» . Глобальная сеть WordNet . Проверено 19 января 2020 г.
  6. ^ «Статистика Ворднета» . Wordnet.princeton.edu . Проверено 22 июня 2018 г.
  7. ^ Коллинз А., Куиллиан М.Р. 1972. Эксперименты по семантической памяти и пониманию языка. В познании в обучении и памяти . Уайли, Нью-Йорк.
  8. ^ «Интеграция WordNet 1.7 в WebKB-2» . Вебкб.орг . Проверено 11 марта 2014 г.
  9. ^ Гангеми, А.; Навильи, Р.; Веларди, П. (2003). Проект OntoWordNet: расширение и аксиоматизация концептуальных отношений в WordNet (PDF) . Катания, Сицилия (Италия). стр. 820–838. {{cite book}}: |work= игнорируется ( помощь ) CS1 maint: отсутствует местоположение издателя ( ссылка )
  10. ^ Олтрамари, А.; Гангеми, А.; Гуарино, Н.; Масоло, К. (2002). Реструктуризация верхнего уровня WordNet: подход OntoClean . Семинар OntoLex'2, Онтологии и лексические базы знаний (LREC 2002). Лас-Пальмас, Испания. стр. 17–26. CiteSeerX   10.1.1.19.6574 .
  11. ^ Рудницка, Ева; Бонд, Фрэнсис; Грабовский, Лукаш; Пясецкий, Мацей; Пиотровский, Тадеуш (2018). «Лексический взгляд на сопоставление Wordnet с Wordnet». Материалы 9-й Глобальной конференции WordNet (GWC 2018) : 210.
  12. ^ Бонд, Фрэнсис; Фостер, Райан (2013). «Связывание и расширение открытой многоязычной сети Wordnet» (PDF) . Материалы 51-го ежегодного собрания Ассоциации компьютерной лингвистики : 1352–1362 . Проверено 20 января 2020 г.
  13. ^ Феллбаум, Кристиана; Воссен, Пик (2012). «Проблемы многоязычной сети слов». Языковые ресурсы и оценка . 46 (2): 313–326. дои : 10.1007/s10579-012-9186-z . S2CID   10117946 .
  14. ^ Р. Навильи. Устранение неоднозначности в смысле слова: опрос , ACM Computing Surveys , 41 (2), 2009, стр. 1–69.
  15. ^ Э. Агирре, О. Лопес. 2003. Кластеризация смыслов слов WordNet. В Proc. Конференции по последним достижениям в области естественного языка (RANLP'03) , Боровец, Болгария, стр. 121–130.
  16. ^ Р. Навильи. Значимая кластеризация смыслов помогает повысить эффективность устранения неоднозначности в смысле слова , в учеб. 44-го ежегодного собрания Ассоциации компьютерной лингвистики, совместного с 21-й Международной конференцией по компьютерной лингвистике (COLING-ACL 2006) , Сидней, Австралия, 17–21 июля 2006 г., стр. 105–112.
  17. ^ Р. Сноу, С. Пракаш, Д. Джурафски, AY Ng. 2007. Учимся объединять смыслы слов , В учеб. Объединенной конференции 2007 г. по эмпирическим методам обработки естественного языка и вычислительному изучению естественного языка (EMNLP-CoNLL) , Прага, Чешская Республика, стр. 1005–1014.
  18. ^ Вонг, Джулия Кэрри (18 сентября 2019 г.). «Вирусное приложение для селфи ImageNet Roulette казалось забавным, пока оно не назвало меня расистским оскорблением» . хранитель . Проверено 14 октября 2022 г.
  19. ^ Фрэнсис Бонд и Кёнхи Пайк 2012a. Обзор ворднетов и их лицензий . В материалах 6-й глобальной конференции WordNet (GWC 2012). Мацуэ. 64–71
  20. ^ «Открытая многоязычная сеть Wordnet» . Compling.hss.ntu.edu.sg . Проверено 10 апреля 2018 г.
  21. ^ «Тед Педерсен — WordNet::Сходство» . Д.умн.еду. 16 июня 2008 г. Проверено 11 марта 2014 г.
  22. ^ НЛП с использованием Python NLTK /
  23. ^ М.Т. Пилевар, Д. Юргенс и Р. Навильи. Выравнивание, устранение неоднозначности и обход: унифицированный подход к измерению семантического сходства. . Учеб. 51-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2013), София, Болгария, 4–9 августа 2013 г., стр. 1341-1351.
  24. ^ Баллаторе А. и др. (2014). «Связывание географических словарей через WordNet». Анналы ГИС . 20 (2): 73–84. arXiv : 1404.5372 . Бибкод : 2014АнГИС..20...73Б . дои : 10.1080/19475683.2014.904440 . S2CID   9246582 .
  25. ^ «Связанные проекты — WordNet — Связанные проекты» . Wordnet.princeton.edu. 06.01.2014 . Проверено 22 июня 2018 г.
  26. ^ Глобальная ассоциация WordNet (4 февраля 2010 г.). «globalwordnet.org» . globalwordnet.org . Проверено 11 марта 2014 г.
  27. ^ «Сети Wordnet в мире» . Архивировано из оригинала 21 октября 2011 г.
  28. ^ Блэк В., Элькатеб С., Родригес Х., Альхалифа М., Воссен П., Пиз А., Бертран М., Феллбаум К., (2006) Арабский проект WordNet, Труды LREC 2006
  29. ^ Лахсен Абуэнур, Карим Бузубаа, Паоло Россо (2013) Об оценке и улучшении охвата и удобства использования арабской WordNet, Языковые ресурсы и оценка 47 (3), стр. 891–917
  30. ^ Д. Туфис, Д. Кристеа, С. Стаму. 2004. Балканет: Цели, методы, результаты и перспективы. Общий обзор . Румынский J. Sci. Тех. Поставить в известность. (Специальный выпуск «Балканета») , 7 (1–2), стр. 9–43.
  31. ^ «БулНет» . dcl.bas.bg. ​ Проверено 7 мая 2015 г.
  32. ^ Официальная страница китайского Wordnet в Национальном тайваньском университете
  33. ^ П. Воссен, Эд. 1998. EuroWordNet: Многоязычная база данных с лексико-семантическими сетями. Клювер, Дордрехт, Нидерланды.
  34. ^ «Глобальная ассоциация WordNet» . Globalwordnet.org. 04 февраля 2010 г. Проверено 5 января 2014 г.
  35. ^ «FinnWordNet - Финский WordNet - Кафедра общего языкознания» . Ling.helsinki.fi . Проверено 5 января 2014 г.
  36. ^ «ГермаНет» . Sfs.uni-tuebingen.de . Проверено 11 марта 2014 г.
  37. ^ Пушпак Бхаттачария, IndoWordNet, Конференция по разработке лексических ресурсов 2010 (LREC 2010), Мальта, май 2010 г.
  38. ^ К. Мутон, Г. де Шалендар. 2010. JAWS: Еще одно подмножество WordNet . В Proc. ТАЛН 2010 .
  39. ^ Веб-сайт
  40. ^ «MCR 3.0 | Адимен» . Adimen.si.ehu.es . Проверено 21 марта 2022 г.
  41. ^ Э. Пианта, Л. Бентивольи, К. Жирарди. 2002. MultiWordNet: Разработка согласованной многоязычной базы данных . В Proc. 1-й Международной конференции по глобальной сети WordNet , Майсур, Индия, стр. 21–25.
  42. ^ «Открытая голландская WordNet» . Wordpress.let.vupr.nl. 28 октября 2015 г. Проверено 21 марта 2022 г.
  43. ^ «arademaker/openWordnet-PT — GitHub» . Гитхаб.com . Проверено 5 января 2014 г.
  44. ^ официальная веб-страница
  45. ^ официальная веб-страница
  46. ^ «Русский WordNet» . Pgups.ru . Проверено 5 января 2014 г.
  47. ^ Балкова Валентина; Сухоногов Андрей; Яблонский, Сергей (2003). «Русский WordNet: от UML-нотации к реализации баз данных в Интернете/Интранете» (PDF) . Материалы GWC 2004 : 31–38 . Проверено 12 марта 2017 г.
  48. ^ "RussNet: Главная страница" . Project.phil.spbu.ru . Retrieved 2014-03-11 .
  49. ^ «UWN: На пути к универсальной многоязычной сети Wordnet - D5: Базы данных и информационные системы (Институт Макса Планка по информатике)» . Mpi-inf.mpg.de. 14 августа 2011 г. Проверено 5 января 2014 г.
  50. ^ С. Бенуа, Ф. Дарья. 2008. Создание бесплатной французской сети слов на основе многоязычных ресурсов . В Proc. Ontolex 2008 , Марракеш, Марокко.
  51. ^ Р. Навильи, С.П. Понцетто. BabelNet: построение очень большой многоязычной семантической сети . Учеб. 48-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2010), Уппсала, Швеция, 11–16 июля 2010 г., стр. 216–225.
  52. ^ И. Найлз, А. Пиз, 2001. К стандартной верхней онтологии: большая онтология для семантической сети и ее приложений . В материалах 2-й Международной конференции по формальной онтологии в информационных системах (FOIS-2001) ,
  53. ^ И. Найлс, А. Пиз 2003. Связывание лексиконов и онтологий: сопоставление WordNet с предлагаемой верхней объединенной онтологией , в материалах Международной конференции IEEE по разработке информации и знаний , стр. 412-416.
  54. ^ С. Рид и Д. Ленат. 2002. Отображение онтологий в Cyc . В Proc. Семинар конференции AAAI 2002 по онтологиям для семантической сети , Эдмонтон, Канада, 2002 г.
  55. ^ Масоло, К., Борго, С., Гангеми, А., Гуарино, Н., Олтрамари, А., Шнайдер, Л.С. 2002. Результат WonderWeb D17. Библиотека фундаментальных онтологий WonderWeb и онтология DOLCE . Отчет (версия 2.0, 15.08.2002)
  56. ^ Гангеми, А., Гуарино, Н., Масоло, К., Олтрамари, А. 2003. Улучшение WordNet с помощью DOLCE . В журнале AI Magazine 24 (3): осень 2003 г., стр. 13–24
  57. ^ К. Бизер, Дж. Леманн, Г. Кобиларов, С. Ауэр, К. Беккер, Р. Циганиак, С. Хеллманн, DBpedia — точка кристаллизации Сети данных . Веб-семантика, 7 (3), 2009 г., стр. 154–165.
  58. ^ С.М. Харабаджиу, Г.А. Миллер, Д.И. Молдаванин. 1999. WordNet 2 – Морфологически и семантически расширенный ресурс . В Proc. семинара ACL SIGLEX: Стандартизация лексических ресурсов , стр. 1–8.
  59. ^ Дж. Денг, В. Донг, Р. Сочер, Л. Ли, К. Ли, Л. Фей-Фей. ImageNet: крупномасштабная иерархическая база данных изображений . В Proc. конференции IEEE 2009 г. по компьютерному зрению и распознаванию образов
  60. ^ М. Попрат, Э. Байсвангер, У. Хан. 2008. Создание BIOWORDNET с использованием форматов данных WORDNET и инфраструктуры программного обеспечения WORDNET – история неудач . В Proc. семинара по разработке программного обеспечения, тестированию и обеспечению качества обработки естественного языка , стр. 31–39.
  61. ^ С. Понцетто, Р. Навильи. Крупномасштабное картирование таксономии для реструктуризации и интеграции Википедии , в учеб. 21-й Международной совместной конференции по искусственному интеллекту (IJCAI 2009) , Пасадена, Калифорния, 14–17 июля 2009 г., стр. 2083–2088.
  62. ^ С. П. Понцетто, Р. Навильи. Богатые знания Word Sense Disambiguation, конкурирующие с контролируемыми системами . В Proc. 48-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL), 2010 г., стр. 1522–1531.
  63. ^ С. Баччанелла, А. Эсули и Ф. Себастьяни. SentiWordNet 3.0: расширенный лексический ресурс для анализа настроений и анализа мнений . В материалах 7-й конференции по языковым ресурсам и оценке (LREC'10), Валлетта, Монтана, 2010, стр. 2200–2204.
  64. ^ Пик Воссен, Клаудия Сория, Моника Монакини: Wordnet-LMF: стандартное представление многоязычных сетей Wordnet, в LMF Lexical Markup Framework , под редакцией Гиля Франкопуло ISTE / Wiley 2013 ( ISBN   978-1-84821-430-9 )
  65. ^ «Вавилон WordNet» . Babylon.com . Проверено 11 марта 2014 г.
  66. ^ «GoldenDict — просмотрите /словари на Sourceforge.net» . Sourceforge.net. 01.12.2010 . Проверено 5 января 2014 г.
  67. ^ «Лингоэс ВордНет» . Lingoes.net. 16 ноября 2007 г. Проверено 11 марта 2014 г.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: DBD7495A032564D4BE913C442BBEEA45__1712787660
URL1:https://en.wikipedia.org/wiki/WordNet
Заголовок, (Title) документа по адресу, URL1:
WordNet - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)