Jump to content

Перчатка

GloVe , созданный на базе Global Vectors, представляет собой модель распределенного представления слов. Модель представляет собой алгоритм обучения без учителя для получения векторных представлений слов. Это достигается путем отображения слов в значимом пространстве, где расстояние между словами связано с семантическим сходством. [1] слов совпадения Обучение выполняется на основе агрегированной глобальной статистики из корпуса, и полученные представления демонстрируют интересные линейные подструктуры векторного пространства слов . Он разработан как проект с открытым исходным кодом в Стэнфорде. [2] и был запущен в 2014 году. Как модель лог-билинейной регрессии для обучения словесных представлений без учителя, она сочетает в себе особенности двух семейств моделей, а именно методы глобальной матричной факторизации и методов окна локального контекста. [3]

Приложения [ править ]

GloVe можно использовать для поиска связей между такими словами, как синонимы, отношения между компанией и продуктом, почтовые индексы и города и т. д. Однако алгоритм неконтролируемого обучения неэффективен при выявлении омографов, то есть слов с одинаковым написанием и разным значением. Это происходит потому, что алгоритм неконтролируемого обучения вычисляет один набор векторов для слов с одинаковой морфологической структурой. [4] Алгоритм также используется библиотекой SpaCy для создания функций встраивания семантических слов при вычислении слов из верхнего списка, соответствующих таким мерам расстояния, как косинусное сходство и подход евклидова расстояния . [5] GloVe также использовался в качестве структуры представления слов для онлайн- и оффлайн-систем, предназначенных для выявления психологического дистресса во время интервью с пациентами. [1]

См. также [ править ]

Ссылки [ править ]

  1. Перейти обратно: Перейти обратно: а б Абад, Альберто; Ортега, Альфонсо; Тейшейра, Антониу; Матео, Кармен; Хинарехос, Карлос; Пердигао, Фернандо; Батиста, Фернандо; Мамеде, Нуно (2016). Достижения в области речи и языковых технологий для иберийских языков: Третья международная конференция, IberSPEECH 2016, Лиссабон, Португалия, 23-25 ​​ноября 2016 г., Материалы . Чам: Спрингер. п. 165. ИСБН  9783319491691 .
  2. ^ GloVe: Глобальные векторы для представления слов (pdf). Архивировано 3 сентября 2020 г. в Wayback Machine. «Мы используем наши идеи для создания новой модели представления слов, которую мы называем GloVe, для глобальных векторов, потому что фиксируется глобальная статистика корпуса. непосредственно по модели».
  3. ^ Каладжиски, Слободан (2018). Инновации в области ИКТ 2018. Техника и науки о жизни . Чам: Спрингер. п. 220. ИСБН  9783030008246 .
  4. ^ Вениг, Филипп (2019). «Создание вложений предложений на основе тематических представлений слов: подход к универсальному пониманию языка». На пути к науке о данных .
  5. ^ Сингх, Маянк; Гупта, ПК; Тьяги, Випин; Флюссер, Ян; Орен, Тунцер И. (2018). Достижения в области вычислений и наук о данных: Вторая международная конференция, ICACDS 2018, Дехрадун, Индия, 20–21 апреля 2018 г., Пересмотренные избранные статьи . Сингапур: Спрингер. п. 171. ИСБН  9789811318122 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 667f7597d97c359302e419f46a2acc99__1717780200
URL1:https://arc.ask3.ru/arc/aa/66/99/667f7597d97c359302e419f46a2acc99.html
Заголовок, (Title) документа по адресу, URL1:
GloVe - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)