Перчатка
GloVe , созданный на базе Global Vectors, представляет собой модель распределенного представления слов. Модель представляет собой алгоритм обучения без учителя для получения векторных представлений слов. Это достигается путем отображения слов в значимом пространстве, где расстояние между словами связано с семантическим сходством. [1] слов совпадения Обучение выполняется на основе агрегированной глобальной статистики из корпуса, и полученные представления демонстрируют интересные линейные подструктуры векторного пространства слов . Он разработан как проект с открытым исходным кодом в Стэнфорде. [2] и был запущен в 2014 году. Как модель лог-билинейной регрессии для обучения словесных представлений без учителя, она сочетает в себе особенности двух семейств моделей, а именно методы глобальной матричной факторизации и методов окна локального контекста. [3]
Приложения [ править ]
GloVe можно использовать для поиска связей между такими словами, как синонимы, отношения между компанией и продуктом, почтовые индексы и города и т. д. Однако алгоритм неконтролируемого обучения неэффективен при выявлении омографов, то есть слов с одинаковым написанием и разным значением. Это происходит потому, что алгоритм неконтролируемого обучения вычисляет один набор векторов для слов с одинаковой морфологической структурой. [4] Алгоритм также используется библиотекой SpaCy для создания функций встраивания семантических слов при вычислении слов из верхнего списка, соответствующих таким мерам расстояния, как косинусное сходство и подход евклидова расстояния . [5] GloVe также использовался в качестве структуры представления слов для онлайн- и оффлайн-систем, предназначенных для выявления психологического дистресса во время интервью с пациентами. [1]
См. также [ править ]
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б Абад, Альберто; Ортега, Альфонсо; Тейшейра, Антониу; Матео, Кармен; Хинарехос, Карлос; Пердигао, Фернандо; Батиста, Фернандо; Мамеде, Нуно (2016). Достижения в области речи и языковых технологий для иберийских языков: Третья международная конференция, IberSPEECH 2016, Лиссабон, Португалия, 23-25 ноября 2016 г., Материалы . Чам: Спрингер. п. 165. ИСБН 9783319491691 .
- ^ GloVe: Глобальные векторы для представления слов (pdf). Архивировано 3 сентября 2020 г. в Wayback Machine. «Мы используем наши идеи для создания новой модели представления слов, которую мы называем GloVe, для глобальных векторов, потому что фиксируется глобальная статистика корпуса. непосредственно по модели».
- ^ Каладжиски, Слободан (2018). Инновации в области ИКТ 2018. Техника и науки о жизни . Чам: Спрингер. п. 220. ИСБН 9783030008246 .
- ^ Вениг, Филипп (2019). «Создание вложений предложений на основе тематических представлений слов: подход к универсальному пониманию языка». На пути к науке о данных .
- ^ Сингх, Маянк; Гупта, ПК; Тьяги, Випин; Флюссер, Ян; Орен, Тунцер И. (2018). Достижения в области вычислений и наук о данных: Вторая международная конференция, ICACDS 2018, Дехрадун, Индия, 20–21 апреля 2018 г., Пересмотренные избранные статьи . Сингапур: Спрингер. п. 171. ИСБН 9789811318122 .
Внешние ссылки [ править ]
- GloVe. Архивировано 19 декабря 2016 г. в Wayback Machine.
- Deeplearning4j GloVe. Архивировано 2 февраля 2019 г. в Wayback Machine.