Jump to content

ЭЛМО

Архитектура ЭЛМо. Сначала он обрабатывает входные токены во внедренные векторы с помощью слоя внедрения (по сути, таблицы поиска), затем применяет пару прямых и обратных LSTM для создания двух последовательностей скрытых векторов, затем применяет еще одну пару прямых и обратных LSTM и так далее.
Как токен последовательно преобразуется на возрастающих уровнях ELMo. Вначале токен преобразуется в вектор с помощью линейного слоя, что дает вектор внедрения . На следующем уровне прямой LSTM создает скрытый вектор. , в то время как обратный LSTM создает еще один скрытый вектор . На следующем уровне два LSTM производят и , и так далее.

ELMo ( встраивание из языковой модели ) — метод встраивания слов для представления последовательности слов в виде соответствующей последовательности векторов. [1] Его создали исследователи из Института искусственного интеллекта Аллена . [2] и Вашингтонского университета и впервые выпущен в феврале 2018 года. Это двунаправленный LSTM , который принимает на входе уровень символов и создает встраивания на уровне слов.

Архитектура

[ редактировать ]

ELMo — это многоуровневый двунаправленный LSTM поверх слоя внедрения токена. Вывод всех LSTM, объединенных вместе, состоит из внедрения токена. Поскольку полное внедрение слишком велико, оно обычно отображается через обучаемую линейную матрицу («матрицу проекции») для создания внедрения для конкретной задачи.

После обучения модели ELMo ее вектор замораживается. Затем матрица проекции обучается, чтобы минимизировать потери при выполнении конкретной языковой задачи. Это ранний пример предварительной подготовки .

Сравнение

[ редактировать ]

Подобно BERT (но в отличие от встраивания слов, созданного с помощью подходов « мешок слов » и более ранних векторных подходов, таких как Word2Vec и GloVe ), встраивания ELMo контекстно-зависимы, создавая разные представления для слов, которые имеют одинаковое написание, но имеют разные значения ( омонимы ), такие как «банк» в «берег реки» и «банковский баланс». [3]

Инновации ELMo связаны с использованием двунаправленных языковых моделей. В отличие от своих предшественников, эти модели обрабатывают язык в прямом и обратном направлениях. Рассматривая весь контекст слова, двунаправленные модели обеспечивают более полное понимание его значения. Этот целостный подход к языковому представлению позволяет ELMo кодировать тонкие значения, которые могут быть упущены в однонаправленных моделях. [4]

  1. ^ Петерс М.Е., Нейман М., Айер М., Гарднер М., Кларк С., Ли К., Зеттлмойер Л. (2018). «Глубокие контекстуализированные представления слов». arXiv : 1802.05365 [ cs.CL ].
  2. ^ «AllenNLP — ELMo — Институт искусственного интеллекта Аллена» .
  3. ^ «Как использовать ELMo Embedding в архитектуре двунаправленной модели LSTM?» . www.insofe.edu.in . 11 февраля 2020 г. Проверено 4 апреля 2023 г.
  4. ^ Ван Оттен, Нери (26 декабря 2023 г.). «Вложения из языковых моделей (ELMo): контекстные внедрения — мощный сдвиг в НЛП» .


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 209f47f5bc4aa1fe6d8e261c95de1816__1722018000
URL1:https://arc.ask3.ru/arc/aa/20/16/209f47f5bc4aa1fe6d8e261c95de1816.html
Заголовок, (Title) документа по адресу, URL1:
ELMo - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)