Jump to content

ТаймМЛ

TimeML — это набор правил для электронного кодирования документов. Это определено в спецификации TimeML версии 1.2.1. [1] разработан несколькими усилиями, в значительной степени возглавляемыми Лабораторией лингвистики и вычислительной техники Университета Брандейса .

Цель проекта TimeML — создать стандартный язык разметки для временных событий в документе. TimeML решает четыре проблемы, связанные с разметкой событий, включая отметки времени (с помощью которых событие привязывается ко времени), упорядочивание событий относительно друг друга, рассуждения с использованием контекстуально недостаточно определенных временных выражений и рассуждения о продолжительности событий и их результатах. [2]

TimeML был концептуализирован в 2002 году во время семинаров TERQAS (Распознавание времени и событий для вопросно-ответных систем), организованных профессором Джеймсом Пустейовским из Университета Брандейса . Семинары TERQAS были направлены на решение проблемы того, как улучшить системы ответов на вопросы на естественном языке , чтобы отвечать на временные вопросы о событиях и объектах в новостных статьях. В ходе этих семинаров была определена версия TimeML 1.0 и в качестве иллюстрации создан корпус TimeBank.

В 2003 году мастерские TANGO (TimeML Annotation Graphical Organizer) создали инструмент графических аннотаций для TimeML.

Проект TARSQI (Системы временного осознания и рассуждения для интерпретации вопросов) в настоящее время разрабатывает алгоритмы, которые помечают события и выражения времени в текстах на естественном языке, привязывают их во времени и упорядочивают.

По данным официального сайта TimeML, в настоящее время существует три версии языка спецификации TimeML, хотя ходят слухи, что существуют и другие версии. [3]

Версия 1.1

[ редактировать ]

TimeML версии 1.1 была выпущена в 2004 году.

Версия 1.2

[ редактировать ]

Версия TimeML 1.2 была выпущена в 2004 году, вскоре после выпуска версии 1.1.

Версия 1.2.1

[ редактировать ]

В 2005 году была определена версия 1.2.1. В язык было внесено несколько изменений, которые описаны в руководстве TimeML для версии 1.2.1 как таковые:

  • The Атрибут nf_morph , который был частью MAKEINSTANCE, был изменен на pos (часть речи), а элементы PRESPART, PASTPART и INFINITIVE nf_morph перераспределен на время.
  • Необязательный атрибут синтаксиса был добавлен в SLINK, ALINK и TLINK. Синтаксис может использоваться для хранения CDATA, но обычно используется только программами аннотаций для хранения данных, которые привели к созданию тега.
  • Необязательный атрибут комментария был добавлен ко всем элементам TimeML с целью предоставить (человеческим) аннотаторам место для размещения наблюдений по поводу аннотированного текста.

ISO-TimeML был представлен на рассмотрение ISO в качестве стандарта в августе 2007 года. Затем он был пересмотрен, проголосован и утвержден в качестве международного стандарта к марту 2009 года.

Члены рабочей группы

[ редактировать ]
  • Джеймс Пустейовский из Университета Брандейса (редактор)
  • Роб Гайзаускас
  • Грэм Кац
  • Боб Ингрия
  • Хосе Кастаньо
  • Роза Саури
  • Анна Румшиски
  • Индерджит Мани
  • Антонио Санфилиппо
  • Драгомир Радев
  • Патрик Хэнкс
  • Марк Верхаген
  • Бет Сундхейм
  • Андреа Сетцер
  • Фрэнк Шильдер
  • Джерри Хоббс

Теги TimeML

[ редактировать ]

Следующие теги определены спецификацией TimeML версии 1.2.1. [4]

Тег TIMEML аналогичен корневому тегу в XML-документе. Он заявляет, что остальная часть документа, окруженная тегом TIMEML, закодирована тегами TimeML.

Тег EVENT используется для аннотации тех элементов текста, которые отмечают описываемые им семантические события. Синтаксически СОБЫТИЯ обычно являются глаголами, хотя номиналы событий, такие как «авария» в «... убит в результате аварии», также будут помечены как СОБЫТИЯ. Тег EVENT также используется для аннотирования подмножества состояний в документе. В это подмножество состояний входят те, которые либо являются временными, либо явно отмечены как участвующие во временных отношениях. Дополнительные сведения см. в рекомендациях по аннотациям TimeML.

ТАЙМЭКС3

[ редактировать ]

Тег TIMEX3 в основном используется для разметки явных временных выражений, таких как время, даты, продолжительность и т. д. Он создан по образцу тега TIMEX Setzer (2001), а также TIDES (Ferro и др. (2002)) TIMEX2. ярлык. Поскольку он отличается как по структуре атрибутов, так и по использованию, казалось, лучше всего дать ему отдельное имя, которое раскрывало бы его наследие и в то же время указывало бы на то, что он отличается от своих предшественников.

Тег SIGNAL представляет временной сигнал. Это любые функциислова, которые предполагают определенные временные отношения. Примеры СИГНАЛОВ: когда, в, после .

TLINKS или временные ссылки устанавливают связи между двумя или более событиями с целью их упорядочения во времени. Временные ссылки являются наиболее распространенными, поскольку они показывают, как элементы TimeML (события и временные выражения) связаны во времени друг с другом.

События, помеченные как ASPECTUAL, представляют собой ALINK или Aspectual Link. Эти связи довольно просты, поскольку они возникают только тогда, когда аспектное событие имеет в качестве аргумента другое событие. Например, в предложении «Мария завершила марафон» «завершено» — это аспектное событие, а марафон — это событие.

Как и ALINK, SLINK (подчиненные ссылки) вводятся только определенными классами событий, а именно событиями сообщения, интенсиональными событиями (Я ДЕЙСТВУЮ и Я УТВЕРЖДАЮ) и событиями восприятия. Кроме того, эти события должны подчинять другое событие, принимая его в качестве аргумента. SLINK используются, по существу, для того, чтобы обеспечить временные отношения даже для событий, которые могли произойти или не произойти. Например, сообщение о таких событиях, как «сказал», представляет собой ДОКАЗАТЕЛЬНЫЙ СЛИНК. Рассмотрим предложение «Он даже не остановился», — сказал один из свидетелей». Здесь событие «остановки» подчинено событию «сказанное».

  1. ^ «Спецификация TimeML 1.2.1» . каталог.ldc.upenn.edu . Проверено 29 января 2021 г.
  2. ^ «Язык спецификации TimeML» . cs.brandeis.edu . Проверено 29 января 2021 г.
  3. ^ «Документы TimeML» . www.timeml.org . Архивировано из оригинала 21 июля 2007 года . Проверено 17 января 2022 г.
  4. ^ «Спецификация TimeML 1.2.1» . www.timeml.org . Архивировано из оригинала 8 августа 2007 года . Проверено 17 января 2022 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 841e989888da749abc21cc909b27ebc8__1716529380
URL1:https://arc.ask3.ru/arc/aa/84/c8/841e989888da749abc21cc909b27ebc8.html
Заголовок, (Title) документа по адресу, URL1:
TimeML - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)