ТаймМЛ
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
TimeML — это набор правил для электронного кодирования документов. Это определено в спецификации TimeML версии 1.2.1. [1] разработан несколькими усилиями, в значительной степени возглавляемыми Лабораторией лингвистики и вычислительной техники Университета Брандейса .
Цель проекта TimeML — создать стандартный язык разметки для временных событий в документе. TimeML решает четыре проблемы, связанные с разметкой событий, включая отметки времени (с помощью которых событие привязывается ко времени), упорядочивание событий относительно друг друга, рассуждения с использованием контекстуально недостаточно определенных временных выражений и рассуждения о продолжительности событий и их результатах. [2]
История
[ редактировать ]TimeML был концептуализирован в 2002 году во время семинаров TERQAS (Распознавание времени и событий для вопросно-ответных систем), организованных профессором Джеймсом Пустейовским из Университета Брандейса . Семинары TERQAS были направлены на решение проблемы того, как улучшить системы ответов на вопросы на естественном языке , чтобы отвечать на временные вопросы о событиях и объектах в новостных статьях. В ходе этих семинаров была определена версия TimeML 1.0 и в качестве иллюстрации создан корпус TimeBank.
В 2003 году мастерские TANGO (TimeML Annotation Graphical Organizer) создали инструмент графических аннотаций для TimeML.
Проект TARSQI (Системы временного осознания и рассуждения для интерпретации вопросов) в настоящее время разрабатывает алгоритмы, которые помечают события и выражения времени в текстах на естественном языке, привязывают их во времени и упорядочивают.
Версии
[ редактировать ]По данным официального сайта TimeML, в настоящее время существует три версии языка спецификации TimeML, хотя ходят слухи, что существуют и другие версии. [3]
Версия 1.1
[ редактировать ]TimeML версии 1.1 была выпущена в 2004 году.
Версия 1.2
[ редактировать ]Версия TimeML 1.2 была выпущена в 2004 году, вскоре после выпуска версии 1.1.
Версия 1.2.1
[ редактировать ]В 2005 году была определена версия 1.2.1. В язык было внесено несколько изменений, которые описаны в руководстве TimeML для версии 1.2.1 как таковые:
- The Атрибут nf_morph , который был частью MAKEINSTANCE, был изменен на pos (часть речи), а элементы PRESPART, PASTPART и INFINITIVE nf_morph перераспределен на время.
- Необязательный атрибут синтаксиса был добавлен в SLINK, ALINK и TLINK. Синтаксис может использоваться для хранения CDATA, но обычно используется только программами аннотаций для хранения данных, которые привели к созданию тега.
- Необязательный атрибут комментария был добавлен ко всем элементам TimeML с целью предоставить (человеческим) аннотаторам место для размещения наблюдений по поводу аннотированного текста.
ISO-TimeML
[ редактировать ]ISO-TimeML был представлен на рассмотрение ISO в качестве стандарта в августе 2007 года. Затем он был пересмотрен, проголосован и утвержден в качестве международного стандарта к марту 2009 года.
Члены рабочей группы
[ редактировать ]- Джеймс Пустейовский из Университета Брандейса (редактор)
- Роб Гайзаускас
- Грэм Кац
- Боб Ингрия
- Хосе Кастаньо
- Роза Саури
- Анна Румшиски
- Индерджит Мани
- Антонио Санфилиппо
- Драгомир Радев
- Патрик Хэнкс
- Марк Верхаген
- Бет Сундхейм
- Андреа Сетцер
- Фрэнк Шильдер
- Джерри Хоббс
Теги TimeML
[ редактировать ]Следующие теги определены спецификацией TimeML версии 1.2.1. [4]
ВРЕМЯМЛ
[ редактировать ]Тег TIMEML аналогичен корневому тегу в XML-документе. Он заявляет, что остальная часть документа, окруженная тегом TIMEML, закодирована тегами TimeML.
СОБЫТИЕ
[ редактировать ]Тег EVENT используется для аннотации тех элементов текста, которые отмечают описываемые им семантические события. Синтаксически СОБЫТИЯ обычно являются глаголами, хотя номиналы событий, такие как «авария» в «... убит в результате аварии», также будут помечены как СОБЫТИЯ. Тег EVENT также используется для аннотирования подмножества состояний в документе. В это подмножество состояний входят те, которые либо являются временными, либо явно отмечены как участвующие во временных отношениях. Дополнительные сведения см. в рекомендациях по аннотациям TimeML.
ТАЙМЭКС3
[ редактировать ]Тег TIMEX3 в основном используется для разметки явных временных выражений, таких как время, даты, продолжительность и т. д. Он создан по образцу тега TIMEX Setzer (2001), а также TIDES (Ferro и др. (2002)) TIMEX2. ярлык. Поскольку он отличается как по структуре атрибутов, так и по использованию, казалось, лучше всего дать ему отдельное имя, которое раскрывало бы его наследие и в то же время указывало бы на то, что он отличается от своих предшественников.
СИГНАЛ
[ редактировать ]Тег SIGNAL представляет временной сигнал. Это любые функциислова, которые предполагают определенные временные отношения. Примеры СИГНАЛОВ: когда, в, после .
ТЛИНК
[ редактировать ]TLINKS или временные ссылки устанавливают связи между двумя или более событиями с целью их упорядочения во времени. Временные ссылки являются наиболее распространенными, поскольку они показывают, как элементы TimeML (события и временные выражения) связаны во времени друг с другом.
ССЫЛКА
[ редактировать ]События, помеченные как ASPECTUAL, представляют собой ALINK или Aspectual Link. Эти связи довольно просты, поскольку они возникают только тогда, когда аспектное событие имеет в качестве аргумента другое событие. Например, в предложении «Мария завершила марафон» «завершено» — это аспектное событие, а марафон — это событие.
СЛИНК
[ редактировать ]Как и ALINK, SLINK (подчиненные ссылки) вводятся только определенными классами событий, а именно событиями сообщения, интенсиональными событиями (Я ДЕЙСТВУЮ и Я УТВЕРЖДАЮ) и событиями восприятия. Кроме того, эти события должны подчинять другое событие, принимая его в качестве аргумента. SLINK используются, по существу, для того, чтобы обеспечить временные отношения даже для событий, которые могли произойти или не произойти. Например, сообщение о таких событиях, как «сказал», представляет собой ДОКАЗАТЕЛЬНЫЙ СЛИНК. Рассмотрим предложение «Он даже не остановился», — сказал один из свидетелей». Здесь событие «остановки» подчинено событию «сказанное».
Ссылки
[ редактировать ]- ^ «Спецификация TimeML 1.2.1» . каталог.ldc.upenn.edu . Проверено 29 января 2021 г.
- ^ «Язык спецификации TimeML» . cs.brandeis.edu . Проверено 29 января 2021 г.
- ^ «Документы TimeML» . www.timeml.org . Архивировано из оригинала 21 июля 2007 года . Проверено 17 января 2022 г.
- ^ «Спецификация TimeML 1.2.1» . www.timeml.org . Архивировано из оригинала 8 августа 2007 года . Проверено 17 января 2022 г.