Временная аннотация
Временная аннотация — это исследование того, как автоматически добавлять семантическую информацию о времени в документы на естественном языке . Он играет роль в обработке естественного языка и компьютерной лингвистике .
О
[ редактировать ]Временная аннотация предполагает применение семантической аннотации к документу. Важные стандарты временных аннотаций включают TimeML , ISO-TimeML и TIDES . [1] Эти стандарты обычно включают аннотации для некоторых или всех временных выражений (или временных выражений ), событий, временных отношений, временных сигналов, [2] и типы временных отношений.
В текстах на естественном языке события могут быть связаны со временем; например, они могут начинаться или заканчиваться в определенный момент времени. События также связаны с другими событиями, например, происходят до или после них. Мы называем эти отношения временными отношениями. Типизация временных отношений классифицирует отношения между двумя аргументами и является важной и сложной подзадачой определения всей временной информации в документе. Алгебра интервалов Аллена — это одна из схем типов временных отношений. Подходы к временной аннотации , основанные на разработке правил и машинном обучении, оказались успешными, хотя достижение высокой производительности при типизации временных отношений остается сложной задачей.
Приложения
[ редактировать ]Успешная временная аннотация позволяет системам определять, являются ли факты, изложенные в текстах, правдивыми, строить временные рамки, [3] для извлечения планов и обнаружения упоминаний об изменениях. Это нашло применение во многих областях, таких как извлечение информации , цифровая история , [4] обработка социальных сетей и клинический анализ текста .
Оценка
[ редактировать ]Серия задач TempEval устанавливает общую задачу временных аннотаций и запускалась на SemEval трижды, привлекая системные записи со всего мира. [5] [6] [7] Первоначально задача заключалась в определении только типов временных отношений. В TempEval-2 и -3 это расширено за счет включения аннотаций событий и времени. Кроме того, общей задачей клинической оценки i2b2 было упражнение по временной аннотации в 2012 году, которое вызвало большой интерес. [8]
См. также
[ редактировать ]Дальнейшее чтение
[ редактировать ]- Богураев Б. и Андо Р.К. (2005), Анализ текста, соответствующий требованиям TimeML, для временного рассуждения . Труды IJCAI.
- Дерчински, Л. (2013), Определение типов временных отношений в дискурсе , докторская диссертация, Университет Шеффилда .
- Пустейовский и др. (2003), The TimeBank Corpus , Материалы конференции по корпусной лингвистике.
- Пустейовский и др. (2005), Язык спецификации TimeML , в книге «Язык времени». ISBN 9780199268542 .
- УзЗаман Н. и Аллен Дж. (2010), Извлечение событий и временных выражений из необработанного текста: первый шаг к системе, учитывающей время , Международный журнал семантических вычислений 4 (4).
Ссылки
[ редактировать ]- ^ Ферро, Л. (2005). «Стандарт TIDES 2005 для аннотации временных выражений» (PDF) . Технический отчет корпорации MITRE .
- ^ Дерчинский, Л (2011). «Корпусное исследование временных сигналов». Материалы конференции по корпусной лингвистике . arXiv : 1203.5066 .
- ^ Цзи, Хэн (2013). «Решение проблем представления, аннотаций и классификации для временной базы знаний». Журнал знаний и информационных систем .
- ^ Цибульская, А (2011). «Извлечение исторических событий из текста». Материалы 5-го семинара ACL-HLT по языковым технологиям для культурного наследия, социальных и гуманитарных наук .
- ^ Верхаген, Марк (2007). «Задание 15 Semeval-2007: Идентификация временных отношений Tempeval». Материалы семинара по семантической оценке .
- ^ Верхаген, Марк (2010). «Семевал-2010, задание 13: Темпевал-2». Материалы семинара по семантической оценке .
- ^ УзЗаман, Н (2013). «Семевал-2013, задание 1: Темпевал-3». Материалы семинара по семантической оценке .
- ^ Солнце, Вт (2013). «Оценка временных отношений в клиническом тексте: i2b2 Challenge 2012» . Журнал Американской ассоциации медицинской информатики . 20 (5): 806–13. дои : 10.1136/amiajnl-2013-001628 . ПМЦ 3756273 . ПМИД 23564629 .