РУМЯНА (метрическая)

ROUGE , или дублер, ориентированный на припоминание, для Gisting Evaluation , ^[1] — это набор показателей и пакет программного обеспечения, используемый для оценки программного обеспечения автоматического реферирования и машинного перевода при обработке естественного языка . Метрики сравнивают автоматически созданное резюме или перевод со ссылкой или набором ссылок (созданными людьми) с резюме или переводом. Показатели ROUGE варьируются от 0 до 1, причем более высокие баллы указывают на большее сходство между автоматически созданным резюме и ссылкой.

Метрики

Доступны следующие пять показателей оценки.

РУЖ-N: перекрытие n-грамм ^[2] между системой и справочными сводками.
- ROUGE-1 относится к перекрытию униграмм (каждого слова) между системой и справочными сводками.
- ROUGE-2 относится к перекрытию биграмм между системой и справочными сводками.
ROUGE-L: Самая длинная общая подпоследовательность (LCS) ^[3] на основе статистики. Задача о самой длинной общей подпоследовательности естественным образом учитывает сходство структуры на уровне предложения и автоматически определяет самые длинные совпадающие в последовательности n-граммы.
ROUGE-W: Взвешенная статистика на основе LCS, отдающая предпочтение последовательным LCS.
РУЖ-С: Пропустить- биграмма ^[3] на основе статистики совместной встречаемости. Скип-биграмма — это любая пара слов в порядке их предложения.
РУЖ-СУ: статистика совместного появления на основе пропуска-биграммы и униграммы.

См. также

Ссылки

Внешние ссылки

[1] Лин, Чин-Ю. 2004. ROUGE: пакет для автоматической оценки резюме. В материалах семинара по разветвлениям обобщения текста (WAS 2004), Барселона, Испания, 25–26 июля 2004 г.

[2] Лин, Чин-Ю и Э. Х. Хови, 2003. Автоматическая оценка сводок с использованием статистики совместного появления N-грамм. В материалах конференции по языковым технологиям 2003 г. (HLT-NAACL 2003), Эдмонтон, Канада, 27 мая - 1 июня 2003 г.

[lin-acl-2004-3] Перейти обратно: ^а ^б Лин, Чин-Ю и Франц Йозеф Ох. 2004. Автоматическая оценка качества машинного перевода с использованием статистики наибольшей общей подпоследовательности и пропускной биграммы. В материалах 42-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2004), Барселона, Испания, 21–26 июля 2004 г.

[1]

[2]

[3]