Анусаараака
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
![]() | |
Написано в | КЛИПЫ, Python, Perl, C, C++ |
---|---|
Операционная система | Совместимость с POSIX |
Доступно в | английский-хинди |
Тип | Машинный перевод |
Лицензия | Стандартная общественная лицензия GNU |
Веб-сайт | https://ltrc.iiit.ac.in/Anusaaraka/anu_home.html |
Anusaaraka — это программное обеспечение для доступа (перевода) с английского на хинди, в котором используются алгоритмы, заимствованные из . Аштадхьяи (грамматических правил) Панини [ 1 ] [ 2 ] Программное обеспечение разрабатывается Международным фондом Чинмая (CIF). [ 3 ] в Международном институте информационных технологий в Хайдарабаде (IIIT-H) и Хайдарабадского университета . на факультете санскритских исследований [ 4 ] Анусаарака рассматривается как сочетание традиционных передовых индийских шастр и передовых современных технологий.
Anusaaraka предназначена для того, чтобы предоставить пользователям доступ к тексту на любом индийском языке после перевода с исходного языка (т. е. английского или любого другого регионального индийского языка). [ 5 ] В сегодняшний информационный век большие объемы информации доступны на английском языке – будь то информация для конкурсных экзаменов или информация для общего чтения. Многие люди, чьим основным языком является хинди или любой другой индийский язык, не могут получить доступ к информации на английском языке. Anusaaraka стремится преодолеть этот языковой барьер, позволяя пользователю ввести английский текст в Anusaaraka и прочитать его на индийском языке по своему выбору.
Анусаарака получила свое название от санскритского слова «анусаран», что означает «следовать». Это так называется, потому что переведенный результат Анусаараки появляется в слоях – то есть последовательность шагов, которые следуют друг за другом, пока окончательный перевод не будет показан пользователю.
Функции
[ редактировать ]Достоверное представление текста на исходном языке.
[ редактировать ]На различных уровнях вывода Анусаараки предпринимаются усилия, чтобы пользователь мог понять информацию, содержащуюся в английском предложении. Этому усилию придается большее значение, чем созданию идеальных предложений на хинди, поскольку было бы бессмысленно иметь перевод, который хорошо читается, но не передает по-настоящему информацию исходного текста.
Многоуровневый вывод уникален для Анусаараки. Таким образом, пользователь может получить доступ к текстовой информации на исходном языке и тому, как в конечном итоге был получен перевод на хинди. Важнейшей особенностью многоуровневого вывода является то, что передача информации осуществляется контролируемым образом на каждом этапе, что позволяет вернуться назад без какой-либо потери информации. Кроме того, любой ущерб информации, которого нельзя избежать в процессе перевода, происходит постепенно. Следовательно, даже если переведенное предложение не так «идеально», как человеческий перевод, приложив некоторые усилия и ориентируясь на чтение результатов Анусаараки, человек может понять, что подразумевает исходный текст, посмотрев на слои и контекст, в которых появляется это предложение.
обратимость
[ редактировать ]Особенность постепенной передачи информации с одного слоя на другой дает Анусаараке дополнительное преимущество, заключающееся в обеспечении обратимости процесса перевода – функции, которую невозможно достичь с помощью обычной системы машинного перевода. Двуязычный пользователь Anusaaraka может в любой момент получить доступ к тексту на исходном языке на английском языке благодаря прозрачности вывода. Для этого потребуется некоторая ориентация на то, как читать выходные данные Анусаараки.
Прозрачность
[ редактировать ]Отображение слоев пошагового перевода дает конечному пользователю повышенный уровень уверенности, поскольку он может вернуться к источнику и получить ясность относительно переведенного текста путем анализа выходных слоев и некоторой ссылки на контекст.
Пример вывода
[ редактировать ]
Цвета в выводе обозначают категорию слова:
существительная фраза |
глагол-фраза |
прилагательная-фраза |
наречие-фраза |
предлог |
союзы |
междометия |
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ http://ltrc.iiit.ac.in/~anusaaraka/PUBLICATIONS/rsvp_symposium.html Архивировано 21 июля 2011 г. на симпозиуме Wayback Machine RSVP.
- ^ http://ltrc.iiit.ac.in/downloads/nlpbook/nlp-panini.pdf . Архивировано 26 ноября 2013 г. в Wayback Machine Panini.
- ^ «Международный фонд Чинмая :: CIF» . Архивировано из оригинала 17 июля 2011 г. Проверено 21 мая 2010 г. www.chinfo.org/Anusaaraka.html
- ^ «Страница Анусаарака» . Архивировано из оригинала 17 июля 2011 г. Проверено 21 мая 2010 г.
- ^ «Анусааракас» . Архивировано из оригинала 17 июля 2009 г. Проверено 31 января 2011 г.