Лаборатория медицинской разведки и языковой инженерии
Лаборатория медицинской разведки и языковой инженерии , также известная как лаборатория MILE , является исследовательской лабораторией Индийского научного института в Бангалоре при Департаменте электротехники. Лаборатория известна своей работой в области обработки изображений , онлайн- распознавания рукописного текста , преобразования текста в речь и оптического распознавания символов. [1] системы, все из которых ориентированы в основном на документы и речь на индийских языках . [2] Лабораторию возглавляет А. Г. Рамакришнан . [3]
Направление исследований
[ редактировать ]Одним из обязательств лаборатории MILE является разработка технологии для людей с нарушениями зрения , позволяющей использовать знания из любых доступных печатных материалов на индийских языках. [4] Лаборатория работает над достижением этой цели. На данный момент его работа включала: составление документов из цветных изображений, снятых камерой; извлечение текста из сложных цветных изображений, включая изображения, снятые камерой; анализ структуры документа ; обнаружение битых и слитых символов; технология оптического распознавания символов для тамильского и каннада; [5] преобразование текста в речь на тамильском и каннада ; [6] модификация основного тона с использованием дискретного косинусного преобразования в исходной области; [7] автоматизированная часть речевой маркировки; предсказание фраз и моделирование просодии.
Mozhi Vallan, the Tamil OCR [8] продукт, разработанный MILE Lab, используется Worth Trust и технологическим центром Karna Vidya, Ченнаи. [9] для перевода печатных школьных и студенческих книг в формат Брайля . Шри Рамакришна Матх, Ченнаи [10] использует его для преобразования своих печатных философских книг на тамильском языке в текст, читаемый компьютером. Липи Гнани, каннада OCR, разработанный MILE Lab, используется центрами транскрипции Брайля в Митраджьоти. [11] и Общество помощи и благосостояния банка Канара, [12] Бангалор для аналогичных целей. Кроме того, Тируккурал, [13] тамильская TTS система [14] разработанное MILE Lab, используется некоторыми школьными учителями Сингапура для выполнения заданий. Мадхура, каннада TTS [15] Разработанный лабораторией, он используется двумя слепыми студентами с интегрированной программой чтения с экрана для чтения вслух текста, распознанного с помощью Липи Гнани, из книг на каннада. В настоящее время лаборатория исследует машинное прослушивание. [16] и была предложена новая временная характеристика, названная индексом взрыва, которая, как было показано, чрезвычайно эффективна при обнаружении переходов замыкания и взрыва стоповых согласных и аффрикатов в непрерывной речи, даже в шуме . [17] Еще одна предлагаемая функция — DCTILPR, [18] который представляет собой вектор признаков на основе источника голоса, который улучшает производительность распознавания системы идентификации говорящего .
На заре была проведена значительная работа по обработке медицинских сигналов и изображений. Был предложен уникальный алгоритм ЭКГ сжатия , рассматривающий каждый сердечный цикл как вектор и применяющий линейное предсказание к дискретному вейвлет-преобразованию этого вектора после нормализации его периода на основе многоскоростной обработки с использованием интерполяции . [19] Зрелость легких плода прогнозировали с использованием особенностей текстуры изображений, полученных из областей печени и легких на ультразвуковых изображениях, полученных от беременных женщин. [20] Предложен эффективный метод сжатия без потерь 3D магнитно-резонансных изображений головного мозга . Каждый срез МРТ был представлен однородной или адаптивной сеткой; Аффинное преобразование применялось между соответствующими элементами сетки соседних срезов и контекстно-ориентированным энтропийным кодированием к остаткам. [21]
Ссылки
[ редактировать ]- ^ «Лаборатория MILE в IISc: Разработка технологий для людей с ограниченными возможностями» .
- ^ МИЛЬ Лаборатория. «Лаборатория МИЛЬ» в новостях . Проверено 28 апреля 2013 г.
- ^ МИЛЬ Лаборатория. "Люди" . Архивировано из оригинала 3 сентября 2014 года . Проверено 28 апреля 2013 г.
- ^ «Пройти лишнюю милю для людей с ограниченными возможностями - Bangalore Mirror» .
- ^ Пати, Пит Баса; Рамакришнан, АГ (2008). «Мультискриптовая идентификация на уровне слов». Буквы для распознавания образов . 29 (9): 1218–1229. дои : 10.1016/j.patrec.2008.01.027 .
- ^ «Шива Кумар HR, Ашвини Дж. К., Раджарам БСР и А. Г. Рамакришнан, «MILE TTS для тамильского и каннада для Blizzard Challenge 2013», Proc. Семинар Blizzard Challenge, Барселона, Испания, 3 сентября 2013 г.» (PDF) .
- ^ «Модификация шага синхронного шага». Речевое общение . 42 : 143–154. doi : 10.1016/j.specom.2003.05.001 .
- ^ Субраманиан, Картик (17 января 2014 г.). «Статья в журнале The Hindu о тамильском OCR MILE Lab» . Индус .
- ^ «Технологический центр Карна Видья, Гинди, Ченнаи» .
- ^ «Шри Рамакришна Матх, Ченнаи» .
- ^ «Центр транскрипции Брайля Митраджьоти, Бангалор» . Архивировано из оригинала 3 февраля 2011 года.
- ^ «Центр транскрипции Брайля, Общество помощи и благосостояния банка Канара, Бангалор» .
- ^ Джаявардхана Рама, GL; Рамакришнан, АГ; Муралишанкар, Р.; Пратибха, Р. (2002). «Полная система синтеза речи на тамильском языке» (PDF) . Материалы семинара IEEE по синтезу речи 2002 г., 2002 г. стр. 191–194. дои : 10.1109/WSS.2002.1224406 . ISBN 0-7803-7395-2 . S2CID 13870581 .
- ^ «Блог на тамильском манаме о Thirukkural Tamil TTS» .
- ^ «Deccan Herald: IISc разрабатывает программное обеспечение для преобразования текста в речь для каннада и тамильского языка» . 26 июня 2010 г.
- ^ «Фокус исследований лаборатории MILE» .
- ^ Анантападманабха, ТВ; Пратош, AP; Рамакришнан, АГ (2014). «Индекс взрыва, временной признак для обнаружения всплесков остановок и аффрикатов». Журнал Акустического общества Америки . 135 (1): 460–71. дои : 10.1121/1.4836055 . ПМИД 24437786 .
- ^ Рамакришнан, АГ; Абхирам, Б.; Прасанна, СР (2015). «А.Г. Рамакришнан, Б. Абхирам и С.Р. Махадева Прасанна, «Характеристика источника голоса с использованием синхронного дискретного косинусного преобразования для идентификации говорящего», Журнал Акустического общества Америки Express Letters, том 137(), стр., 2015» . Журнал Акустического общества Америки . 137 (6): EL469-75. дои : 10.1121/1.4921679 . ПМИД 26093457 .
- ^ Рамакришнан, АГ; Саха, С. (1997). «Сжатие ЭКГ, синхронизированное с сердечным циклом» (PDF) . Транзакции IEEE по биомедицинской инженерии . 44 (12): 1253–61. дои : 10.1109/10.649997 . ПМИД 9401225 . S2CID 8834327 .
- ^ Пракаш, КН; Рамакришнан, АГ; Суреш, С.; Чоу, ТВ (2002). «Прогнозирование зрелости легких плода по особенностям ультразвукового изображения» (PDF) . Транзакции IEEE по информационным технологиям в биомедицине . 6 (1): 38–45. дои : 10.1109/4233.992160 . ПМИД 11936595 . S2CID 14662967 .
- ^ Шрикант, Р.; Рамакришнан, АГ (2005). «Сжатие 3D-МРТ головного мозга с использованием адаптивной сетки и контекстного кодирования» (PDF) . Транзакции IEEE по медицинской визуализации . 24 (9): 1199–206. дои : 10.1109/TMI.2005.853638 . ПМИД 16156357 . S2CID 7523030 .