Jump to content

Лаборатория медицинской разведки и языковой инженерии

Лаборатория медицинской разведки и языковой инженерии , также известная как лаборатория MILE , является исследовательской лабораторией Индийского научного института в Бангалоре при Департаменте электротехники. Лаборатория известна своей работой в области обработки изображений , онлайн- распознавания рукописного текста , преобразования текста в речь и оптического распознавания символов. [1] системы, все из которых ориентированы в основном на документы и речь на индийских языках . [2] Лабораторию возглавляет А. Г. Рамакришнан . [3]

Направление исследований

[ редактировать ]

Одним из обязательств лаборатории MILE является разработка технологии для людей с нарушениями зрения , позволяющей использовать знания из любых доступных печатных материалов на индийских языках. [4] Лаборатория работает над достижением этой цели. На данный момент его работа включала: составление документов из цветных изображений, снятых камерой; извлечение текста из сложных цветных изображений, включая изображения, снятые камерой; анализ структуры документа ; обнаружение битых и слитых символов; технология оптического распознавания символов для тамильского и каннада; [5] преобразование текста в речь на тамильском и каннада ; [6] модификация основного тона с использованием дискретного косинусного преобразования в исходной области; [7] автоматизированная часть речевой маркировки; предсказание фраз и моделирование просодии.

Mozhi Vallan, the Tamil OCR [8] продукт, разработанный MILE Lab, используется Worth Trust и технологическим центром Karna Vidya, Ченнаи. [9] для перевода печатных школьных и студенческих книг в формат Брайля . Шри Рамакришна Матх, Ченнаи [10] использует его для преобразования своих печатных философских книг на тамильском языке в текст, читаемый компьютером. Липи Гнани, каннада OCR, разработанный MILE Lab, используется центрами транскрипции Брайля в Митраджьоти. [11] и Общество помощи и благосостояния банка Канара, [12] Бангалор для аналогичных целей. Кроме того, Тируккурал, [13] тамильская TTS система [14] разработанное MILE Lab, используется некоторыми школьными учителями Сингапура для выполнения заданий. Мадхура, каннада TTS [15] Разработанный лабораторией, он используется двумя слепыми студентами с интегрированной программой чтения с экрана для чтения вслух текста, распознанного с помощью Липи Гнани, из книг на каннада. В настоящее время лаборатория исследует машинное прослушивание. [16] и была предложена новая временная характеристика, названная индексом взрыва, которая, как было показано, чрезвычайно эффективна при обнаружении переходов замыкания и взрыва стоповых согласных и аффрикатов в непрерывной речи, даже в шуме . [17] Еще одна предлагаемая функция — DCTILPR, [18] который представляет собой вектор признаков на основе источника голоса, который улучшает производительность распознавания системы идентификации говорящего .

На заре была проведена значительная работа по обработке медицинских сигналов и изображений. Был предложен уникальный алгоритм ЭКГ сжатия , рассматривающий каждый сердечный цикл как вектор и применяющий линейное предсказание к дискретному вейвлет-преобразованию этого вектора после нормализации его периода на основе многоскоростной обработки с использованием интерполяции . [19] Зрелость легких плода прогнозировали с использованием особенностей текстуры изображений, полученных из областей печени и легких на ультразвуковых изображениях, полученных от беременных женщин. [20] Предложен эффективный метод сжатия без потерь 3D магнитно-резонансных изображений головного мозга . Каждый срез МРТ был представлен однородной или адаптивной сеткой; Аффинное преобразование применялось между соответствующими элементами сетки соседних срезов и контекстно-ориентированным энтропийным кодированием к остаткам. [21]

  1. ^ «Лаборатория MILE в IISc: Разработка технологий для людей с ограниченными возможностями» .
  2. ^ МИЛЬ Лаборатория. «Лаборатория МИЛЬ» в новостях . Проверено 28 апреля 2013 г.
  3. ^ МИЛЬ Лаборатория. "Люди" . Архивировано из оригинала 3 сентября 2014 года . Проверено 28 апреля 2013 г.
  4. ^ «Пройти лишнюю милю для людей с ограниченными возможностями - Bangalore Mirror» .
  5. ^ Пати, Пит Баса; Рамакришнан, АГ (2008). «Мультискриптовая идентификация на уровне слов». Буквы для распознавания образов . 29 (9): 1218–1229. дои : 10.1016/j.patrec.2008.01.027 .
  6. ^ «Шива Кумар HR, Ашвини Дж. К., Раджарам БСР и А. Г. Рамакришнан, «MILE TTS для тамильского и каннада для Blizzard Challenge 2013», Proc. Семинар Blizzard Challenge, Барселона, Испания, 3 сентября 2013 г.» (PDF) .
  7. ^ «Модификация шага синхронного шага». Речевое общение . 42 : 143–154. doi : 10.1016/j.specom.2003.05.001 .
  8. ^ Субраманиан, Картик (17 января 2014 г.). «Статья в журнале The Hindu о тамильском OCR MILE Lab» . Индус .
  9. ^ «Технологический центр Карна Видья, Гинди, Ченнаи» .
  10. ^ «Шри Рамакришна Матх, Ченнаи» .
  11. ^ «Центр транскрипции Брайля Митраджьоти, Бангалор» . Архивировано из оригинала 3 февраля 2011 года.
  12. ^ «Центр транскрипции Брайля, Общество помощи и благосостояния банка Канара, Бангалор» .
  13. ^ Джаявардхана Рама, GL; Рамакришнан, АГ; Муралишанкар, Р.; Пратибха, Р. (2002). «Полная система синтеза речи на тамильском языке» (PDF) . Материалы семинара IEEE по синтезу речи 2002 г., 2002 г. стр. 191–194. дои : 10.1109/WSS.2002.1224406 . ISBN  0-7803-7395-2 . S2CID   13870581 .
  14. ^ «Блог на тамильском манаме о Thirukkural Tamil TTS» .
  15. ^ «Deccan Herald: IISc разрабатывает программное обеспечение для преобразования текста в речь для каннада и тамильского языка» . 26 июня 2010 г.
  16. ^ «Фокус исследований лаборатории MILE» .
  17. ^ Анантападманабха, ТВ; Пратош, AP; Рамакришнан, АГ (2014). «Индекс взрыва, временной признак для обнаружения всплесков остановок и аффрикатов». Журнал Акустического общества Америки . 135 (1): 460–71. дои : 10.1121/1.4836055 . ПМИД   24437786 .
  18. ^ Рамакришнан, АГ; Абхирам, Б.; Прасанна, СР (2015). «А.Г. Рамакришнан, Б. Абхирам и С.Р. Махадева Прасанна, «Характеристика источника голоса с использованием синхронного дискретного косинусного преобразования для идентификации говорящего», Журнал Акустического общества Америки Express Letters, том 137(), стр., 2015» . Журнал Акустического общества Америки . 137 (6): EL469-75. дои : 10.1121/1.4921679 . ПМИД   26093457 .
  19. ^ Рамакришнан, АГ; Саха, С. (1997). «Сжатие ЭКГ, синхронизированное с сердечным циклом» (PDF) . Транзакции IEEE по биомедицинской инженерии . 44 (12): 1253–61. дои : 10.1109/10.649997 . ПМИД   9401225 . S2CID   8834327 .
  20. ^ Пракаш, КН; Рамакришнан, АГ; Суреш, С.; Чоу, ТВ (2002). «Прогнозирование зрелости легких плода по особенностям ультразвукового изображения» (PDF) . Транзакции IEEE по информационным технологиям в биомедицине . 6 (1): 38–45. дои : 10.1109/4233.992160 . ПМИД   11936595 . S2CID   14662967 .
  21. ^ Шрикант, Р.; Рамакришнан, АГ (2005). «Сжатие 3D-МРТ головного мозга с использованием адаптивной сетки и контекстного кодирования» (PDF) . Транзакции IEEE по медицинской визуализации . 24 (9): 1199–206. дои : 10.1109/TMI.2005.853638 . ПМИД   16156357 . S2CID   7523030 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e350aa005ce8c4375cfca3b27c786c1e__1721985540
URL1:https://arc.ask3.ru/arc/aa/e3/1e/e350aa005ce8c4375cfca3b27c786c1e.html
Заголовок, (Title) документа по адресу, URL1:
Medical intelligence and language engineering lab - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)