Распознавание языка жестов
Эта статья нуждается в дополнительных цитатах для проверки . ( август 2021 г. ) |
Распознавание языка жестов (сокращенно SLR) — это вычислительная задача, которая включает в себя распознавание действий на языках жестов . [ 1 ] Это важная проблема, которую необходимо решить, особенно в цифровом мире, чтобы преодолеть разрыв в общении, с которым сталкиваются люди с нарушениями слуха.
Для решения проблемы обычно требуются не только аннотированные цветовые данные (RGB), но также полезны различные другие модальности, такие как глубина, сенсорная информация и т. д.
Изолированное распознавание языка жестов
[ редактировать ]ISLR (также известный как SLR на уровне слов) — это задача распознавания отдельных знаков или токенов, называемых глоссами, из данного сегмента подписывающего видеоклипа. Это обычно рассматривается как проблема классификации при распознавании изолированных видео, но требует обработки других вещей, таких как сегментация видео, при использовании в приложениях реального времени.
Непрерывное распознавание языка жестов
[ редактировать ]В CSLR (также известном как транскрипция языка жестов) с учетом последовательности языка жестов задача состоит в том, чтобы предсказать все знаки (или толкования) в видео. Это больше подходит для реальной транскрипции языков жестов. В зависимости от того, как она решается, ее также иногда можно рассматривать как расширение задачи ISLR.
Непрерывный сурдоперевод
[ редактировать ]Перевод с языка жестов относится к проблеме перевода последовательности знаков (называемых глоссами) на любой необходимый разговорный язык . Обычно это моделируется как расширение проблемы CSLR.
Ссылки
[ редактировать ]- ^ Купер, Хелен; Холт, Брайан; Боуден, Ричард (2011). «Распознавание языка жестов» . Визуальный анализ человека . Спрингер. стр. 539–562. дои : 10.1007/978-0-85729-997-0_27 . ISBN 978-0-85729-996-3 . S2CID 1297591 .
{{cite book}}
:|journal=
игнорируется ( помогите )