Программа чтения с экрана
Эта статья нуждается в дополнительных цитатах для проверки . ( июль 2017 г. ) |
Программа чтения с экрана — это форма вспомогательных технологий ( AT ). [1] который отображает текст и изображение в виде речевого вывода или вывода Брайля. Программы чтения с экрана необходимы слепым людям . [2] и полезны людям с нарушениями зрения , [2] неграмотны или неспособны к обучению . [3] Программы чтения с экрана — это программные приложения , которые пытаются передать то, что люди с нормальным зрением видят на дисплее , своим пользователям с помощью невизуальных средств, таких как преобразование текста в речь . [4] звуковые иконки, [5] или устройство Брайля . [2] Они делают это, применяя широкий спектр методов, которые включают, например, взаимодействие со специальными API специальных возможностей , использование различных функций операционной системы (таких как межпроцессное взаимодействие и запрос свойств пользовательского интерфейса ), а также методы перехвата . [6]
Microsoft Windows Операционные системы включают программу чтения с экрана Microsoft Narrator начиная с Windows 2000 , хотя отдельные продукты, такие как от Freedom Scientific коммерчески доступная программа чтения с экрана JAWS и ZoomText экранная лупа с открытым исходным кодом , а также бесплатная программа чтения с экрана NVDA от NV Access, более популярны для этого. Операционная система. [7] Apple Inc. от MacOS , iOS и tvOS включают VoiceOver в качестве встроенной программы чтения с экрана, в то время как Google от Android предоставляет программу чтения с экрана Talkback , а ChromeOS может использовать ChromeVox. [8] Аналогичным образом, устройства на базе Android от Amazon оснащены программой чтения с экрана VoiceView. Существуют также бесплатные программы чтения с экрана с открытым исходным кодом для Linux и Unix-подобных систем, такие как Speakup и Orca .
Типы [ править ]
Командная строка (текст) [ править ]
В ранних операционных системах , таких как MS-DOS , которые использовали интерфейсы командной строки ( CLI ), отображение на экране состояло из символов, сопоставленных непосредственно с экранным буфером в памяти и позицией курсора . Ввод осуществлялся с клавиатуры. Таким образом, вся эта информация может быть получена из системы либо путем перехвата потока информации вокруг системы и чтения экранного буфера, либо с помощью стандартного аппаратного выходного разъема. [9] и передачу результатов пользователю.
В 1980-х годах Исследовательский центр образования лиц с ограниченными возможностями по зрению ( RCEVH ) при Бирмингемском университете разработал программу чтения с экрана для BBC Micro и NEC Portable. [10] [11]
Графический [ править ]
Закадровые модели [ править ]
С появлением графических пользовательских интерфейсов ( GUI ) ситуация усложнилась. Графический интерфейс содержит символы и графику, нарисованные на экране в определенных местах, и поэтому не существует чисто текстового представления графического содержимого дисплея. Поэтому программы чтения с экрана были вынуждены использовать новые методы низкого уровня, собирая сообщения от операционной системы и используя их для создания «внеэкранной модели», представления дисплея, в котором хранится требуемый текстовый контент. [12]
Например, операционная система может отправлять сообщения для рисования командной кнопки и ее заголовка. Эти сообщения перехватываются и используются для построения закадровой модели. Пользователь может переключаться между элементами управления (например, кнопками), доступными на экране, а подписи и содержимое элементов управления будут читаться вслух и/или отображаться на обновляемом дисплее Брайля .
Программы чтения с экрана также могут передавать информацию о меню, элементах управления и других визуальных конструкциях, позволяя слепым пользователям взаимодействовать с этими конструкциями. Однако поддержание закадровой модели представляет собой серьезную техническую проблему; перехват низкоуровневых сообщений и поддержание точной модели — сложные задачи. [ нужна ссылка ]
API специальных возможностей [ править ]
Разработчики операционных систем и приложений попытались решить эти проблемы, предоставив средствам чтения с экрана способы доступа к содержимому дисплея без необходимости поддерживать внеэкранную модель. Они включают предоставление альтернативных и доступных представлений того, что отображается на экране, доступ к которому осуществляется через API . Существующие API включают:
- Платформа специальных возможностей Android [13]
- специальных возможностей Apple API [14]
- АТ-СПИ
- Доступный2
- Microsoft Active Accessibility ( MSAA )
- Автоматизация пользовательского интерфейса Microsoft
- Мост доступа к Java [15]
Программы чтения с экрана могут запрашивать у операционной системы или приложения информацию о том, что отображается в данный момент, и получать обновления при изменении отображения. Например, программе чтения с экрана можно сообщить, что текущий фокус находится на кнопке, и заголовок кнопки должен быть сообщен пользователю. Этот подход значительно проще для разработчиков программ чтения с экрана, но он терпит неудачу, когда приложения не соответствуют API специальных возможностей : например, Microsoft Word не соответствует MSAA API , поэтому программы чтения с экрана все равно должны поддерживать внеэкранную модель для Word. или найдите другой способ получить доступ к его содержимому. [ нужна ссылка ] Один из подходов заключается в использовании доступных сообщений операционной системы и объектных моделей приложений в качестве дополнения к API специальных возможностей .
Можно предположить, что программы чтения с экрана могут получить доступ ко всему отображаемому содержимому, которое не является недоступным по своей сути. Веб-браузеры, текстовые процессоры, значки, окна и программы электронной почты — это лишь некоторые из приложений, успешно используемых пользователями программ чтения с экрана. Однако, по мнению некоторых пользователей, [ ВОЗ? ] использовать программу чтения с экрана значительно сложнее, чем использовать графический интерфейс, и многие приложения имеют специфические проблемы, возникающие из-за характера приложения (например, анимация) или несоответствия стандартам доступности для платформы (например, Microsoft Word и Active Accessibility). [ нужна ссылка ]
Программы и приложения с самоозвучиванием [ править ]
В некоторые программы и приложения встроена технология голосовой связи наряду с их основными функциями. Эти программы называются самоозвучиванием и могут представлять собой разновидность вспомогательной технологии, если они предназначены для устранения необходимости использования программы чтения с экрана. [ нужна ссылка ]
Облачный [ править ]
Некоторые телефонные службы позволяют пользователям удаленно взаимодействовать с Интернетом. Например, TeleTender может читать веб-страницы по телефону и не требует специальных программ или устройств на стороне пользователя. [ нужна ссылка ]
Виртуальные помощники иногда могут зачитывать письменные документы (текстовый веб-контент, PDF- документы, электронные письма и т. д.). Наиболее известными примерами являются Apple Siri , Google Assistant и Amazon Alexa .
Сетевой [ править ]
Относительно новой разработкой в этой области являются веб-приложения, такие как Spoken-Web, которые действуют как веб-порталы и управляют таким контентом, как обновления новостей, погода, научные и бизнес-статьи, для слабовидящих или слепых пользователей компьютеров. [ нужна ссылка ] Другими примерами являются ReadSpeaker или BrowseAloud , которые добавляют функцию преобразования текста в речь в веб-контент. [ нужна ссылка ] Основная аудитория таких приложений — те, кто испытывает трудности с чтением из-за неспособности к обучению или языкового барьера. [ нужна ссылка ] Хотя функциональность остается ограниченной по сравнению с эквивалентными настольными приложениями, основным преимуществом является повышение доступности указанных веб-сайтов при просмотре на общедоступных компьютерах, где у пользователей нет разрешения на установку специального программного обеспечения, что дает людям большую «свободу перемещения». [ нужна ссылка ]
Эта функциональность зависит не только от качества программного обеспечения, но и от логической структуры текста. Использование заголовков, знаков препинания, наличие альтернативных атрибутов изображений и т. д. имеет решающее значение для хорошей вокализации. Кроме того, веб-сайт может иметь приятный вид благодаря использованию соответствующего двухмерного позиционирования с помощью CSS, но его стандартная линеаризация, например, путем подавления любого CSS и Javascript в браузере, может быть непонятной. [ нужна ссылка ]
Кастомизация [ править ]
Большинство программ чтения с экрана позволяют пользователю выбирать, будет ли большая часть знаков препинания объявляться или молча игнорироваться. Некоторые программы чтения с экрана можно адаптировать к конкретному приложению с помощью сценариев . Одним из преимуществ сценариев является то, что они позволяют пользователям делиться настройками, повышая доступность для всех. JAWS существует активное сообщество по обмену сценариями. Например, в [ нужна ссылка ]
Многословие [ править ]
Подробность — это функция программного обеспечения для чтения с экрана, которая поддерживает пользователей компьютеров с нарушениями зрения. Элементы управления громкостью речи позволяют пользователям выбирать, какую речевую обратную связь они хотят услышать. В частности, настройки подробностей позволяют пользователям создавать мысленную модель веб-страниц, отображаемых на экране их компьютера. На основе настроек детализации программа чтения с экрана информирует пользователей об определенных изменениях форматирования, например, когда начинается и заканчивается фрейм или таблица, когда в текст вставляется графика или когда в документе появляется список. Параметры детализации также могут контролировать уровень информативности элементов, таких как списки, таблицы и регионы. [16] Например, JAWS предоставляет предустановленные уровни низкой, средней и высокой детализации веб-страниц. Высокий уровень детализации веб-страниц обеспечивает более подробную информацию о содержимом веб-страницы. [17]
Язык [ править ]
Некоторые программы чтения с экрана могут читать текст на нескольких языках при условии, что язык материала закодирован в его метаданных . [18]
Программы чтения с экрана, такие как JAWS , NVDA и VoiceOver, также включают в себя языковую многословность, которая автоматически определяет настройки многословности, связанные с языком вывода речи. Например, если пользователь перешел на веб-сайт, расположенный в Великобритании, текст будет читаться с английским акцентом . [ нужна ссылка ]
См. также [ править ]
- Список программ чтения с экрана
- Экранная лупа
- Обработка речи
- Распознавание речи
- Синтез речи
- Винукс
- VoiceOver
Ссылки [ править ]

- ^ «Типы продуктов вспомогательных технологий» . Доступность Microsoft . Проверено 13 июня 2016 г.
- ^ Jump up to: Перейти обратно: а б с «Технология чтения с экрана» . АФБ . Проверено 23 февраля 2022 г.
- ^ «Средства чтения с экрана и как они работают с электронным обучением» . Вирджиния.gov. Архивировано из оригинала 13 ноября 2018 года . Проверено 31 марта 2019 г.
- ^ «Прослушайте текст, прочитанный вслух с помощью диктора» . Майкрософт . Проверено 13 июня 2016 г.
- ^ Койер, Крис (29 октября 2007 г.). «Основы специальных возможностей: как ваша страница выглядит в программе чтения с экрана?» . CSS-трюки . Проверено 13 июня 2016 г.
- ^ «Что такое программа чтения с экрана» . Номенса . Проверено 9 июля 2017 г.
- ^ «Опрос пользователей программы чтения с экрана № 9» . ВебАИМ . Проверено 1 июля 2021 г.
- ^ «ХромВокс» . Google . Проверено 9 марта 2020 г.
- ^ «Говорящие терминалы. БАЙТ, сентябрь 1982 г.» . Архивировано из оригинала 25 июня 2006 года . Проверено 7 сентября 2006 г.
- ^ Пол Бленкхорн, « Проект RCEVH по микрокомпьютерным системам и компьютерному обучению», Британский журнал нарушений зрения, 4/3, 101-103 (1986). Бесплатная HTML-версия на Visugate .
- ^ «Доступ к персональным компьютерам с использованием синтеза речи. Новый маяк РНИБ №76, май 1992 года» . 3 марта 2014 г.
- ↑ Согласно книге « Making the GUI Talk » (Ричард Швердтфегер, BYTE , декабрь 1991 г., стр. 118–128), первая программа чтения с экрана, создавшая внеэкранную модель, была превзойдена.
- ^ Реализация специальных возможностей на Android .
- ^ специальных возможностей Apple API .
- ^ «Технологическая сеть Oracle для разработчиков Java – Технологическая сеть Oracle – Oracle» .
- ^ Зонг, Джонатан; Ли, Кристал; Лундгард, Алан; Чан, ДжиУн; Хаджас, Дэниел; Сатьянараян, Арвинд (2022). «Расширенные возможности чтения с экрана для доступной визуализации данных». Форум компьютерной графики . 41 (3): 15–27. arXiv : 2205.04917 . дои : 10.1111/cgf.14519 . ISSN 0167-7055 . S2CID 248665696 .
- ^ «Веб-многословие JAWS» . www.freedomscientific.com . Проверено 6 ноября 2022 г.
- ^ Крис Хейлманн (13 марта 2008 г.). «Результаты поиска Yahoo! теперь поддерживают естественный язык» . Yahoo! сети разработчиков Блог . Архивировано из оригинала 25 января 2009 года . Проверено 28 февраля 2015 г.