Искусственный пассажир
Искусственный пассажир — это телематическое устройство, разработанное IBM , которое вербально взаимодействует с водителем, чтобы снизить вероятность того, что он заснет за рулем транспортного средства. [1] Он основан на изобретениях, защищенных патентом США № 6 236 968. [2] Принимая во внимание, что телематическое устройство выполняет ряд функций, собирая данные о местоположении и активности транспортных средств и превращая их в бизнес-аналитику. Также телематическая машина работает путем сбора данных о местоположении транспортного средства с помощью устройства с поддержкой GPS, установленного в транспортном средстве. Искусственный пассажир способен взаимодействовать с водителем транспортного средства, ведя разговоры, играя в словесные игры, управляя стереосистемой автомобиля и т. д. Он также отслеживает манеру речи водителя, чтобы обнаружить усталость, и в ответ может предложить водителю сделать перерыв или немного поспать. [3] [4] Искусственный пассажир также может быть интегрирован с беспроводными службами для предоставления информации о погоде и дорогах, указаниях направления движения и других подобных системах уведомлений. [5]
Интерфейс голосового управления
[ редактировать ]По словам Дмитрия Каневского, бывшего исследователя IBM, в настоящее время работающего в Google, «Искусственный пассажир» был разработан с использованием речевой системы «Разговорная интерактивность для телематики» (CIT), которая рассчитывает на естественную речь водителя, а не на использование рук. CIT опирается на систему распознавания естественного языка (NLU), которую сложно разработать из-за маломощных компьютерных систем, имеющихся в автомобилях. IBM предлагает разместить эту систему на сервере и обеспечить доступ к ней через беспроводные технологии автомобилей. IBM также заявляет, что работает над «квази-NLU», который использует меньше ресурсов ЦП и может использоваться внутри автомобиля. [6] Система CIT включает в себя еще одну систему, называемую Менеджером диалогов (DM). DM берет на себя нагрузку системы NLU, взаимодействуя с транспортным средством, водителем и внешними системами, такими как погодные системы, электронная почта, телефоны и многое другое. [7]
Система NLU получает голосовую команду от водителя и просматривает файловую систему, чтобы определить действие, которое необходимо выполнить, и выполняет это действие. [6] DM работает с вопросами, которые задает водитель, например: «Как далеко отсюда находится аэропорт Галлатин Филд?» Система NLU по-прежнему не сможет понять все, что говорит водитель. Причинами этого являются разные идиомы и диалекты разных регионов. IBM работает над разработкой системы, которая распознает, где находится водитель, и учитывает региональную дикцию, используемую в этой области. [7]
Другая система, используемая в этой технологии, — это система Learning Transformation (LT), которая отслеживает действия пассажиров автомобиля и автомобилей вокруг него, изучает закономерности в речи водителя и сохраняет эти данные, а также учится на таких данных, чтобы попытаться улучшить производительность технологии в целом. [6]
Распознавание речи
[ редактировать ]Процесс распознавания речи состоит из трех этапов. Интерфейсная часть отфильтровывает любой нежелательный шум, например шум автомобиля, фоновую музыку или пассажиров. Он устраняет распознавание сигналов с низкой энергией и высокой изменчивостью. [7] Маркировщик разбивает речь на части и ищет в базе данных, чтобы распознать то, что говорится. Все начинается с рассмотрения того, о какой теме говорит водитель. Затем более подробно рассказывается о том, о чем на самом деле спрашивает водитель. Далее декодер берет всю эту информацию и формулирует ответ драйверу. [6] IBM после долгих экспериментов утверждает, что распознавание речи очень точное, но этот процесс не до конца усовершенствован и в нем все еще есть недостатки. [7]
Основная часть Искусственного Пассажира — это разрушительное распознавание речи. Эта технология поддерживает разговор с водителем и анализирует, что говорит водитель и как он это говорит. Он может распознавать колебания голоса водителя и определять, сонный ли он, расстроен или находится в хорошем настроении, по различным образцам вибрации в речи водителя. Он также фиксирует время, необходимое водителю, чтобы ответить на разговор, и на основании этого определяет, задремал ли водитель или отвлекается на что-то. [7]
Профилактика сонливости водителя
[ редактировать ]Когда компьютер распознает, что водитель дремлет, он посылает сигнал о вмешательстве. Компьютер вмешается, сменив радио, попытавшись поиграть с водителем в игры или открыв окно, чтобы разбудить водителя. [5] Делая это, компьютер хочет улучшить свою бдительность. Если обнаруживается, что водитель снова и снова засыпает, компьютерная система запрограммирована попросить позвонить в ближайший отель и забронировать номер или предложить водителю сделать перерыв. [6]
Искусственный пассажир будет пытаться читать анекдоты, играть в игры, задавать вопросы или читать интерактивные книги, чтобы стимулировать водителя. Водителям, которые проявляют большую сонливость, будет предоставлен более стимулирующий контент, чем водителю, который не так сонлив. [6]
Распределительный пользовательский интерфейс между автомобилями
[ редактировать ]IBM признает, что для водителя существует больше опасностей, чем он сам. Искусственному пассажиру предлагается работать между автомобилями, передавая друг другу информацию. Информация может включать в себя записи о вождении, чтобы показать, были ли они плохими водителями, или своевременный анализ всех водителей, чтобы показать, какие из них становятся сонными и могут вмешиваться в эту информацию. Он также может показать, отвлекается ли водитель играми или беспроводными устройствами, и мешает ли это всем окружающим водителям. [7]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Образец, Ян, ты сводишь меня с ума , New Scientist , выпуск 2300, июль 2001 г. Проверено 29 июня 2008 г.
- ^ «Патент США: Автомобильная система на основе диалогового окна предотвращения сна» . Архивировано из оригинала 23 мая 2011 г. Проверено 29 июня 2008 г.
- ↑ The New York Times , 27 декабря 2001 г. Пассажир, чья болтовня всегда ценится. Архивировано 17 октября 2009 года в Wayback Machine А. Айзенбергом . Проверено 29 июня 2008 г.
- ^ Каневский, Д., Телематика: искусственный пассажир и не только, Человеческий фактор и голосовые интерактивные системы , Серия «Сигналы и коммуникационные технологии», Springer US, стр. 291-325. https://doi.org/10.1007%2F978-0-387-68439-0_10
- ^ Перейти обратно: а б Хариф, Ольга. «IBM — драйверам: просыпайтесь!» . Архивировано из оригинала 21 августа 2001 года . Проверено 6 декабря 2011 г.
- ^ Перейти обратно: а б с д и ж Каневский Дмитрий. «Отчет об исследовании IBM» (PDF) . Проверено 6 декабря 2011 г.
- ^ Перейти обратно: а б с д и ж Каневский, Дмитрий (2008). «Телематика: искусственный пассажир и не только». Человеческий фактор и голосовые интерактивные системы . Сигналы и коммуникационные технологии. стр. 291–325. дои : 10.1007/978-0-387-68439-0_10 . ISBN 978-0-387-25482-1 .