В германском Ганновере проходит самая известная в мире выставка компьютеров и новинок электроники CeBIT.
Компьютер станет ближе к человеку, общение между ними станет более естественным и непосредственным
Каждую весну начиная с 1986 года здесь показывают главные достижения сферы, которая определяет развитие человечества.
В этом году посетители выставки узнали, что мир стоит на пороге компьютерной революции. Об этом заявил президент Microsoft Стивен Балмер, открывая CeBIT-2008.
Балмер прогнозирует, что компьютеры в обозримом будущем станут еще миниатюрнее, но при этом их ресурсы, объемы баз данных будут только расти.
А помимо традиционных форм ввода данных самое широкое распространение получат новые. Интеллектуальные машины станут ближе к человеку, а общение с ними – более естественным и непосредственным.
Люди будут работать на компьютере через сенсорный экран и с помощью голоса. Для примера Microsoft привез на выставку систему голосового управления компьютером на базе Windows Vista.
Отрадно, что отличились в этом направлении и россияне. Петербургский Центр речевых технологий представил на выставке CeBIT свою разработку – систему голосового управления, с помощью которого можно заставить выполнять команды курсор компьютерной мыши, клавиатуру и даже робота-андроида.
Как работает технология, корреспонденту газеты ВЗГЛЯД рассказала начальник отдела Центра речевых технологий София Щерба: «Разработкой речевых технологий для различных аппаратных приложений мы начали заниматься еще в 1990-е годы.
Переход на бесклавиатурные и беспроводные технологии – это общемировая тенденция. Мы идем в том же направлении. Все решения базируются на нескольких технологиях, в том числе и VoiceCom – нашей патентованной технологии распознавания голосовых команд.
Программа управления компьютерной мышкой называется Speech Mouse. Через микрофонную гарнитуру можно отдавать типичные команды, отвечающие на вопрос «Куда?»: влево, вправо, вверх, вниз – и «Что делать?»: клик, двойной клик – курсор на компьютере двигается соответственно вашим словам.
На всемирной выставке в Ганновере петербуржцы представили робота с голосовым управлением |
Отметим, что технология эта виртуальная – словами вы подменяете мышь, но не командуете действиями обычной мышки с проводом, объясняют специалисты. От слов «влево» и «вправо» мышка не будет дергаться и ездить по столу.
Эксперты уверены, что речевые технологии в компьютерной технике развиваются стремительно. А петербуржцам удалось разработать уникальные решения, которые способны распознавать русскую речь.
«Для английского языка существует достаточно много подобных устройств, – объясняет София Щерба. – Для русского – только у нас. Мы долго над этим работали. Если на американский «движок» грубо подставить русский словарь – ничего не получится. У нас все сложнее. Ведь русский язык отличается от всех других языков, например, произвольным порядком слов, вялой артикуляцией и другими характеристиками».
Управление мышкой – это не все, что придумали в Центре речевых технологий, также, в частности, разработана система идентификации человека по голосу – Voice Key. Ей прочат большое будущее в банковском деле. Речь идет, скажем, о голосовом доступе к состоянию счета в банке.
Есть ряд неотъемлемых характеристик человека, которые используются для подтверждения его личности: отпечатки пальцев, сканирование радужной оболочки глаза. Но установка соответствующих систем – процедура дорогая.
Идентифицировать клиента банка по голосу дешевле. Нужна лишь сама программа и подключенный микрофон или гарнитура.
«Как это выглядит? Задается пароль – любая фраза, главное, чтобы она была фонетически представительной, то есть система имела бы достаточный для подтверждения личности человека речевой материал. Система верификации анализирует характеристики голоса и определяет, тот человек, за которого себя выдает, или нет», – рассказывают петербургские разработчики.
Сразу возникает вопрос: а если человек охрип, потерял голос?..
«Если голос пропал совсем, тогда все плохо, – объясняет София Щерба. – Ну а в более простых случаях шансы есть. Известно, например, что голос человека немного меняется даже в течение одного дня или, допустим, при болезни. Для предотвращения отказа своему система периодически обновляет базу эталонов – сохраняет записи ваших последних посещений и удаляет более ранние. Когда вы в очередной раз произносите парольную фразу, компьютер сверяет ее с актуальными эталонами и приходит к выводу, что это все-таки вы, хотя и говорите, может быть, с хрипотцой».
Также на всемирной выставке в Ганновере петербуржцы представили робота с голосовым управлением. Петербуржцы начинили одну из машин, созданных в российской компании «Андроидные роботы», своим речевым интерфейсом.
С помощью голосовых команд андроида можно заставить ходить, сидеть, танцевать и даже говорить с помощью программы синтеза русской речи. Пока робот говорит как гуманоид из фантастических фильмов, но недалек час, когда его речь практически не будет отличаться от человеческой, – Центр речевых технологий получил грант Федерального агентства по науке и инновациям на создание естественного синтезатора русской речи.