Голосовой поиск перевода
речевого запроса пользователя в текстовый вид, который затем
передается в стандартную систему поиска.
Голосовой поиск основан
на использовании систем
распознавания речи и часто синтеза
речи для автоматизированного возвращения результатов
поиска.
Голосовой поиск
реализуется в следующих направлениях:
-
алфавитный справочник, поиск компании по имени или
категории, поиск человека по списку;
-
поиск информации, такой как новости, финансы, пробки,
направление движения, погода или информация по
кинотеатрам (при этом часто используется управление
многоуровневым голосовым меню);
-
поиск в Интернете, аналогичный тому, как если бы запрос
был напечатан в поисковой строке, но осуществляемый
голосом (иногда приводящий к текстовой выдаче
результатов на мобильном телефоне);
-
выбор опций из длинного списка служб мобильного сервиса,
на портативном устройстве или в автомобильной системе
(песни или радиостанции).
Причиной для использование голоса часто служит то, что
используемое устройство является мобильным телефоном, где
текстовый ввод неудобен или опасно отвлекает внимание, и где
трудно просматривать длинные списки из-за маленького экрана. |
Системы
голосового поиска
Google Voice Search
Патент на технологию Voice
Interface Engine был получен компанией Googe в 2006 году.
Технология привязана и к другим сервисам Google (картам — можно задавать голосовой запрос на поиск места
на карте).
Microsoft
Tellme
В 2008 году компания Tellme,
приобретенная Microsoft за $800 млн., выпустила программное обеспечение для
мобильной платформы Blackberry, позволяющее осуществлять
поиск путем голосового ввода информации. Приложение работает
в бета-версии на английском языке.
Yahoo oneSearch
Приложение от компании Yahoo!
Быстро отвечает на голосовые запросы с мобильных устройств.
Распознает и запоминает местоположение пользователя, выдавая
ему ответы в соответствие с тем, где он находится. Язык
запроса — английский. Приложение с операционной системой
Windows Mobile.
Nuance Voice Control
speech
Помимо навигации, отправки
и приема сообщений, приложение распознает и запросы на поиск
информации в сети. Языки запроса — английский и французский.
VoiceSearchBar
Разработка украинских
программистов, работающая на английском языке и только
с браузером Internet Explorer. Программу можно бесплатно
скачать с сайта проекта.
Голосовой поиск в Baidu
Голосовой поиск запустила
и китайская поисковая система Baidu. Пользователь
системы звонит по специальному номеру, оплачивая разговор
поминутно, диктует поисковый запрос, а затем результаты
поиска высылаются по SMS, однако распознает речь
и осуществляет поиск не алгоритм, а человек, который сам
ищет в поисковике необходимую информацию.
Voice
Digger
Разработка
Центра речевых технологий (2008 г.). Предполагает
автоматический поиск ключевых слов и словосочетаний
в звуковых отрывках, записанных на русском языке. Может
на основе набора звуковых файлов осуществлять подборку
материалов по заданной тематике. Не оформлена в продукт,
доступный для широкого потребления конечными пользователями.
18.06.2013
Microsoft разработала
новую систему мобильного поиска информации, которая получила улучшенный
алгоритм распознавания речевых запросов.
Новый транслятор речи
работает по принципу нейронных сетей и может передавать поисковой
системе Bing "действительно сложные" запросы.
Если
раньше вероятность ошибки при распознавании слов составляла 16%, сейчас
этот показатель снижен до 13%, а в систему добавлен механизм обучения,
позволяющий без сторонней помощи ей улучшать разпознавание, изучая
дикцию и особенности произношения людей.
Новый мобильный поиск
пока только тестируется и доступен он только на территории США.
|
Голосовой поиск
Google
17.09.2010
Доступна функция голосового поиска, в том числе на русском
языке, для смартфонов с Android и iOS. Для
Android-телефонов Голосовой поиск можно скачать в Android
Маркете гайдя его по запросу "Голосовой поиск".. Для iPhone
и Nokia S60 эта функция входит в приложение Google Mobile
App. В телефонах iPhone и Nokia (версия S60 V3) Голосовой
поиск – это одна из функций приложения Google
Mobile App. Голосовой поиск доступен не на всех языках и
не для всех мобильных телефонов.
15.05.2013 Google анонсировала возможность для пользователей браузера Chrome и компьютеров на
Chrome OS запускать поиск голосовой командой "OK Google" без клика на иконку микрофона.
22.05.2013 Google
запустил голосовой ввод поисковых запросов на русском языке
для в браузере
Chrome
27 с персональных компьютеров на главной странице Google
(как через ключевые слова, так и запросами на разговорном
языке).
К компьютеру должен быть подключен работающий микрофон.
Некоторые ноутбуки и компьютеры оснащены встроенными
микрофонами, к другим необходимо подключать внешние.
Работу микрофона можно проверить в звуковых настройках в
параметрах системы или на панели управления.
Для запуска функции необходимо разрешить сайту использовать
микрофон компьютера, нажать на иконку в поисковой строке и
проговорить запрос.
Алгоритм использования Голосового поиска
-
В браузере Chrome перейдите по адресу http://www.google.com/.
Справа в окне поиска отображается серый значок
микрофона.
-
Чтобы выполнить голосовой поиск, нажмите на значок
или, установив курсор в окно поиска, используйте
комбинацию клавиш Ctrl + Shift + точка.
Когда появится большой красный значок микрофона,
произнесите голосовой запрос. Если вы хотите
отменить голосовой поиск, нажмите Отмена.
-
Google интерпретирует произносимые вами слова и
предлагает результаты поиска, так как если бы вы
ввели поисковый запрос на клавиатуре.
Для улучшения обработки голосового ввода Google в
течение нескольких секунд может записывать фоновый шум.
Он сохраняется на устройстве недолго и не отправляется в
Google.
Озвучивание результатов
(синтез речи по тексту)
В браузере Chrome можно задать вопрос и получить на него
ответ голосом. Вы можете получать информацию о различных
фактах, погоде, ценах на акции, летности, результатах
спортивных соревнований, обменных курсах, а также
выполнять математические расчеты и многое другое. В
настоящее время функция поддерживается только на
английском языке.
Эта функция автоматически включена в голосовом поиске.
Чтобы ее отключить, выполните следующие действия.
-
Перейдите по адресу https://www.google.com/preferences.
-
Откройте раздел "Озвучивание результатов" и нажмите Показывать
только текст.
-
Нажмите кнопку Сохранить.
В целях безопасности Google Chrome запоминает разрешение на
использование микрофона только на сайтах, на которых
пользователь работает через защищенный протокол HTTPS. Если
пользователь зашел в свой Google-аккаунт, то страница
поисковика будет всегда открываться через безопасный
протокол.
30.10.2013 Google
представил Android
4.4 KitKat
(новую версию операционной
системы) с интегрированным голосовым поиском.
Чтобы запустить голосовой
поиск, отправить сообщение, осуществить навигацию или
проиграть любимую песню, нужно произнести “OK, Google”.
|
Аудио API в браузерах
27.08.2010
Разработчики Firefox завершили
эксперимент по обработке средствами JavaScript звуковых потоков из
элементов audio и video
использовав
Audio
Data API для
Firefox.
Следом Google выпустила альтернативный Web
Audio API для
Chrome.
Обе реализации
предоставляет
необходимый функционал для
синтеза и проигрывания звука в веб-приложениях, позволяя
создавать,
управлять, анализировать и смешивать аудио на лету в браузере.
Заинтересованные стороны договариваются
в рабочей
группе W3C по аудио о реализации единого
аудио API,
в качестве виде веб-стандарта. |
Звуковой поиск
Звуковой поиск
- поиск по медиапотоку фрагментов речи (определенной темы
или упоминания названия) и преобразования их в доступное для
текстового поиска содержание. Базируется на речевых
технологиях, позволяющих анализировать голосовое содержание
файлов.
При использовании данных технологий в call-центрах они
носят название «речевой
аналитики»,
которая дополняет распознанную речевую информацию, чтобы
сделать некоторый статистический и языковой анализ,
используя готовый текстовый и фонетический материал. Такие
приложения позволяют искать определенные звуковые фрагменты
по необходимым атрибутам (например, определять недовольные
отзывы позвонивших клиентов). |
Голосовая почта
Голосовая почта
(voicemail) — это электронная система для регистрации,
преобразования, сохранения и перенаправления телефонных
голосовых сообщений.
Голосовая почта
-
использует преобразование голосовых файлов в текст для
пересылки в виде электронной почты или sms.
-
предоставляет возможность оставлять голосовые заметки по
телефону и преобразовывать их в текст для эффективного
архивирования, поиска и просмотра.
Под
голосовой почтой
понимают также другие сервисы, предоставляемые операторами и
почтовыми серверами:
-
возможность для абонента телефонной сети оставить
адресату голосовое сообщение, которое тот сможет
прослушать позже.
-
возможность прослушать по телефону хранящиеся на сервере
электронной почты сообщения, читаемые роботом.
Услугу голосовой почты предоставляют абонентам практически
все операторы сотовой связи и некоторые операторы
традиционной телефонии. Для пользования услугой необходим
телефонный аппарат, который может работать в режиме
частотного (тонового) набора номера. |
|