ГОЛОСОВОЙ ПОИСК

 

 

Голосовой поиск перевода речевого запроса пользователя в текстовый вид, который затем передается в стандартную систему поиска.

Голосовой поиск основан на использовании систем распознавания речи и часто синтеза речи для автоматизированного возвращения результатов поиска.

Голосовой поиск реализуется в следующих направлениях:

  • алфавитный справочник, поиск компании по имени или категории, поиск человека по списку;

  • поиск информации, такой как новости, финансы, пробки, направление движения, погода или информация по кинотеатрам (при этом часто используется управление многоуровневым голосовым меню);

  • поиск в Интернете, аналогичный тому, как если бы запрос был напечатан в поисковой строке, но осуществляемый голосом (иногда приводящий к текстовой выдаче результатов на мобильном телефоне);

  • выбор опций из длинного списка служб мобильного сервиса, на портативном устройстве или в автомобильной системе (песни или радиостанции).

Причиной для использование голоса часто служит то, что используемое устройство является мобильным телефоном, где текстовый ввод неудобен или опасно отвлекает внимание, и где трудно просматривать длинные списки из-за маленького экрана.

 

 

Системы голосового поиска

Google Voice Search

Патент на технологию Voice Interface Engine был получен компанией Googe в 2006 году. Технология привязана и к другим сервисам Google (картам — можно задавать голосовой запрос на поиск места на карте).

Microsoft Tellme

В 2008 году компания Tellme, приобретенная Microsoft за $800 млн., выпустила программное обеспечение для мобильной платформы Blackberry, позволяющее осуществлять поиск путем голосового ввода информации. Приложение работает в бета-версии на английском языке.

Yahoo oneSearch

Приложение от компании Yahoo! Быстро отвечает на голосовые запросы с мобильных устройств. Распознает и запоминает местоположение пользователя, выдавая ему ответы в соответствие с тем, где он находится. Язык запроса — английский. Приложение с операционной системой Windows Mobile.

Nuance Voice Control speech

Помимо навигации, отправки и приема сообщений, приложение распознает и запросы на поиск информации в сети. Языки запроса — английский и французский.

VoiceSearchBar

Разработка украинских программистов, работающая на английском языке и только с браузером Internet Explorer. Программу можно бесплатно скачать с сайта проекта.

Голосовой поиск в Baidu

Голосовой поиск запустила и китайская поисковая система Baidu.  Пользователь системы звонит по специальному номеру, оплачивая разговор поминутно, диктует поисковый запрос, а затем результаты поиска высылаются по SMS, однако распознает речь и осуществляет поиск не алгоритм, а человек, который сам ищет в поисковике необходимую информацию.

Voice Digger

Разработка Центра речевых технологий (2008 г.). Предполагает автоматический поиск ключевых слов и словосочетаний в звуковых отрывках, записанных на русском языке. Может на основе набора звуковых файлов осуществлять подборку материалов по заданной тематике. Не оформлена в продукт, доступный для широкого потребления конечными пользователями.

 

18.06.2013

Microsoft разработала новую систему мобильного поиска информации, которая получила улучшенный алгоритм распознавания речевых запросов. 
Новый транслятор речи работает по принципу нейронных сетей и может передавать поисковой системе Bing "действительно сложные" запросы.
Если раньше вероятность ошибки при распознавании слов составляла 16%, сейчас этот показатель снижен до 13%, а в систему добавлен механизм обучения, позволяющий без сторонней помощи ей улучшать разпознавание, изучая дикцию и особенности произношения людей. 
Новый мобильный поиск пока только тестируется и доступен он только на территории США.

 

 

 

Голосовой поиск Google

17.09.2010 Доступна функция голосового поиска, в том числе на русском языке,  для смартфонов с Android и iOS. Для Android-телефонов Голосовой поиск можно скачать в Android Маркете гайдя его по запросу "Голосовой поиск".. Для iPhone и Nokia S60 эта функция входит в приложение Google Mobile App. В телефонах iPhone и Nokia (версия S60 V3) Голосовой поиск – это одна из функций приложения Google Mobile App. Голосовой поиск доступен не на всех языках и не для всех мобильных телефонов.

 

15.05.2013 Google анонсировала возможность для пользователей браузера Chrome и компьютеров на Chrome OS запускать поиск голосовой командой "OK Google" без клика на иконку микрофона.

 

22.05.2013 Google запустил голосовой ввод поисковых запросов на русском языке для в браузере Chrome 27  с персональных компьютеров на главной странице Google (как через ключевые слова, так и запросами на разговорном языке).

К компьютеру должен быть подключен работающий микрофон. Некоторые ноутбуки и компьютеры оснащены встроенными микрофонами, к другим необходимо подключать внешние. Работу микрофона можно проверить в звуковых настройках в параметрах системы или на панели управления.

Для запуска функции необходимо разрешить сайту использовать микрофон компьютера, нажать на иконку в поисковой строке и проговорить запрос.

Алгоритм использования Голосового поиска

  1. В браузере Chrome перейдите по адресу http://www.google.com/. Справа в окне поиска отображается серый значок микрофона.

  2. Чтобы выполнить голосовой поиск, нажмите на значок или, установив курсор в окно поиска, используйте комбинацию клавиш Ctrl + Shift + точка. Когда появится большой красный значок микрофона, произнесите голосовой запрос. Если вы хотите отменить голосовой поиск, нажмите Отмена.

  3. Google интерпретирует произносимые вами слова и предлагает результаты поиска, так как если бы вы ввели поисковый запрос на клавиатуре.

Для улучшения обработки голосового ввода Google в течение нескольких секунд может записывать фоновый шум. Он сохраняется на устройстве недолго и не отправляется в Google.

Озвучивание результатов (синтез речи по тексту)

В браузере Chrome можно задать вопрос и получить на него ответ голосом. Вы можете получать информацию о различных фактах, погоде, ценах на акции, летности, результатах спортивных соревнований, обменных курсах, а также выполнять математические расчеты и многое другое. В настоящее время функция поддерживается только на английском языке.

Эта функция автоматически включена в голосовом поиске.

Чтобы ее отключить, выполните следующие действия.

  1. Перейдите по адресу https://www.google.com/preferences.

  2. Откройте раздел "Озвучивание результатов" и нажмите Показывать только текст.

  3. Нажмите кнопку Сохранить.

В целях безопасности Google Chrome запоминает разрешение на использование микрофона только на сайтах, на которых пользователь работает через защищенный протокол HTTPS. Если пользователь зашел в свой Google-аккаунт, то страница поисковика будет всегда открываться через безопасный протокол.

 

30.10.2013 Google представил  Android 4.4 KitKat (новую версию операционной системы) с интегрированным  голосовым поиском. Чтобы запустить голосовой поиск, отправить сообщение, осуществить навигацию или проиграть любимую песню, нужно произнести “OK, Google”.

 

 

 

 

Аудио API в браузерах

27.08.2010 Разработчики Firefox завершили эксперимент по обработке средствами JavaScript звуковых потоков из элементов audio и video  использовав Audio Data API для Firefox.

Следом Google выпустила альтернативный Web Audio API для Chrome.

Обе реализации  предоставляет необходимый функционал для синтеза и проигрывания звука в веб-приложениях, позволяя создавать, управлять, анализировать и смешивать аудио на лету в браузере.

Заинтересованные стороны договариваются в рабочей группе W3C по аудио  о реализации  единого аудио API, в качестве виде веб-стандарта.

 

 

 

Звуковой поиск

Звуковой поиск - поиск по медиапотоку фрагментов речи (определенной темы или упоминания названия) и преобразования их в доступное для текстового поиска содержание.  Базируется на речевых технологиях, позволяющих анализировать голосовое содержание файлов.

При использовании данных технологий в call-центрах они носят название «речевой аналитики», которая дополняет распознанную речевую информацию, чтобы сделать некоторый статистический и языковой анализ, используя готовый текстовый и фонетический материал. Такие приложения позволяют искать определенные звуковые фрагменты по необходимым атрибутам (например, определять недовольные отзывы позвонивших клиентов).

 

 

 

Голосовая почта

Голосовая почта (voicemail) — это электронная система для регистрации, преобразования, сохранения и перенаправления телефонных голосовых сообщений.

Голосовая почта

  • использует преобразование голосовых файлов в текст для пересылки в виде электронной почты или sms.

  • предоставляет возможность оставлять голосовые заметки по телефону и преобразовывать их в текст для эффективного архивирования, поиска и просмотра.

Под голосовой почтой понимают также другие сервисы, предоставляемые операторами и почтовыми серверами:

  • возможность для абонента телефонной сети оставить адресату голосовое сообщение, которое тот сможет прослушать позже.

  • возможность прослушать по телефону хранящиеся на сервере электронной почты сообщения, читаемые роботом.

Услугу голосовой почты предоставляют абонентам практически все операторы сотовой связи и некоторые операторы традиционной телефонии. Для пользования услугой необходим телефонный аппарат, который может работать в режиме частотного (тонового) набора номера.

 

 

 15.11.2013

kmp