Информационный портал ITSZ

Оригинал документа: http://spbit.su/news/n169368/


     
 

Яндекс запустил распознавание речи за секунду

05.08.2014 09:00
«Яндекс» анонсировал запуск тестового периода для облачного сервиса распознавания речи SpeechKit Cloud. С помощью SpeechKit Cloud разработчики могут научить свои продукты понимать голос человека. Обработка и распознавание голосовых запросов производится на серверах «Яндекса», рассчитанных на высокие нагрузки. Как сообщают в компании, скорость распознавания занимает около одной секунды.

Качество распознавания на русском языке диктовки текстов с помощью SpeechKit Cloud.  составляет 82%, геозависимых запросов — 95%, коротких запросов из 3–5 слов на любую тематику — 85%.  Поддержку SpeechKit Cloud можно добавить в самые разные программы, сервисы и устройства: от компьютерной игры до автомобильной навигационной системы.

SpeechKit Cloud понимает русский и турецкий языки. Как пояснили в пресс-службе «Яндекса», компания сейчас активно развивается в Турции, сервисы становятся всё более популярными, и они адаптируются под турецкий рынок. В ближайших планах реализация распознавания английского языка. 

В основе SpeechKit Cloud лежит технология распознавания речи Yandex SpeechKit, которую «Яндекс» запустил в 2013 году. Сейчас она используется в 400 мобильных приложениях для Android, iOS и Windows Phone и ежедневно обрабатывает миллионы голосовых запросов.

Yandex SpeechKit умеет распознавать короткие запросы любой тематики, геозапросы (адреса, названия организаций и географических объектов), диктовку коротких текстов (например, комментариев). Короткие запросы любой тематики — это, по сути, всё, что люди ищут в Интернете. Кроме того, сервис можно использовать для запросов на музыкальную тематику (названия песен и групп, имена исполнителей). 

В основе Yandex SpeechKit лежат акустические и языковые модели. Они построены с применением нейронных сетей, которые обучаются на больших массивах данных. Это позволяет добиться высокого качества распознавания речи даже в условиях внешнего шума. Инфраструктура системы спроектирована таким образом, чтобы выдерживать высокие нагрузки.

Сегодня Yandex SpeechKit каждый день обрабатывает миллионы голосовых запросов. Yandex SpeechKit уже используется в  мобильных продуктах «Яндекса». На его основе работают голосовые команды в «Яндекс». Навигаторе, голосовой поиск в «Яндекс.Картах»,  «Поиске»,  «Яндекс.Браузере» и «Яндекс.Городе». Кроме этого, библиотека Yandex SpeechKit Mobile используется в более 400 приложениях разной тематики (справочники, игры, интернет-магазины).  SpeechKit Mobile SDK можно использовать для iOS, Android и WP8+. Библиотеку SpeechKit Mobile SDK можно использовать бесплатно для обработки до 10 000 запросов в месяц. Трафик свыше лимита оплачивается. 

SpeechKit Cloud API для коммерческого использования является платным. Однако разработчики могут бесплатно использовать SpeechKit Cloud в течение месяца. По окончании пробного периода стоимость будет зависеть от количества запросов.

Взаимодействие партнёров со Speechkit Cloud происходит через HTTP API, поэтому чтобы интегрировать эту технологию «Яндекса», необходимо прочитать всего пару страниц документации и написать несколько строчек кода в своём продукте. Использование API позволяет значительно сократить время интеграции и применять технологию распознавания речи «Яндекса» в различных сценариях. 

Облачный сервис распознавания речи «Яндекса» уже используют компания Oktell, выпускающая программное обеспечение для колл-центров, и Cubic Robotics — разработчик домашнего робота CUBIC. Робот понимает заданные голосом вопросы и отвечает на них, а система Oktell распознаёт речь звонящего в колл-центр человека и соединяет его с нужным специалистом.

Автор: Алексей Писарев (info@mskit.ru)

Рубрики: Web

наверх
 
 
     

А знаете ли Вы что?

     
   
     


Copyright 2004 ITSZ. Все права защищены
Перепечатка материалов приветствуется при ссылке на www.ITSZ.spbit.su
Ресурс разработан и поддерживается компанией Peterlink Web