Компания Яндекс сообщила о переходе на собственный движок распознавания голоса в мобильных приложениях - Yandex SpeechKit. Ранее для этих целей использовались инструменты, разработанные компанией Nuance.

Новая платформа поддерживает мобильные платформы iOS и Android, а для работы использует, по словам разработчиков, две категории запросов: общая (все, что пользователи ищут в Сети) и гео, связанная с названиями организаций, адресами и т.д.

Голосовой ввод поддерживает пока только русский язык – турецкая и украинская версии поисковой системы пока продолжают использовать инструменты Nuance.

Библиотеки SpeechKit как для iOS, так и для системы Android разработчики могут получить бесплатно, однако при этом присутствует лимит на количество запросов к движку – не более 10000 запросов в сутки. Стоимость запросов при превышении данного лимита компания пока не публикует.

Запуск Yandex SpeechKit именно для мобильных операционных систем, по совам представителей компании, обусловлен, прежде всего, актуальностью данного направления там, где присутствуют затруднения с текстовым вводом. В компании также отметили, что не исключают запуска движка и для настольных приложений.

Тестирование, проведенное Yandex, показало, что SpeechKit способен корректно распознавать 94% слов в категории геозапросов и 84% слов – в общей категории. Среднее время распознавания запроса составляет порядка 1,1 секунды.

При разработке Yandex SpeechKit специалисты использовали почти 300 часов детской, женской и мужской речи для формирования акустических моделей, а также сотни миллионов специальных текстовых блоков для обучения языковой модели.

Стоит отметить, что инструменты API распознавания голоса для мобильных устройств предоставляет и компания Google (только для платформы Android). При этом никаких лимитов количество бесплатных запросов не предусмотрено.

captcha