Компания Microsoft разрабатывает новые возможности в области распознавания речи. Разработчики хотят добиться не только распознавания, перевода на другой язык, но и воспроизведения переведенной речи с сохранением голоса человека.
Впервые подобную разработку компания продемонстрировала во время выступления в Китае. В начале, в реальном времени речь топ-менеджера распознавалась и выводилась на экран субтитрами на английском языке, затем задача усложнилась и субтитры сменились китайским языком, сохранив лексическую и грамматическую особенность речи. Перевод также производился в реальном времени.
И кульминацией презентации стал голосовой перевод. Сотрудник компании говорил фразу на английском языке, а приложение воспроизводило перевод на китайском.
Разработки в этом направлении ведутся совместно с университетом Торонто в течение уже нескольких лет и не смотря на успешную презентацию, программа нуждается в доработке. Технология может совершать ошибки — примерно по одному слову в сложном предложении.
Можно сказать, что новая технология Microsoft приблизилась к финальному завершению и скоро уже будет использована в Microsoft Audio Video Indexing Service. Далее в планах разработчиков расширить использование технологии во всех своих продуктах и перенести сервис на альтернативные мобильные платформы через Google Play и App Store.