Облачная платформа Yandex Cloud представила в своем сервисе Yandex SpeechKit восемь новых голосов с разными эмоциями. Теперь компании смогут использовать дружелюбные, строгие или даже шепотом произносимые интонации в синтезе речи. Это позволит разработчикам изменять тон синтеза речи в зависимости от бизнес-сценария, повышая удовлетворенность клиентов и конверсию в голосовых каналах. Кроме того, в сервис был добавлен новый параметр, позволяющий изменять высоту голоса.
Компании могут выбирать оптимальный голос для своего бизнес-сценария. Например, дружелюбную речь можно использовать для опросов удовлетворенности, а эмпатичную, серьезную интонацию – при сборе обратной связи о качестве обслуживания после жалобы клиента. По исследованию разработчика голосовых роботов Tomoru, разные типы голосов влияют на конверсию продаж и восприятие клиентами речевых коммуникаций. Женские голоса работают лучше при наборе персонала, с конверсией в 68%, тогда как мужские голоса чаще используются в онлайн-образовании, с конверсией в 53%.
Разнообразие голосов в Yandex SpeechKit сделало диалоги роботов менее стереотипными и более естественными. При создании новых голосов разработчики Yandex SpeechKit не только меняли модель машинного обучения, но и текстовую базу, используемую дикторами. Это позволило улучшить звучание голоса в вопросительных и восклицательных предложениях, которые являются сложной задачей для синтеза речи.
“Синтез речи — это популярная технология для автоматизации коммуникаций в контакт-центрах и не только. Нам, как разработчикам, важно в том числе, чтобы диалоги с голосовыми роботами были человечными и комфортными для обычных людей. В будущем мы планируем предоставлять пользователям еще больше новых голосов, – рассказал Григорий Атрепьев, CPO облачной платформы Yandex Cloud.