Yandex Cloud добавила в SpeechKit нейросети, которые распознают и синтезируют речь на узбекском языке

Дата:15.06.2023
Источник:vc.ru
Поделиться в Twitter Поделиться в F******k Поделиться в VKontakte Поделиться в Telegram Поделиться в Mastodon

С помощью новых моделей можно создавать голосовых помощников и озвучивать тексты на узбекском языке.

  • Нейросети для синтеза и распознавания узбекского работают с латинским алфавитом, который в Узбекистане используют более 20 лет, рассказала компания. Модели обучали на предзаписях голоса диктора, тысячах часов аудио и их расшифровках — с короткими и длинными фразами, именами, адресами, датами и числами.
  • Компания научила алгоритмы синтеза учитывать звуковые особенности некоторых букв.
  • Модели также умеют синтезировать речь не только из текста, но и из фонемной записи, если слова или имена собственные произносятся не по правилам. Для этого нужно указать в тексте фонемный разбор нужного слова с помощью специального синтаксиса.
  • Настроить модели можно через API.

Новые возможности уже тестируют некоторые компании, среди них — ИТ-фирма Kolesa Group, Unistar Digital и Tomoru, а также ИИ-сервисы TargetAI и JustAI.


Метки


Распространение материалов сайта означает, что распространитель принял условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2024