Генерация речи с помощью LLM: Борис Жестков, SberDevices

Спикер: Борис Жестков, Team Lead RnD.TTS, SberDevices. Рассмотрели подходы к генерации голоса с помощью разных LLM-архитектур. Борис рассказал про одноголосный и мультиголосный подходы, о возможных способах кодирования аудио и о клонировании голоса промтингом — VALL-E. Разобрались, как управлять генерацией с текстовыми инструкциями и повышать качество и стабильность синтеза речи LLM. Наш телеграм:
Дайджесты, статьи и анонсы митапов:
Жизнь команда изнутри и вакансии по направлениям:
Блог на Хабре:

Смотрите также