Синтез речи в 2020

Синтез речи в 2020 году достиг уже достаточного качества, чтобы синтезированную речь можно было спутать с записью настоящего человека. На семинаре рассмотрим, как так получилось. Будут рассказаны основы работы с аудио и речью для тех, кто никогда ранее не работал в этой области. Будут подробно рассмотрены самые популярные архитектуры для синтеза речи, такие как Tacotron, FastSpeech, будут рассмотрены их основные недостатки и способы их устранения. Будут также подробно рассмотрены различные вокодеры (и будет рассказано, что это такое): от WaveNet и LPCNet до WaveFLow. Докладчик: Сергей Полежаев. Слайды:

Смотрите также