Артём Рычко, NLP по-казахски: от ASR до LLM

Kolesa Conf'23, описание доклада: Расскажу, как в нашей компании решали полный комплекс задач по NLP для казахского, русского, смешанного языков начиная с 2017 года. Как мы сделали лучший ASR для казахского языка с помощью русского языка и сколько человеко-часов разметки это стоило. Как делаем синтез, который вы слышите в call-center-ах. Путь от fine-tune LM BERT-а до fine-tune 70b llama2 для казахского, русского и смешанного языков

Смотрите также