Сайт использует сервис веб-аналитики Яндекс Метрика с помощью технологии «cookie». Пользуясь сайтом, вы даете согласие на использование данной технологии.
Представление текста, токенизация. Ruadapt Тихомиров Михаил Михайлович 00:17 Представление текста, токенизация. Ruadapt 00:49 Проблемы информационного поиска 02:00 Графематический анализ (токенизация) 02:46 Сегментация текста на слова 05:38 Практические решения 06:44 Операции со словами 07:33 Морфологический анализ 08:55 Токенизация для больших языковых моделей 33:15 Пример токенизации текста в ChatGPT 39:15 Ruadapt 57:23 Пример адаптации знаний 59:12 Серия моделей RuadaptQwen2.5 01:05:49 Серия моделей RuadaptQwen3 Ссылка на плейлист Teach-In: Ссылка на плейлист YouTube: • Искусственный интеллект - Лукашевич Наталь... Ссылка на плейлист VK: Ссылка на плейлист RuTube: