Сайт использует сервис веб-аналитики Яндекс Метрика с помощью технологии «cookie». Пользуясь сайтом, вы даете согласие на использование данной технологии.
Желтый Club Talks — T-Lite и T-Pro: философия подхода и ответы на популярные вопросы
Этот выпуск особенный по двум причинам. Во-первых, это предновогодний спешл, а во-вторых, речь пойдет про недавний релиз двух больших языковых моделей — T-Lite и T-Pro. Разговор пойдет в необычном формате: прозвучат именно те вопросы, что чаще всего задавались от комьюнити в комментариях к релизу. Ведущий выпуска: — Даниил Гаврилов, руководитель Research-команды Т-Банка. В гостях: — Анатолий Потапов, руководитель команды фундаментальных технологий LLM Т-Банка; — Никита Сурначев, руководитель команды alignment Т-Банка. Таймкоды: 0:00 Интро 0:49 Знакомство с гостями 2:46 В чем философия подхода создания моделей T-Lite и T-Pro 5:23 Какие смыслы заложены в continual pre-training 7:22 Рецепт улучшения больших языковых моделей continual pre-training 12:24 Зачем делать continual pre-training, а не pre-training с нуля 18:07 Какие есть проблемы у continual pre-training подхода 21:38 Что используется внутри Т-Банка и что получили от open source релиза 26:26 Про бенчмарки 35:28 Что по безопасности использования LLM 38:26 Эпоха inference time scaling — на сколько это нужно продуктам 42:24 Зачем нужна библиотека для alignment — Turbo Alignment 47:34 Когда ждать следующих релизов Полезные ссылки: Предыдущий выпуск с Никитой Балаганским и Ярославом Аксеновым Статья на Хабре с бенчмарками и описание подхода А также подписывайтесь на наши каналы: Наш телеграм: Дайджесты, статьи и анонсы митапов: Жизнь команды изнутри и вакансии по направлениям: Блог на Хабре: