#055 ML Илья Гусев. Как запускать большие языковые модели локально

Гостем выпуска стал Илья Гусев - известный NLP-специалист, сделавший большой вклад в область своими опенсорс-проектами, среди которых анализатор морфологии, генератор стихов, сборка различных датасетов и некоторые другие. Один из таких проектов как раз и стал поводом к сегодняшнему общению. Это большая языковая модель, заточенная на работу с русским языком - Сайга. Но говорим в выпуске мы далеко не только о ней. Илья сделал классный исторический экскурс в современные языковые модели, рассказал некоторые подробности об их устройстве, о тех подходах, которые применяют, чтобы такие модели можно было запускать на домашнем компьютере, как с помощью языковых моделей можно решать разные задачи и стоит ли вообще использовать локальные модели. Интересного и полезного прослушивания! Ссылки выпуска: Статья Ильи на Хабре "Как (быстро) сделать русский локальный ChatGPT" (
Сервис для запуска больших языковых моделей локально - lmstudio (
Репозиторий сервиса oobabooga, с помощью которого можно запустить веб-интерфейс для работы с LLM локально (
Репозиторий сервиса Text Generation Inference (TGI), который позволяет развертывать и поддерживать LLM (
Статья на arxiv "Self-Consuming Generative Models Go MAD" с анализом того, к чему приводят разные подходы обучения LLM на синтетических датасетах, сгенерированных другими LLM (
Пост Ильи со списком материалов для погружения в NLP (
Выпуск подкаста на mawe -
Все выпуски подкаста на mawe -
Подкаст на Apple Podcasts -
Подкаст на Google Подкастах -
Подкаст в Яндекс Музыке -
Паблик подкаста ВКонтакте - https://vk.com/mlpodcast
Телеграм-канал "Стать специалистом по машинному обучению" -
Чат в телеграм, где можно обсудить выпуски, предложить гостей и темы подкаста и просто пообщаться (
Телеграм автора подкаста - @kmsint Бесплатный курс по созданию телеграм-ботов на Python и aiogram от автора подкаста -
Продвинутый курс по созданию телеграм-ботов на Python -
Поблагодарить автора подкаста можно добрым словом и/или донатом:

#055 ML Илья Гусев. Как запускать большие языковые модели локально

Смотрите также