Файнтюнинг и квантизация Llama-3 70B

В этом видео я показываю процесс файнтюнинга Llama 3 70B и квантизации модели с конвертацией в формат GGUF. 💻 immers.cloud – широкий выбор карт для обучения и инференса нейронных сетей:
Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU). Сервис предлагает конкурентоспособные цены и интуитивно понятный интерфейс, который даже начинающие пользователи могут легко освоить и начать работу с необходимым программным обеспечением. 💻 gptchain – фреймворк для быстрого развертывания AI-ассистентов:
Поддерживает интеграцию с Telegram-ботом, Retrieval Augmented Generation (RAG), деплой моделей на LLM сервер и файнтюнинг LLM на собственных данных. Телеграм-канал:
Дискорд: / discord 🤗 Веса моей модели:
📉 Метрики обучения:
Это описание содержит реферальные ссылки.

Смотрите также