Д2.3. Workshop: Making LLaMa Multimodal. Іван Дідур.

Ivan Didur, CTO at DataRoot Labs. Workshop: Making LLaMa Multimodal. Сучасні LLM - більше ніж просто мовні моделі. Мультимодальність, тобто одночасна робота з текстом, зображеннями, аудіо чи відео - це один з наважливіших трендів і напрямків їх розвитку. У воркшопі покажемо, як зафайнтюнити найсучаснішу (на момент заходу) open-source модель LLaMa 3.1 за допомогою зображень! Матеріали: 1. Датасет і результати (
2. Код (
3. Презентація:(
4. Рекомендований матеріал по LLM від Івана: (
Літня школа «Штучний інтелект 2024: сьогодення і майбутнє» на ФІОТ - День 2.

Смотрите также