Сайт использует сервис веб-аналитики Яндекс Метрика с помощью технологии «cookie». Пользуясь сайтом, вы даете согласие на использование данной технологии.
Одна из самых больших проблем, с которыми мы сталкиваемся при работе с LLM, заключается в том, что их знания слишком общны и ограничены для чего-то нового. Именно поэтому RAG так популярен — это метод предоставления LLM внешних знаний, которые вы курируете, чтобы они могли стать экспертом по вашим данным. Проблема в том, что этот этап «курирования» может быть очень сложным, если у вас данные во множестве разных форматов. Именно здесь на помощь приходит Docling! Docling — это конвейер данных с открытым исходным кодом и фреймворк для фрагментации, специально разработанный для обработки всех ваших форматов данных и их подготовки для LLM. В этом видео я покажу вам, как использовать Docling для извлечения текста практически из ЛЮБОГО типа файла и его идеальной фрагментации для системы RAG. Кроме того, в конце я даже покажу вам созданный мной ИИ-агент RAG, использующий Docling для движка RAG, который вы можете использовать в качестве шаблона прямо сейчас (ссылка ниже)! ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Если вы хотите увидеть Docling в действии в рамках готового к использованию конвейера RAG и ИИ-агента, посетите Dynamous (семинар по Docling в эту пятницу!): ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Агент RAG Docling и примеры: Репозиторий Docling на GitHub: Docling Документация: ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 00:00 — Знакомство с Docling — RAG стал проще 01:36 — Начало работы с Docling 03:33 — Динамическое событие — Полный конвейер RAG с Docling 04:04 — Пример №1 — Анализ PDF 06:26 — Пример №2 — Работа с различными типами файлов 08:24 — Пример №3 — Извлечение текста из аудиофайлов 10:30 — Пример №4 — Гибридное разделение на фрагменты 14:26 — Больше ресурсов по Docling (столько примеров!) 15:41 — Грандиозный финал — Docling RAG AI Agent 20:36 — Финал Мысли ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Присоединяйтесь ко мне и расширяйте границы возможностей искусственного интеллекта. Я буду выкладывать видео каждую неделю — по средам в 19:00 по центральному поясному времени!