Борис Кайсин, Распознавание документов без шаблонов и макетов

Kolesa Conf'24, описание доклада: Классические методы распознавания документов требуют значительных временных ресурсов для поддержания большого количества шаблонов. Поделюсь опытом компании inDrive по внедрению мультимодальных трансформеров, которые позволяют значительно ускорить процесс интеграции новых типов документов. Вы узнаете, как повысить общую эффективность обработки, и какие результаты можно достичь благодаря использованию подхода Visual Question Answering.

Смотрите также