Вебинар «Бенчмарки агентных систем и новые функции в HiveTrace»

Расскажем о самых актуальных бенчмарках, которые сегодня применяются для оценки поведения агентных систем, и о том, какие метрики реально отражают качество и надежность ИИ-моделей. Для кого: специалисты по безопасности, ML-инженеры, продакты, исследователи ИИ и все, кто работает с LLM и агентными системами. Специальный гость – Роман Куцев. Founder LLM Arena, Ex-Founder TrainingData, выпускник ВМК МГУ, 8 лет занимается сбором и разметкой данных. Автор популярных публикаций на Хабре и докладов о бенчмарках и разметке данных. Во второй части вебинара команда HiveTrace представит новый инструмент HiveTrace Red – решение для red-teaming и тестирования уязвимостей ИИ-моделей. Мы также покажем новые функции платформы HiveTrace, появившиеся за последние месяцы, и расскажем, как они помогают автоматизировать тестирование, мониторинг и анализ безопасности GenAI-приложений. Подробнее о HiveTrace:
Телеграм-канал AI Security Lab:
Блог на Хабре:

Смотрите также