Как большие языковые модели создают галлюцинации: лекция профессора Крылова на канале Artezio

Компания Artezio приглашает всех заинтересованных в современных технологиях искусственного интеллекта на публичную лекцию своего научного консультанта, профессора Владимира Крылова. Лекция посвящена развитию больших языковых моделей, которые способны генерировать тексты на любые темы, а также создавать галлюцинации - неожиданные и необычные ассоциации и образы. Языковые модели представляют собой системы, обученные на огромных объемах текстовых данных, чтобы выполнять задачи обработки естественного языка, такие как перевод, генерация текста или ответы на вопросы. "Большие" модели обучены на миллиардах слов, что позволяет им понимать и генерировать текст на уровне, сравнимом с человеческим. Под галлюцинациями в контексте языковых моделей понимается создание информации, которая не была в исходных данных или является неправильной. Это может проявляться в виде неверной информации, странного текста или нелепых утверждений. Проблема в том, что, несмотря на огромный объем данных, на котором обучается модель, она все равно не знает всего. Когда модель сталкивается с неизвестной ей информацией или сложным запросом, она может "выдумать" ответ, опираясь на свои внутренние паттерны. Галлюцинации могут быть просто забавными или странными, но иногда они могут привести к распространению неверной информации. Важно понимать, что, несмотря на впечатляющие возможности ИИ, они не идеальны. Использование языковых моделей требует критического подхода и проверки полученной информации. Профессор Владимир Крылов рассказал о том, как работают большие языковые модели, какие проблемы и вызовы они ставят перед учеными и разработчиками, какие возможности и перспективы они открывают для человечества. Он также продемонстрировал несколько примеров галлюцинаций, созданных большими языковыми моделями, и обсудил их смысл и ценность. После лекции слушатели задали свои вопросы Владимиру Крылову. Если вы хотите работать в ИТ и в Artezio, отправляйте своё резюме по ссылке
00:00 Введение. 2:10 Лекция. 46:30 Вопросы слушателей. Как Вы оцениваете перспективы обучения генеративных сетей с помощью подключения к интернету? 49:10 Как регулировать температуру ответов? 51:00 Недавно Илон Маск сказал, что для обучения GPT-5 будет использоваться 30 - 50 тысяч видеокарт. Значит ли это, что уже готовятся выпустить GPT-5? 53:10 Некоторые утверждали, что ответы GPT-4 стали хуже после обретения ею массовой популярности. Могли ли запросы рядовых пользователей "отупить" GPT-4? 55:55 Сможет ли ИИ однажды захватить мир?

Смотрите также