Объяснение «Трансформеров»: открытие, которое навсегда изменило искусственный интеллект

Практически все современные модели ИИ, от ChatGPT и Claude до Gemini и Grok, построены на одном и том же фундаменте: Трансформере. В этом видео Анкит Гупта из YC прослеживает, как ИИ научился понимать язык — от ранних рекуррентных нейронных сетей (RNN) и длинных длинных сетей (LSTM) до механизмов внимания и революционной статьи 2017 года «Внимание — это всё, что вам нужно» — открытия, открывшего эпоху современного ИИ.

Смотрите также