Сайт использует сервис веб-аналитики Яндекс Метрика с помощью технологии «cookie». Пользуясь сайтом, вы даете согласие на использование данной технологии.
Александр Федотов. "Трансформер. Когда первая ассоциация – это не Оптимус Прайм"
Большие языковые модели. Кто-то считает их чем-то нереальным и слишком сложным, кто-то уже знает про нейроны и веса и представляет себе просто набор слоев. Мы же с вами углубимся в сердце GPT и разберемся, как оно реально устроено. Поймем, почему существуют ограничения при работе с LLM и как гиперпараметры влияют на саму модель.