GPT-5 против всех: жесткие вайб-кодинг тесты (vs Grok 4, Opus 4.1, Gemini 2.5 pro)

Polza.ai — №1 LLM Агрегатор в России. Регистрируйтесь и пробуйте:
🔗 Больше тестов, инсайтов и новостей в моём Telegram:
🔗 Если нужно что-то автоматизировать, прикрутить AI или что-то закодить, пиши сюда:
🔗 Как оформить Gemini CLI с увеличенным лимитом:
🔗 Промпты для всех тестов из видео:
Сегодня я решил проверить новые нейронки на реально жестких задачах. В бой идут: GPT-5, Grok 4, Claude Opus 4.1, Claude Sonnet 4, Gemini 2.5 Pro и Qwen 3 Coder. Я заставил их делать то, что раньше казалось невозможным для LLM: писать в 1 промыт с нуля iOS-приложения, собирать VST-плагины, запускать игры на PSP, строить фуллстек проекты, фиксить баги на фронте, моделить в Blender и даже писать мелодии в Ableton. Посмотрим, какая модель реально способна работать как мощный кодинг-агент, а какая сыпется даже на простых задачах. 00:00 Начало 00:55 Как сегодня будем тестировать 01:37 Иструменты, которые буду использовать 02:33 Правила тестов 02:53 Создание iOS приложения 03:40 Qwen 3 Coder 04:02 Gemini 2.5 Pro 04:53 Claude Sonnet 4 05:23 Claude Opus 4.1 05:57 Grok 4 06:47 GPT-5 07:18 Итоги 1 раунда 08:48 Создание виртуального синтезатора в виде VST плагина 10:11 Результаты 2 раунда 11:56 Итоги 2 раунда 12:05 Создание игры для PSP 12:43 Результаты 3 раунда 13:59 Итоги 3 раунда 14:18 Создание программы для авто монтажа 15:28 Результаты 4 раунда 16:21 Итоги 4 раунда 16:35 Фикс бага на фронте 17:05 Результаты 5 раунда 17:58 Итоги 5 раунда 18:04 Моделирование в Blender 18:32 Результаты 6 раунда 19:25 Итоги 6 раунда 19:32 Написание мелодии в Ableton Live 20:25 Результаты 7 раунда 23:20 Итоги 7 раунда 23:36 Итоги всех тестов

GPT-5 против всех: жесткие вайб-кодинг тесты (vs Grok 4, Opus 4.1, Gemini 2.5 pro)

Смотрите также