Gemini 3.0 (полностью протестировано в Riftrunner): ХУДШАЯ на данный момент контрольная точка Gem...

В этом видео я буду тестировать новую контрольную точку «Riftrunner» от Google для Gemini 3 на LM Arena, показывать реальные подсказки и результаты, как протестировать её самостоятельно и как она соотносится с X58, ECPT и Sonnet. -- Ключевые выводы: 🚀 Контрольная точка Google для Gemini 3 Riftrunner уже доступна на LM Arena и выглядит как релиз-кандидат. 🕹️ Как протестировать: откройте LM Arena, выберите режим «Битва», отправьте подсказки и проголосуйте; Riftrunner появится среди моделей. 🧩 Визуальные задачи: план этажа скучный, но проходимый; SVG-панда с бургером неплохая (бургер отличный); Покебол в ThreeJS выглядит потрясающе; сад бабочек — один из лучших. ♟️ Шахматная доска с автоигрой полностью провалена — первая контрольная точка Gemini 3, не прошедшая этот тест. 🎮 Клон Minecraft Kandinsky запускается, но ломается при прыжке, отправляя игрока в небеса. 💻 Кодирование: Rust CLI хорош; скрипт Blender неплох, но по сравнению с X58 ему не хватает освещения/текстур. 📐 Логика: решает один математический вопрос и не решает другой; головоломка решена (даже сгенерирована HTML-страница). 📊 Производительность: примерно на ~15% выше Sonnet, но на ~14% ниже лучшего результата X58; в целом занимает 5-е место среди недавних контрольных точек. 🔒 Вероятные причины: дополнительные фильтры безопасности, настройка чата и/или квантизация; возможно, это вариант в стиле Flash, но это не подтверждено. 🔮 Вердикт: солидный шаг вперёд по сравнению с моделями текущего поколения, а не «момент Sonnet 3.5»; надеемся на Ultra и доступ к контрольным точкам X58. 📰 Слухи: переговоры Apple и Google предполагают модель с параметрами 1,2T; предположительно, Flash с ~1,2T и Pro с ~2T для более быстрой передачи речи/вживую. 👍 Итог: хорошо, но не лучше — пожалуйста, выпустите финальную модель вместо дополнительных контрольных точек.

Смотрите также