Рейтинги ИИ за июнь 2026: китайские модели «захватывают» OpenRouter — на кого ставить во второй половине года?
Если вы в Cursor, OpenClaw или своём Agent не можете выбрать модель и удивляетесь, почему китайские модели внезапно доминируют: эта статья опирается на реальный трафик OpenRouter за июнь 2026 — двойной рейтинг компаний и моделей, разворот доли США–Китай за год (70%→30%), слои качества и объёма, матрица восьми сценариев, прогнозы Q3 и пятишаговый Runbook для модельно-независимой архитектуры.
Содержание
- 1. Три боли при выборе
- 2. Полный разбор рейтинга OpenRouter за июнь
- 3. Разворот доли США–Китай за год
- 4. Первый по объёму ≠ первый по качеству
- 5. Матрица выбора по восьми сценариям
- 6. Прогнозы второй половины года и пять макротрендов
- 7. Пятишаговый Runbook модельно-независимой архитектуры
- 8. Цитируемые технические факты
- 9. Заключение
1. Три боли при выборе: рейтинги, счёт и архитектура расходятся
- Бенчмарки vs производственный трафик. MMLU и HumanEval не отражают, за что миллионы разработчиков на OpenRouter голосуют кошельком — в июне DeepSeek V4 Flash набирает 619B токенов/день, а часть чемпионов бенчмарков не попадает даже в топ-10.
- Путать «чемпиона по объёму» и «потолок качества». Claude Opus 4.8 с индексом 61.4 остаётся первым по качеству, но его трафик меньше трети DeepSeek V4 Flash; смешивание ведёт к переплате или провалу на самых сложных задачах.
- Хардкод одной модели — технический долг. Q3 2026 станет самым плотным кварталом релизов в истории ИИ (GPT-6, Opus 5, Gemini 4, DeepSeek V5 скопом) — привязка к одному провайдеру сегодня означает отставание через три месяца.
2. Рейтинг OpenRouter за июнь: уровень компаний и моделей
Источник: статистика трафика OpenRouter (на июнь 2026). OpenRouter агрегирует реальные вызовы миллионов разработчиков по всему миру — не маркетинг вендоров, а голосование кодом.
По компаниям (недельный объём токенов)
| Место | Компания | Происхождение | Токенов/неделя | Доля рынка |
|---|---|---|---|---|
| 1 | DeepSeek | 🇨🇳 Китай | 5.13T | 17.6% |
| 2 | Anthropic | 🇺🇸 США | 4.34T | 14.8% |
| 3 | 🇺🇸 США | 3.66T | 12.5% | |
| 4 | OpenAI | 🇺🇸 США | 2.46T | 8.4% |
| 5 | Xiaomi | 🇨🇳 Китай | 2.42T | 8.3% |
| 6 | MiniMax | 🇨🇳 Китай | 2.37T | 8.1% |
| 7 | Tencent | 🇨🇳 Китай | 2.36T | 8.1% |
| 8 | Alibaba Qwen | 🇨🇳 Китай | 1.26T | 4.3% |
Китайские модели в сумме: около 46% (китайские вендоры в топ-10); в общем трафике разработчиков китайские модели превысили 60%.
По моделям (топ-10 среднесуточных токенов)
| Место | Модель | Вендор | Токенов/день |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
Этот рейтинг показывает больше, чем «кто пользуется больше» — он отражает, какой модели глобальные разработчики реально доверяют в продакшене. В июне также произошло таинственное снятие Claude Fable 5 (экспортный контроль) и IPO-слухи у OpenAI и Anthropic.
3. Главная история: доля американских моделей с 70% до 30% за год
Данные OpenRouter и Exponential View, на которые ссылается Bloomberg, говорят ясно:
- Июнь 2025: американские модели (Google + OpenAI + Anthropic вместе) около 70% токенов OpenRouter
- Июнь 2026: этот показатель упал до 30%
Куда ушли 40 процентных пунктов? К китайским моделям. Это не эффект «китайские разработчики поддерживают своих» — пользователи OpenRouter глобальны, многие из США, Европы и Индии.
«С Claude кодить — около 10 долларов в час. С DeepSeek — меньше 50 центов.» — разработчик из Сан-Диего
Это не история о качестве, а об экономике. Разработчик из Далласа описал свой многоуровневый стек: «Сложные задачи $500/мес Claude + ChatGPT, повседневное кодирование и распознавание речи 90% $200 MiniMax + Kimi + MiMo.»
4. Слои: «первый по объёму» ≠ «первый по качеству»
Потолок качества: Claude Opus 4.8 остаётся первым в совокупности
По Artificial Analysis Intelligence Index (конец мая 2026) и SWE-bench Pro:
| Модель | Индекс качества | SWE-bench Pro | Примечание |
|---|---|---|---|
| Claude Opus 4.8 | 61.4 (#1) | 69.2% | Длинный контекст и Agent доминируют |
| GPT-5.5 | 59–60 | 63.1% | Сильнейшая экосистема, быстрые tool calls |
| Gemini 3.1 Pro | 57 | — | Силён на сложном рассуждении |
| Qwen 3.7 Max | 57 | — | Китайский закрытый флагман |
| Claude Sonnet 4.6 | — | 80.8% (Verified) | Лучшее письмо и следование инструкциям |
Инженер после 20 задач: Opus 4.8 выиграл 16, GPT-5.5 — пять, Gemini 3.1 Pro — четыре. На длинном контексте Opus почти полностью доминирует.
Отдельно Claude Fable 5: полная оценка качества (100/100), SWE-bench Verified около 95%, но в середине июня 2026 снят глобально из-за экспортного контроля — статус неясен. Показывает: американские топ-модели по чистой способности всё ещё впереди.
Чемпион по объёму: китайские модели ценой и скоростью в повседневных задачах
- Цена: API MiniMax M3 всего $0.60/M входных токенов — примерно 1/8 Claude Opus 4.8 ($5.00/M)
- Достаточно: повседневная помощь в коде, автодополнение, перевод, резюме — китайские модели дают 80–90% качества топовых
- Открытые веса: DeepSeek V4, MiniMax M3 и др. — self-host, снимает опасения по приватности данных
Разумная стратегия: закрытый frontier на самые сложные 5%, китайские открытые веса на оставшиеся 95% повседневного объёма.
5. Матрица выбора по сценариям (июнь 2026)
| Сценарий | Рекомендуемая модель | Причина |
|---|---|---|
| Сложный код / Agent | Claude Opus 4.8 | Качество #1, длинный контекст непобедим |
| Повседневная помощь в коде | DeepSeek V4 Flash / MiMo-V2.5 | Экстремальное соотношение цена/качество, быстро |
| API с лучшим ROI | MiniMax M3 | $0.60/M, открытые веса, можно self-host |
| Длинный контекст | Kimi K2.6 (1M контекст) | Очень длинное окно, разумная цена |
| Интеграция с Google | Gemini 3.5 Flash | Нативная поддержка Google Workspace |
| Поиск в Web в реальном времени | Grok 4.3 | Живой контент X/Twitter |
| Локальный self-host | GLM 5.2 / Kimi K2.6 | Топ открытых весов |
| Генерация изображений | ChatGPT Images 2.0 | Лучший рендер текста |
| Лучший повседневный диалог | GPT-5.5 | На 52.5% меньше галлюцинаций vs GPT-5.3, сильная экосистема |
6. Прогнозы второй половины года: Q3 «сезон взрыва моделей» и пять макротрендов
Подтверждено или высоковероятно (Q3 2026)
| Модель | Вендор | Ожидаемое время | Ключевой момент |
|---|---|---|---|
| GPT-6 | OpenAI | авг–сен 2026 | Длиннее контекст (слух 1.5M токенов), сильнее Agent |
| Claude Opus 5 | Anthropic | около сен 2026 | Преемник Opus 4.8, апгрейд долгосрочного Agent |
| Gemini 4 | Q3 2026 | Мультимодальный апгрейд, видео и аудиовход | |
| DeepSeek V5 | DeepSeek | Q3 2026 | Открытые веса, >1T параметров, уровень frontier |
| GLM 5.2 | Z.ai | уже выпущен | Топ открытых весов, силён в программировании |
| Grok 4.3+ | xAI | Q3 2026 | 1M контекст, усиленный live Web |
GPT-6, Opus 5 и Gemini 4, вероятно, приземлятся в шестинедельном окне с середины августа до конца сентября — смена трона бенчмарков быстрее любого медиацикла.
Пять макротрендов
- Ось конкуренции от «кто сильнее» к «кто подходит сценарию» — пять лабораторий за 90 дней, больше нет единой «сильнейшей модели».
- Доля Китая растёт, но enterprise-compliance станет потолком — у индивидуальных разработчиков возможно 70%+ трафика OpenRouter; Fortune 500 ограничены безопасностью данных и Конгрессом США.
- Agent — настоящее поле боя — 2026 год «Agent от эксперимента к продакшену»; отчёт Anthropic об Agent 2026: около 44% вызовов Claude API — математика и информатика.
- Эффект двойного IPO OpenAI и Anthropic — слухи июня 2026; биржевое давление делает цены прозрачнее, может ускорить ценовую войну с Китаем.
- Локальный запуск на consumer-железе пробьёт 80% SWE-bench — к 2027 локальные модели на GPU 32 ГБ выше порога 80% в кодинге; фундаментальный удар по рынку коммерческих API.
7. Пятишаговый Runbook: модельно-независимая архитектура
Шаг 1 — Разделить основную модель и откат по сложности
Сложный Agent / длинный контекст → Claude Opus 4.8; повседневное кодирование → DeepSeek V4 Flash или MiMo-V2.5; ультра-дёшевый batch → MiniMax M3.
Шаг 2 — Единый Route на OpenRouter
Шаг 3 — Месячный счёт и восьмикратная разница в цене
MiniMax M3 $0.60/M vs Opus 4.8 $5.00/M: при 10M входных токенов/день около $180/мес vs $1,500/мес.
Шаг 4 — Перенести Gateway на Mac cloud 7×24
launchd для OpenClaw, API-ключи через переменные окружения — без сна ноутбука. См. узел автоматизации Agent Mac cloud.
Шаг 5 — Квартальный обзор рейтинга OpenRouter и доли «потерянных» Agent
После релизов Q3 подстроить маршруты под новый рейтинг, мониторить сбои суб-агентов и алерты 429.
8. Цитируемые технические факты
- DeepSeek недельные токены 5.13T, доля 17.6%; V4 Flash 619B токенов/день — 1-е место среди моделей.
- Big Three США (Google + OpenAI + Anthropic) доля OpenRouter за год 70% → 30%; Китай забрал 40 п.п.
- Claude Opus 4.8 Artificial Analysis 61.4 (#1); MiniMax M3 $0.60/M, примерно 1/8 Opus 4.8.
- Отчёт Anthropic об Agent 2026: 44% вызовов Claude API — математика и информатика.
9. Заключение: маржа сжимается, архитектура — ров
Суть: маржа слоя AI-моделей быстро сжимается. DeepSeek в начале 2025 показал: frontier не требует frontier-вычислений. Xiaomi, Tencent, MiniMax, Moonshot скопировали и уронили базовые цены до пола. Американские вендоры делятся: OpenAI на экосистему, Anthropic на качество, Google на скорость и мультимодальность. Середина «неплохо, но дорого» исчезает.
Для разработчика ценнее не «выбрать сильнейшую модель», а построить архитектуру со сменой моделей — сегодняшний №1 через три месяца может им не быть.
Мульти-модельный Gateway на ноутбуке или чистом Linux VPS имеет слабые места: крышка закрыта, нет нативной Apple toolchain, сложный дебаг. Для OpenClaw / Cursor Agent 7×24 с маршрутизацией DeepSeek, Opus и MiniMax: аренда узла Mac cloud M4 VPSMAC — модель меняете по рейтингу, среда выполнения остаётся.