Рейтинги ИИ за июнь 2026: китайские модели «захватывают» OpenRouter — на кого ставить во второй половине года?

Если вы в Cursor, OpenClaw или своём Agent не можете выбрать модель и удивляетесь, почему китайские модели внезапно доминируют: эта статья опирается на реальный трафик OpenRouter за июнь 2026 — двойной рейтинг компаний и моделей, разворот доли США–Китай за год (70%→30%), слои качества и объёма, матрица восьми сценариев, прогнозы Q3 и пятишаговый Runbook для модельно-независимой архитектуры.

Абстрактная визуализация нейросетей и потоков данных — статистика вызовов моделей OpenRouter у разработчиков по всему миру

Содержание

1. Три боли при выборе: рейтинги, счёт и архитектура расходятся

  1. Бенчмарки vs производственный трафик. MMLU и HumanEval не отражают, за что миллионы разработчиков на OpenRouter голосуют кошельком — в июне DeepSeek V4 Flash набирает 619B токенов/день, а часть чемпионов бенчмарков не попадает даже в топ-10.
  2. Путать «чемпиона по объёму» и «потолок качества». Claude Opus 4.8 с индексом 61.4 остаётся первым по качеству, но его трафик меньше трети DeepSeek V4 Flash; смешивание ведёт к переплате или провалу на самых сложных задачах.
  3. Хардкод одной модели — технический долг. Q3 2026 станет самым плотным кварталом релизов в истории ИИ (GPT-6, Opus 5, Gemini 4, DeepSeek V5 скопом) — привязка к одному провайдеру сегодня означает отставание через три месяца.

2. Рейтинг OpenRouter за июнь: уровень компаний и моделей

Источник: статистика трафика OpenRouter (на июнь 2026). OpenRouter агрегирует реальные вызовы миллионов разработчиков по всему миру — не маркетинг вендоров, а голосование кодом.

По компаниям (недельный объём токенов)

МестоКомпанияПроисхождениеТокенов/неделяДоля рынка
1DeepSeek🇨🇳 Китай5.13T17.6%
2Anthropic🇺🇸 США4.34T14.8%
3Google🇺🇸 США3.66T12.5%
4OpenAI🇺🇸 США2.46T8.4%
5Xiaomi🇨🇳 Китай2.42T8.3%
6MiniMax🇨🇳 Китай2.37T8.1%
7Tencent🇨🇳 Китай2.36T8.1%
8Alibaba Qwen🇨🇳 Китай1.26T4.3%

Китайские модели в сумме: около 46% (китайские вендоры в топ-10); в общем трафике разработчиков китайские модели превысили 60%.

По моделям (топ-10 среднесуточных токенов)

МестоМодельВендорТокенов/день
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

Этот рейтинг показывает больше, чем «кто пользуется больше» — он отражает, какой модели глобальные разработчики реально доверяют в продакшене. В июне также произошло таинственное снятие Claude Fable 5 (экспортный контроль) и IPO-слухи у OpenAI и Anthropic.

3. Главная история: доля американских моделей с 70% до 30% за год

Данные OpenRouter и Exponential View, на которые ссылается Bloomberg, говорят ясно:

Куда ушли 40 процентных пунктов? К китайским моделям. Это не эффект «китайские разработчики поддерживают своих» — пользователи OpenRouter глобальны, многие из США, Европы и Индии.

«С Claude кодить — около 10 долларов в час. С DeepSeek — меньше 50 центов.» — разработчик из Сан-Диего

Это не история о качестве, а об экономике. Разработчик из Далласа описал свой многоуровневый стек: «Сложные задачи $500/мес Claude + ChatGPT, повседневное кодирование и распознавание речи 90% $200 MiniMax + Kimi + MiMo.»

4. Слои: «первый по объёму» ≠ «первый по качеству»

Потолок качества: Claude Opus 4.8 остаётся первым в совокупности

По Artificial Analysis Intelligence Index (конец мая 2026) и SWE-bench Pro:

МодельИндекс качестваSWE-bench ProПримечание
Claude Opus 4.861.4 (#1)69.2%Длинный контекст и Agent доминируют
GPT-5.559–6063.1%Сильнейшая экосистема, быстрые tool calls
Gemini 3.1 Pro57Силён на сложном рассуждении
Qwen 3.7 Max57Китайский закрытый флагман
Claude Sonnet 4.680.8% (Verified)Лучшее письмо и следование инструкциям

Инженер после 20 задач: Opus 4.8 выиграл 16, GPT-5.5 — пять, Gemini 3.1 Pro — четыре. На длинном контексте Opus почти полностью доминирует.

Отдельно Claude Fable 5: полная оценка качества (100/100), SWE-bench Verified около 95%, но в середине июня 2026 снят глобально из-за экспортного контроля — статус неясен. Показывает: американские топ-модели по чистой способности всё ещё впереди.

Чемпион по объёму: китайские модели ценой и скоростью в повседневных задачах

  1. Цена: API MiniMax M3 всего $0.60/M входных токенов — примерно 1/8 Claude Opus 4.8 ($5.00/M)
  2. Достаточно: повседневная помощь в коде, автодополнение, перевод, резюме — китайские модели дают 80–90% качества топовых
  3. Открытые веса: DeepSeek V4, MiniMax M3 и др. — self-host, снимает опасения по приватности данных

Разумная стратегия: закрытый frontier на самые сложные 5%, китайские открытые веса на оставшиеся 95% повседневного объёма.

5. Матрица выбора по сценариям (июнь 2026)

СценарийРекомендуемая модельПричина
Сложный код / AgentClaude Opus 4.8Качество #1, длинный контекст непобедим
Повседневная помощь в кодеDeepSeek V4 Flash / MiMo-V2.5Экстремальное соотношение цена/качество, быстро
API с лучшим ROIMiniMax M3$0.60/M, открытые веса, можно self-host
Длинный контекстKimi K2.6 (1M контекст)Очень длинное окно, разумная цена
Интеграция с GoogleGemini 3.5 FlashНативная поддержка Google Workspace
Поиск в Web в реальном времениGrok 4.3Живой контент X/Twitter
Локальный self-hostGLM 5.2 / Kimi K2.6Топ открытых весов
Генерация изображенийChatGPT Images 2.0Лучший рендер текста
Лучший повседневный диалогGPT-5.5На 52.5% меньше галлюцинаций vs GPT-5.3, сильная экосистема

6. Прогнозы второй половины года: Q3 «сезон взрыва моделей» и пять макротрендов

Подтверждено или высоковероятно (Q3 2026)

МодельВендорОжидаемое времяКлючевой момент
GPT-6OpenAIавг–сен 2026Длиннее контекст (слух 1.5M токенов), сильнее Agent
Claude Opus 5Anthropicоколо сен 2026Преемник Opus 4.8, апгрейд долгосрочного Agent
Gemini 4GoogleQ3 2026Мультимодальный апгрейд, видео и аудиовход
DeepSeek V5DeepSeekQ3 2026Открытые веса, >1T параметров, уровень frontier
GLM 5.2Z.aiуже выпущенТоп открытых весов, силён в программировании
Grok 4.3+xAIQ3 20261M контекст, усиленный live Web

GPT-6, Opus 5 и Gemini 4, вероятно, приземлятся в шестинедельном окне с середины августа до конца сентября — смена трона бенчмарков быстрее любого медиацикла.

Пять макротрендов

  1. Ось конкуренции от «кто сильнее» к «кто подходит сценарию» — пять лабораторий за 90 дней, больше нет единой «сильнейшей модели».
  2. Доля Китая растёт, но enterprise-compliance станет потолком — у индивидуальных разработчиков возможно 70%+ трафика OpenRouter; Fortune 500 ограничены безопасностью данных и Конгрессом США.
  3. Agent — настоящее поле боя — 2026 год «Agent от эксперимента к продакшену»; отчёт Anthropic об Agent 2026: около 44% вызовов Claude API — математика и информатика.
  4. Эффект двойного IPO OpenAI и Anthropic — слухи июня 2026; биржевое давление делает цены прозрачнее, может ускорить ценовую войну с Китаем.
  5. Локальный запуск на consumer-железе пробьёт 80% SWE-bench — к 2027 локальные модели на GPU 32 ГБ выше порога 80% в кодинге; фундаментальный удар по рынку коммерческих API.

7. Пятишаговый Runbook: модельно-независимая архитектура

Шаг 1 — Разделить основную модель и откат по сложности

Сложный Agent / длинный контекст → Claude Opus 4.8; повседневное кодирование → DeepSeek V4 Flash или MiMo-V2.5; ультра-дёшевый batch → MiniMax M3.

Шаг 2 — Единый Route на OpenRouter

# openclaw.json мульти-модельная маршрутизация { "agents": { "defaults": { "model": { "primary": "openrouter/deepseek/deepseek-v4-flash", "fallbacks": [ "openrouter/anthropic/claude-opus-4.8", "openrouter/minimax/minimax-m3" ] } } } }

Шаг 3 — Месячный счёт и восьмикратная разница в цене

MiniMax M3 $0.60/M vs Opus 4.8 $5.00/M: при 10M входных токенов/день около $180/мес vs $1,500/мес.

Шаг 4 — Перенести Gateway на Mac cloud 7×24

launchd для OpenClaw, API-ключи через переменные окружения — без сна ноутбука. См. узел автоматизации Agent Mac cloud.

Шаг 5 — Квартальный обзор рейтинга OpenRouter и доли «потерянных» Agent

openclaw doctor && openclaw channels status --probe openclaw status logs --tail 200

После релизов Q3 подстроить маршруты под новый рейтинг, мониторить сбои суб-агентов и алерты 429.

8. Цитируемые технические факты

9. Заключение: маржа сжимается, архитектура — ров

Суть: маржа слоя AI-моделей быстро сжимается. DeepSeek в начале 2025 показал: frontier не требует frontier-вычислений. Xiaomi, Tencent, MiniMax, Moonshot скопировали и уронили базовые цены до пола. Американские вендоры делятся: OpenAI на экосистему, Anthropic на качество, Google на скорость и мультимодальность. Середина «неплохо, но дорого» исчезает.

Для разработчика ценнее не «выбрать сильнейшую модель», а построить архитектуру со сменой моделей — сегодняшний №1 через три месяца может им не быть.

Мульти-модельный Gateway на ноутбуке или чистом Linux VPS имеет слабые места: крышка закрыта, нет нативной Apple toolchain, сложный дебаг. Для OpenClaw / Cursor Agent 7×24 с маршрутизацией DeepSeek, Opus и MiniMax: аренда узла Mac cloud M4 VPSMAC — модель меняете по рейтингу, среда выполнения остаётся.