Какая модель самая популярная на OpenRouter в июне?

По среднесуточным токенам: DeepSeek V4 Flash около 619B на первом месте, далее Tencent Hy3 Preview (451B) и MiniMax M3 (447B).

DeepSeek лучше Claude?

Объём и качество — разные оси: DeepSeek лидирует в трафике OpenRouter, но Claude Opus 4.8 остаётся первым по индексу Artificial Analysis 61.4; для повседневных задач DeepSeek, для самых сложных 5% — маршрут на Opus.

Какие frontier-модели выйдут в Q3 2026?

Высокая вероятность: GPT-6 (авг–сен), Claude Opus 5 (около сентября), Gemini 4, DeepSeek V5 и уже выпущенный GLM 5.2.

Рейтинги ИИ за июнь 2026: китайские модели захватывают OpenRouter

Если вы в Cursor, OpenClaw или своём Agent не можете выбрать модель и удивляетесь, почему китайские модели внезапно доминируют: эта статья опирается на реальный трафик OpenRouter за июнь 2026 — двойной рейтинг компаний и моделей, разворот доли США–Китай за год (70%→30%), слои качества и объёма, матрица восьми сценариев, прогнозы Q3 и пятишаговый Runbook для модельно-независимой архитектуры.

1. Три боли при выборе: рейтинги, счёт и архитектура расходятся

Бенчмарки vs производственный трафик. MMLU и HumanEval не отражают, за что миллионы разработчиков на OpenRouter голосуют кошельком — в июне DeepSeek V4 Flash набирает 619B токенов/день, а часть чемпионов бенчмарков не попадает даже в топ-10.
Путать «чемпиона по объёму» и «потолок качества». Claude Opus 4.8 с индексом 61.4 остаётся первым по качеству, но его трафик меньше трети DeepSeek V4 Flash; смешивание ведёт к переплате или провалу на самых сложных задачах.
Хардкод одной модели — технический долг. Q3 2026 станет самым плотным кварталом релизов в истории ИИ (GPT-6, Opus 5, Gemini 4, DeepSeek V5 скопом) — привязка к одному провайдеру сегодня означает отставание через три месяца.

2. Рейтинг OpenRouter за июнь: уровень компаний и моделей

Источник: статистика трафика OpenRouter (на июнь 2026). OpenRouter агрегирует реальные вызовы миллионов разработчиков по всему миру — не маркетинг вендоров, а голосование кодом.

По компаниям (недельный объём токенов)

Место	Компания	Происхождение	Токенов/неделя	Доля рынка
1	DeepSeek	🇨🇳 Китай	5.13T	17.6%
2	Anthropic	🇺🇸 США	4.34T	14.8%
3	Google	🇺🇸 США	3.66T	12.5%
4	OpenAI	🇺🇸 США	2.46T	8.4%
5	Xiaomi	🇨🇳 Китай	2.42T	8.3%
6	MiniMax	🇨🇳 Китай	2.37T	8.1%
7	Tencent	🇨🇳 Китай	2.36T	8.1%
8	Alibaba Qwen	🇨🇳 Китай	1.26T	4.3%

Китайские модели в сумме: около 46% (китайские вендоры в топ-10); в общем трафике разработчиков китайские модели превысили 60%.

По моделям (топ-10 среднесуточных токенов)

Место	Модель	Вендор	Токенов/день
1	DeepSeek V4 Flash	DeepSeek	619B
2	Hy3 Preview	Tencent	451B
3	MiniMax M3	MiniMax	447B
4	MiMo-V2.5	Xiaomi	327B
5	DeepSeek V4 Pro	DeepSeek	300B
6	Claude Opus 4.7	Anthropic	263B
7	Claude Opus 4.8	Anthropic	~200B
8	Claude Sonnet 4.6	Anthropic	178B
9	Gemini 3 Flash Preview	Google	156B
10	Kimi K2.6	Moonshot AI	~150B

Этот рейтинг показывает больше, чем «кто пользуется больше» — он отражает, какой модели глобальные разработчики реально доверяют в продакшене. В июне также произошло таинственное снятие Claude Fable 5 (экспортный контроль) и IPO-слухи у OpenAI и Anthropic.

3. Главная история: доля американских моделей с 70% до 30% за год

Данные OpenRouter и Exponential View, на которые ссылается Bloomberg, говорят ясно:

Июнь 2025: американские модели (Google + OpenAI + Anthropic вместе) около 70% токенов OpenRouter
Июнь 2026: этот показатель упал до 30%

Куда ушли 40 процентных пунктов? К китайским моделям. Это не эффект «китайские разработчики поддерживают своих» — пользователи OpenRouter глобальны, многие из США, Европы и Индии.

«С Claude кодить — около 10 долларов в час. С DeepSeek — меньше 50 центов.» — разработчик из Сан-Диего

Это не история о качестве, а об экономике. Разработчик из Далласа описал свой многоуровневый стек: «Сложные задачи $500/мес Claude + ChatGPT, повседневное кодирование и распознавание речи 90% $200 MiniMax + Kimi + MiMo.»

4. Слои: «первый по объёму» ≠ «первый по качеству»

Потолок качества: Claude Opus 4.8 остаётся первым в совокупности

По Artificial Analysis Intelligence Index (конец мая 2026) и SWE-bench Pro:

Модель	Индекс качества	SWE-bench Pro	Примечание
Claude Opus 4.8	61.4 (#1)	69.2%	Длинный контекст и Agent доминируют
GPT-5.5	59–60	63.1%	Сильнейшая экосистема, быстрые tool calls
Gemini 3.1 Pro	57	—	Силён на сложном рассуждении
Qwen 3.7 Max	57	—	Китайский закрытый флагман
Claude Sonnet 4.6	—	80.8% (Verified)	Лучшее письмо и следование инструкциям

Инженер после 20 задач: Opus 4.8 выиграл 16, GPT-5.5 — пять, Gemini 3.1 Pro — четыре. На длинном контексте Opus почти полностью доминирует.

Отдельно Claude Fable 5: полная оценка качества (100/100), SWE-bench Verified около 95%, но в середине июня 2026 снят глобально из-за экспортного контроля — статус неясен. Показывает: американские топ-модели по чистой способности всё ещё впереди.

Чемпион по объёму: китайские модели ценой и скоростью в повседневных задачах

Цена: API MiniMax M3 всего $0.60/M входных токенов — примерно 1/8 Claude Opus 4.8 ($5.00/M)
Достаточно: повседневная помощь в коде, автодополнение, перевод, резюме — китайские модели дают 80–90% качества топовых
Открытые веса: DeepSeek V4, MiniMax M3 и др. — self-host, снимает опасения по приватности данных

Разумная стратегия: закрытый frontier на самые сложные 5%, китайские открытые веса на оставшиеся 95% повседневного объёма.

5. Матрица выбора по сценариям (июнь 2026)

Сценарий	Рекомендуемая модель	Причина
Сложный код / Agent	Claude Opus 4.8	Качество #1, длинный контекст непобедим
Повседневная помощь в коде	DeepSeek V4 Flash / MiMo-V2.5	Экстремальное соотношение цена/качество, быстро
API с лучшим ROI	MiniMax M3	$0.60/M, открытые веса, можно self-host
Длинный контекст	Kimi K2.6 (1M контекст)	Очень длинное окно, разумная цена
Интеграция с Google	Gemini 3.5 Flash	Нативная поддержка Google Workspace
Поиск в Web в реальном времени	Grok 4.3	Живой контент X/Twitter
Локальный self-host	GLM 5.2 / Kimi K2.6	Топ открытых весов
Генерация изображений	ChatGPT Images 2.0	Лучший рендер текста
Лучший повседневный диалог	GPT-5.5	На 52.5% меньше галлюцинаций vs GPT-5.3, сильная экосистема

6. Прогнозы второй половины года: Q3 «сезон взрыва моделей» и пять макротрендов

Подтверждено или высоковероятно (Q3 2026)

Модель	Вендор	Ожидаемое время	Ключевой момент
GPT-6	OpenAI	авг–сен 2026	Длиннее контекст (слух 1.5M токенов), сильнее Agent
Claude Opus 5	Anthropic	около сен 2026	Преемник Opus 4.8, апгрейд долгосрочного Agent
Gemini 4	Google	Q3 2026	Мультимодальный апгрейд, видео и аудиовход
DeepSeek V5	DeepSeek	Q3 2026	Открытые веса, >1T параметров, уровень frontier
GLM 5.2	Z.ai	уже выпущен	Топ открытых весов, силён в программировании
Grok 4.3+	xAI	Q3 2026	1M контекст, усиленный live Web

GPT-6, Opus 5 и Gemini 4, вероятно, приземлятся в шестинедельном окне с середины августа до конца сентября — смена трона бенчмарков быстрее любого медиацикла.

Пять макротрендов

Ось конкуренции от «кто сильнее» к «кто подходит сценарию» — пять лабораторий за 90 дней, больше нет единой «сильнейшей модели».
Доля Китая растёт, но enterprise-compliance станет потолком — у индивидуальных разработчиков возможно 70%+ трафика OpenRouter; Fortune 500 ограничены безопасностью данных и Конгрессом США.
Agent — настоящее поле боя — 2026 год «Agent от эксперимента к продакшену»; отчёт Anthropic об Agent 2026: около 44% вызовов Claude API — математика и информатика.
Эффект двойного IPO OpenAI и Anthropic — слухи июня 2026; биржевое давление делает цены прозрачнее, может ускорить ценовую войну с Китаем.
Локальный запуск на consumer-железе пробьёт 80% SWE-bench — к 2027 локальные модели на GPU 32 ГБ выше порога 80% в кодинге; фундаментальный удар по рынку коммерческих API.

7. Пятишаговый Runbook: модельно-независимая архитектура

Шаг 1 — Разделить основную модель и откат по сложности

Сложный Agent / длинный контекст → Claude Opus 4.8; повседневное кодирование → DeepSeek V4 Flash или MiMo-V2.5; ультра-дёшевый batch → MiniMax M3.

Шаг 2 — Единый Route на OpenRouter

# openclaw.json мульти-модельная маршрутизация
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "openrouter/deepseek/deepseek-v4-flash",
        "fallbacks": [
          "openrouter/anthropic/claude-opus-4.8",
          "openrouter/minimax/minimax-m3"
        ]
      }
    }
  }
}

Шаг 3 — Месячный счёт и восьмикратная разница в цене

MiniMax M3 $0.60/M vs Opus 4.8 $5.00/M: при 10M входных токенов/день около $180/мес vs $1,500/мес.

Шаг 4 — Перенести Gateway на Mac cloud 7×24

launchd для OpenClaw, API-ключи через переменные окружения — без сна ноутбука. См. узел автоматизации Agent Mac cloud.

Шаг 5 — Квартальный обзор рейтинга OpenRouter и доли «потерянных» Agent

openclaw doctor && openclaw channels status --probe
openclaw status logs --tail 200

После релизов Q3 подстроить маршруты под новый рейтинг, мониторить сбои суб-агентов и алерты 429.

8. Цитируемые технические факты

DeepSeek недельные токены 5.13T, доля 17.6%; V4 Flash 619B токенов/день — 1-е место среди моделей.
Big Three США (Google + OpenAI + Anthropic) доля OpenRouter за год 70% → 30%; Китай забрал 40 п.п.
Claude Opus 4.8 Artificial Analysis 61.4 (#1); MiniMax M3 $0.60/M, примерно 1/8 Opus 4.8.
Отчёт Anthropic об Agent 2026: 44% вызовов Claude API — математика и информатика.

9. Заключение: маржа сжимается, архитектура — ров

Суть: маржа слоя AI-моделей быстро сжимается. DeepSeek в начале 2025 показал: frontier не требует frontier-вычислений. Xiaomi, Tencent, MiniMax, Moonshot скопировали и уронили базовые цены до пола. Американские вендоры делятся: OpenAI на экосистему, Anthropic на качество, Google на скорость и мультимодальность. Середина «неплохо, но дорого» исчезает.

Для разработчика ценнее не «выбрать сильнейшую модель», а построить архитектуру со сменой моделей — сегодняшний №1 через три месяца может им не быть.

Мульти-модельный Gateway на ноутбуке или чистом Linux VPS имеет слабые места: крышка закрыта, нет нативной Apple toolchain, сложный дебаг. Для OpenClaw / Cursor Agent 7×24 с маршрутизацией DeepSeek, Opus и MiniMax: аренда узла Mac cloud M4 VPSMAC — модель меняете по рейтингу, среда выполнения остаётся.

Рейтинги ИИ за июнь 2026: китайские модели «захватывают» OpenRouter — на кого ставить во второй половине года?

Содержание