OpenRouter 周榜和 MMLU 榜單有何本質區別？

周榜統計 7 天滾動真實 API Token 吞吐量，反映開發者付費與生產流量；學術 Benchmark 多為廠商自報單次評測，與 Agent 流水線日常成本無直接對應。

為什麼 Anthropic Token 份額下滑但收入份額仍高？

Claude Opus 等旗艦定價遠高於 DeepSeek Flash 檔；企業為複雜推理付溢價，但批量 Agent 任務已轉向極低價模型，形成 Token 量與美元收入的剪刀差。

應該按週還是按月追蹤 OpenRouter 榜？

路由策略建議按週復盤以捕捉爆款模型（如 Hy3、Owl Alpha）；季度級才做架構級換棧，避免為單週波動頻繁遷移 Gateway。

OpenRouter 最新模型周調用量排行：帳單數據不會說謊，誰才是真正的王者？

若選型只看 MMLU 榜、從不核對 OpenRouter 周帳單，容易為「評測第一」付溢價、為 Agent 批處理選錯模型。本文以 OpenRouter 按週（7 天滾動）公開 Token 數據為錨——統計截至 2026 年 5 月 24 日——解讀 28.9 兆周調用格局、DeepSeek 矩陣稱霸、Anthropic「溢價悖論」，並給出 Token vs 美元收入決策矩陣、五步 API 路由 Runbook 與 Mac 雲 7×24 Agent 落地 FAQ。

1. 三個選型痛點：Benchmark 救不了帳單

榜單與生產脫節。 MMLU 等多為單次評測，無法反映 Tool Calling、長上下文重讀的真實 Token 與帳單。
按月復盤太慢。 周調用量可在 7 天內暴漲 66%（如 V4-Flash），按月看榜會錯過路由窗口。
宿主決定 7×24。 筆電合蓋、Linux VPS 缺 Apple 工具鏈，Gateway 層仍可能斷鏈。

與 6 月六大趨勢解讀互補：本篇聚焦按週口徑與帳單市場份額。

2. 數據來源與按週統計方法

OpenRouter 接入 300+ 模型、月處理約 100 兆 Token（openrouter.ai/rankings）。按週 7 天滾動統計，本文節點 2026/5/18–5/24，含 Token 總量、模型排行與美元收入 vs Token 份額剪刀差。

3. 28.9 兆周總量：連續五週上漲，中國模型連續四週超美

指標	數據（5/18–5/24 週）	環比變化
全球周調用量	28.9 兆 Token	+7.4%（連續五週上漲）
中國模型周調用量	9.223 兆 Token	+19.89%
美國模型周調用量	4.93 兆 Token	+16.27%
地緣格局	中國模型連續四週超越美國	穩居全球首位

一年前周處理約 2.4 兆，現 28.9 兆（約 12 倍）；中國模型占比由 2025 年初 2% 升至 2026/5 的 45%+。

4. 最新一週 Top 10 模型調用量排行榜

排名	模型	廠商	周 Token 量	環比	特點
1	DeepSeek-V4-Flash	DeepSeek	3.43T	+66%	Agent 首選
2	Hy3 Preview	Tencent	3.07T	+16%	限免後仍高增
3	Claude Sonnet 4.6	Anthropic	1.35T	—	企業編程
4	DeepSeek-V3.2	DeepSeek	1.31T	—	低價長尾
5	Owl Alpha	OpenRouter	1.15T	+29%	免費 Agent
6	Gemini 3 Flash	Google	1.06T	—	多模態
7	DeepSeek-V4-Pro	DeepSeek	1.00T	—	矩陣旗艦
8	MiniMax M2.7	MiniMax	806B	—	長上下文
9	Grok 4.1 Fast	xAI	721B	—	2M 法律
10	Step 3.5 Flash	StepFun	673B	—	批處理

中國模型 6 席、美國 3 席、免費檔 1 席——市場為極低價 + Agent 買單。

5. DeepSeek 多模型矩陣稱霸廠商榜

三款模型進前九，系列合計 5.74 兆、環比 +25.9%，連續兩週超 Anthropic/Google，廠商第一。Flash 扛吞吐、Pro 扛推理、V3.2 接長尾，同廠商內切換降低路由複雜度。

6. Token 量 vs 美元收入：Anthropic 的「溢價悖論」

廠商層級	代表模型	Token 份額（約）	美元收入份額（約）	定位
高價值·低流量	Claude Opus 4.6	個位數 %	月收入 $2500 萬級	企業推理
性價比·中流量	Gemini 3 Flash	中等	中等	多模態
極低價·高流量	DeepSeek 等	主導周榜	低於 Token 占比	Agent 批處理

Anthropic Token 份額約 12%（一年前 25%），美元收入仍約 46%——須同時看調用量榜與帳單榜。

7. 反直覺發現：基準測試分數與市場調用量近乎反比

a16z《2025 AI 使用報告》指出 Benchmark 分數與市場份額近乎反比：開發者重成本與 API 穩定性；編程任務占比由 11% 升至 50%+，Flash 檔碾壓旗艦。帳單數字比評測榜誠實。

8. 場景選型決策矩陣（按周榜數據）

場景	推薦模型（周榜依據）	周 Token 量級	選型邏輯
Agent / 批量	DeepSeek-V4-Flash	3.43T	極低價 +66% 環比
企業推理	Claude Opus/Sonnet	1.35T	高溢價、迷路率低
多模態	Gemini 3 Flash	1.06T	學術/醫療
零成本原型	Owl Alpha	1.15T	免費實驗，注意隱私
長上下文法律	Grok 4.1 Fast	721B	2M 法律文檔

9. 五步路由 Runbook：從周榜到 Mac 雲 7×24 Gateway

步驟 1 — 每週一訂閱周榜建基線

記錄主模型 Token 份額與環比，關注新進前十（Hy3、Owl Alpha）。

步驟 2 — 按任務分層配置 Route

Agent 走 Flash 檔，複雜推理保留 Sonnet/Opus，多模態走 Gemini Flash。

步驟 3 — 核算 Token 與美元雙指標

Flash 約 $150/月 vs Opus 約 $750/月（同量級假設下 10× 價差），Agent 主路徑優先 Flash。

步驟 4 — OpenClaw 主模型 + 降級鏈

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "openrouter/deepseek/deepseek-v4-flash",
        "fallbacks": [
          "openrouter/anthropic/claude-sonnet-4.6",
          "openrouter/google/gemini-3-flash-preview"
        ]
      }
    }
  }
}

步驟 5 — Gateway 遷到 Mac 雲 7×24

launchd 驗收、Key 走環境變量；見 Mac 雲 Agent 節點與升級 Runbook。

10. 可引用技術要點

全球周調用 28.9T（5/18–5/24），同比 2.4T 增約 12 倍。
DeepSeek 系列 5.74T，V4-Flash 3.43T、環比 +66%，廠商與模型雙第一。
Anthropic Token 12% vs 收入 46%；編程占流量超 50%（a16z 2025）。

11. FAQ

周榜多久更新？ 7 天滾動，建議週一復盤。與 6 月榜為何不同？ 統計窗口不同（本篇 5/18–5/24）。Owl Alpha 能生產嗎？ 僅原型；生產用付費 API。

12. 結論：帳單數據揭示的 AI 行業真相

市場用錢投票：中國開源以極低成本重塑調用格局——誰最被調用，誰推動落地。筆電合蓋或 Linux VPS 手動切 Route 難 7×24：缺 launchd 與 Apple 工具鏈，排障成本吞噬省錢收益。需按週追榜又讓 Gateway 長期在線時，租賃 VPSMAC M4 Mac 雲是更優解——榜變只改 Route，launchd 守護、密鑰隔離、SSH 交付，帳單選型與 7×24 運行在同一套 macOS 環境驗收。

OpenRouter 最新模型周調用量排行：帳單數據不會說謊，誰才是真正的王者？（2026）

目錄