コンテナ内のゲートウェイがホストの Ollama に届かないのはなぜ？

コンテナ内の localhost はホストではありません。ホストのゲートウェイ IP、ホストネットワーク、またはブリッジの明示 DNS 名を使い、Ollama のバインドアドレスを確認してください。

返答なしの Thinking が続くとき、最初に何を見る？

Ollama への HTTP が完了したか、タイムアウトしたか、エラーになったかをチャットアプリより先に確認してください。

フォールバックでクラウドコストが爆発するのを止めるには？

フォールバック窓のトークンを上限し、フォールバック件数でアラートし、健全化したら自動でローカルへ戻してください。

2026 Mac クラウドで OpenClaw と Ollama：プロバイダ設定、ヘルスチェック、クラウドフォールバック

誰が困り、何が壊れるか：クラウド API キーで OpenClaw を回しているチームが、同一 Mac 上の Ollama で低遅延と予測可能なコストを狙うと、本番では「Thinking のまま止まる」、謎の HTTP 500、Slack とゲートウェイのどちらが悪いかの議論が続きがちです。本稿で得られるもの：ゲートウェイと Ollama の同居／分離の比較表、ベース URL とモデル文字列の具体手順、タイムアウトと再試行、予算付きのセカンダリクラウドプロバイダ、そして doctor 優先の切り分け順序です。構成：番号付きの痛点リスト、二つの表、実装七ステップ、レビューに貼れる数値目安、ベアメタル Mac クラウドがパッチ当て Windows やネスト macOS より勝る理由の橋渡し段落、FAQ と HowTo の JSON-LD です。設定キーの詳細は利用中の OpenClaw リリースノートに従ってください。

1. 要約：ゲートウェイ、Ollama、クラウドキー

OpenClaw ゲートウェイはルーティング・ツール・IM を束ね、モデルはクラウド API とローカル HTTP の両方に載せられます。Ollama は通常 127.0.0.1:11434 でチャット互換 API。失敗の主因は UI 名と ollama list の不一致、コンテナ localhost がホストの ollama serve とズレること、コールドより短い HTTP 期限です。ベース URL・モデル ID・タイムアウトをマニフェストと同じリポジトリへ。Apple Silicon Mac クラウドに SSH しゲートウェイが動く前提で、ローカル優先＋クラウド退避を Runbook 化します。

2. 痛点：ポート、名前、タイムアウト、チャネル

問い合わせはだいたい次の四類型です。

バインド不一致：ループバック専用 Ollama に対しゲートウェイがブリッジ側、または 11434 の無認証公開。
モデル名ドリフト：:latest 欠落・接頭辞誤り・大小文字で 404→チャネルでは無言に見える。
タイムアウトとキュー：7×24 でキューが伸びるのに期限だけ短いとロード前に切れる。
フォールバック設計不足：セカンダリ無しは硬直、上限無しクラウド退避はコスト逆転。

フォールバック用キーは DB と同周期でローテし、インシデントに実際に応答したプロバイダをメモして財務と突合します。複数人が SSH する Mac では Ollama 更新を変更窓へ。無言のバイナリ差分がバインドや tokenizer 癖を変え、長いスレッドだけで露呈します。

3. トポロジー表：同居と分離

観点	ゲートウェイと Ollama が同居	Ollama が別ホスト
遅延	ループバック／ホストブリッジで RTT 最小	固定プライベート IP か内部 DNS
分離	プロセス単位、単一テナント向き	ブラスト分離、運用増
露出	11434 を公網に直晒し禁止	SG をゲートウェイ送信元のみ
デバッグ	ローカル curl で十分	多段＋ mTLS もあり得る
適合	PoC～中並列	GPU 重モデル分離の基盤班

ヒント：温度より先に HTTP の身元・DNS・経路を書く。ネットが誤っているのにプロンプトだけ弄るのは時間泥棒です。

分離構成では踏み台再起動で消える SSH トンネルより RFC1918＋明示 FW。外向きサブネットと mTLS 要否を残し、信頼ストアのズレは「モデル劣化」に見える再試行劣化を生みます。

4. 空の設定からフォールバック可能までの七ステップ

pull：ollama --version、重み pull、名前は ollama list どおり。
ヘルス：http://127.0.0.1:11434/api/tags 等を curl。
ローカル登録：コンテナならホスト到達可能なベース URL、モデル文字列、互換シムの有無。
タイムアウト階層：接続／初バイト／端到端を分離しコールドスタートを吸収。
クラウド退避：セカンダリにトークンまたは支出キャップ。
監督：launchd で Ollama→ゲートウェイの起動順、ログローテ。
検証：同一プロンプト三回で TTFT とエラー率、続けて同時セッションでキュー観測。

すばやいスモークコマンド：

curl -sS http://127.0.0.1:11434/api/tags | head
ollama run llama3.2 "ping"

配線後は実チャネルに近い合成負荷で短問・長要約・ツール回を混ぜ、p50／p95 の初トークンを分けて測ります。ループバック外へ出すなら mTLS か IP 許可つきリバプロで TLS 終端。生 11434 公開はマイナーと漏えいリスクです。

5. 数値目安：メモリ、同時実行、タイムアウト

計画資料では次のレンジを使い、実際に載せる量子化とは必ず突合してください。

ユニファイドメモリ：7B Q4 は重みで約 5～6GB。ゲートウェイ＋二モデルを 32GB 以下で詰めるとバーストでスワップ地獄。
同時実行：ローカルは有限キュー。活動モデル一つ＋溢れクラウドが無難。
タイムアウト：初トークンはコールドで数十秒許容。p95 が定常で割り込むなら縮める前にモデルか並列を削る。
ディスク：版が増えると数十 GB。ollama rm と空き監視をセット。
観測：モデル名・所要・フォールバック有無を 1 リクエストごとに残し節約と SLO を突合。
スワップ：リンク伸びは CPU 空きでも起きる。先に vm_stat。

キャンペーンや障害時の同時増を織り込み、重み差し替え中は小型スタンバイでクラウド流量を絞る。密架載は排熱も計画。Silicon でも気流不足は飽和します。

6. トラブルシュート：doctor、ログ、チャネル FAQ

梯子は固定：openclaw doctor→当該時刻のゲートウェイログ→Ollama 生存→チャネルペアリング。Thinking 無反応は HTTP 完走／T/O／エラーを先に切る。HTTP OK で中身空ならレートとメンション。下表はポストモーテム用です。

症状	最初に見る	次に見る
即時 404	モデル文字列と `ollama list`	誤ったベース URL かコンテナ内 localhost
間欠タイムアウト	コールドスタートとキュー深さ	スワップとディスク圧迫
チャネル沈黙	ゲートウェイがツールエラーを飲み込んだ	Webhook かボット権限
フォールバック後の請求急増	クラウドへの再試行嵐	フォールバック窓の上限欠如

四半期ごとに Ollama kill・ディスク満杯・クラウドキー失効を演習し、アラートとフォールバック上限を点検。ドキュメントとメトリクスと訓練が揃えばローカル推論はデモではなくサービスになります。

汎用 Windows や無ライセンスネスト仮想の macOS は互換と GPU 負債の先送りです。Linux で Docker だけ積むと UID と DNS が 7×24 で顔を出します。Silicon の帯域、launchd 常駐、SSH 一本で OpenClaw と Ollama を扱うなら VPSMAC 専用 Mac クラウドがハック積みより合理的です。クイックスタートと組めば調達をクリティカルパスから外せます。