2026: OpenClaw & OpenHuman auf gemietetem Mac mini M4 – Lokaler KI-Agent Leitfaden
2026 sind OpenClaw und OpenHuman zwei der meistdiskutierten Open-Source-Agenten: der eine fuer Telegram, WhatsApp und Cron-Gateways, der andere mit Memory Tree und Desktop-Erlebnis – beide mit Ollama fuer lokale Inferenz. Wer zwischen Eigenkauf, Cloud-Mac und Linux-VPS schwankt, bekommt hier Framework-Vergleich, M4-Sizing, ein fuenfstufiges Runbook, Sicherheitscheckliste und eine Kostenmatrix Miete vs Kauf vs GPU-Cloud.
Inhalt
1. Schmerzpunkt: Agent braucht 24/7, das MacBook schlaeft
KI-Agenten im Jahr 2026 sind keine einmaligen API-Skripte mehr, sondern Dauerprozesse mit Tool-Aufrufen und Multi-Channel-Messaging. OpenClaw (MIT) steuert autonome Flows ueber Telegram, WhatsApp und Discord; OpenHuman (GPL-3.0, TinyHumans AI) liefert Memory Tree, Sprache und Google-Meet-Teilnahme als Desktop-Superassistent. Beide koennen die Inferenz an Ollama binden, sodass Gespraechsdaten auf der Maschine bleiben. Teams in der EU und Asien verlagern zunehmend nur die Inferenz auf den Mac, waehrend das Gateway und die Kanaele unveraendert bleiben – ein Muster aus Datenschutz und Modell-Governance.
- Laptops eignen sich schlecht fuer Dauerbetrieb: Schlafmodus, Luefter und RAM-Konkurrenz trennen das Gateway. OpenClaws
launchd-Daemon und OpenHumans GUI brauchen stabile Strom- und Netzwerkversorgung. - Eigenkauf eines Mac mini ist teuer: M4 mit 16 GB startet im vierstelligen Euro-Bereich, M4 Pro mit 64 GB naehert sich fuenfstelligen Summen. Lieferzeiten, Abschreibung und falsch dimensionierter RAM sind echte Kosten.
- Linux-VPS ohne natives macOS: OpenClaw laeuft auf Linux, aber LaunchAgent, Keychain und Teile der Apple-Toolchain fehlen. OpenHuman als Tauri-App auf headless Servern erfordert VNC und erhoeht den Betriebsaufwand deutlich.
Der pragmatische Mittelweg: einen exklusiven physischen Mac mini M4 in der Cloud mieten (kein containerisiertes Fake-macOS). Lieferung per SSH oft in etwa zehn Minuten, 1-Gbit-Anbindung, Abrechnung tag-, wochen- oder monatsweise. Sie erhalten echte Apple Silicon mit voller Neural Engine – 16 GB fuer quantisierte 13B-Modelle, 64 GB M4 Pro fuer 70B-Klassen. Das ist 2026 die Standardform fuer «local-first»-Agenten.
In kleinen Teams konkurrieren KeepAlive des Gateways, Ollama-Modellwechsel und Schreibvorgaenge des Memory Tree um UMA und Festplatte. Ein Heim-Mac verliert bei Strom- oder Leitungsausfaellen oft IM-Sessions; ein Rechenzentrum-Mac naehert sich stabileren SLAs. Wer vertrauliche Prompts oder internes Wissen lokal halten will, bucht Regionen wie Hongkong oder Singapur und buendelt Inferenz plus Persistenz auf einem Knoten.
2. OpenClaw vs OpenHuman
| Dimension | OpenClaw | OpenHuman |
|---|---|---|
| Lizenz | MIT | GPL-3.0 |
| Form | CLI + Gateway + IM | Tauri-Desktop-GUI |
| Typische Nutzung | Telegram-Bot, Cron, Webhooks | Persoenlicher Assistent, Gmail, Notion, Slack |
| Gedaechtnis | Sitzung/Dateien, MEMORY.md | Memory Tree (Markdown-persistent) |
| Lokale KI | Ollama (OpenAI-kompatible API) | Ollama / LM Studio; v0.53+ Lifecycle-Bindung |
| Sprache / Meetings | Plugins | Native Sprache, Meet-Modus |
| Hintergrund | openclaw onboard --install-daemon | Desktop-Dauerbetrieb + optionaler Core |
| Sicherheit | openclaw security audit --fix | Lokale Daten, config.toml opt-in |
Fuer IM-getriebene Automation zuerst OpenClaw; fuer langfristiges Gedaechtnis und Desktop-Integration OpenHuman. Beide koennen auf einem 32-GB+-Cloud-Mac koexistieren, sofern Sie Ollama-Limits setzen und UMA-Konflikte vermeiden.
Operationell: openclaw security audit --fix reduziert Gateway-Exposure; OpenHuman verlangt explizites opt-in fuer lokale KI in config.toml. Teams mit Audit-Pflichten kombinieren verschluesselte Backups mit dokumentiertem Disk-Wipe vor Vertragsende.
3. Mac mini M4 und Inferenz
Erfahrungswerte der Community (Stand Mai 2026):
- M4 16 GB: Gateway plus Ollama 7B–8B (Llama 3.1 8B etwa 18–22 tok/s) – gut, wenn die Cloud-API den Hauptteil traegt und lokal nur geroutet wird.
- M4 24 GB: 13B Q4 plus ein IM-Kanal mit Reserve fuer System und Gateway.
- M4 Pro 64 GB: Llama 3.3 70B Q4 etwa 8–12 tok/s – fuer Szenarien ohne Cloud-Tokens und mit Datenschutzfokus.
OpenHuman v0.53.43 (13. Mai 2026) bietet aarch64-macOS-Builds und bindet den Ollama-serve-Lebenszyklus an den Prozess, um Cold Starts zu reduzieren. Minimum 8 GB RAM, Produktion ab 16 GB.
Bei der Latenz zaehlen nicht nur tok/s, sondern auch Time-to-first-token und parallele IM-Nachrichten. 7B-Klassen eignen sich fuer Cron und Routing; 13B+ verbessern Zusammenfassungen und laengere Entwuerfe. Mit Cloud-Fallback bleibt fuer Nutzer ein einzelner Bot sichtbar, waehrend das Gateway Provider wechselt.
4. Entscheidungsmatrix
| Option | Monatskosten | macOS nativ | 24/7 | Lokal 13B+ |
|---|---|---|---|---|
| Eigener Mac mini M4 16 GB | Abschreibung + Strom | Ja | Heimnetz abhaengig | Ja |
| VPSMAC Mac mini M4 Miete | ca. 100 USD/Monat | Ja, physisch | Rechenzentrum + launchd | Ja |
| Linux VPS + Docker | niedrig | Nein | Ja, GUI extra | kein Metal |
| Cloud-GPU (H100 etc.) | hoch | Nein | Cluster | Overkill fuer reine Agent-Gateways |
Bei Datenhoheit oder Modellen wie Qwen2.5 lassen sich Knoten in Hongkong oder Singapur waehlen, sodass Inferenz im Mietgeraet bleibt. Siehe auch OpenClaw Gateway Runbook.
Ein dedizierter Mac um etwa 100 USD/Monat kann ueber 24 Monate einem Eigenkauf plus Strom und Abschreibung entsprechen – der Vorteil der Miete ist die monatliche Anpassung der RAM-Groesse. Viele Teams starten mit 16 GB und wechseln auf 32 GB, sobald Memory Tree und 13B parallel laufen.
5. Fuenf-Schritte-Runbook
Schritt 1 – Cloud-Mac bereitstellen: Im VPSMAC-Panel M4 16/32/64 GB waehlen, SSH pruefen mit sw_vers, sysctl hw.memsize, curl -I https://ollama.com.
Schritt 2 – Ollama und Basismodelle:
brew install ollama brew services start ollama ollama pull llama3.2 ollama pull qwen2.5:7b
Schritt 3 – OpenClaw (Node.js ≥ 22):
curl -fsSL https://openclaw.ai/install.sh | bash openclaw onboard --install-daemon openclaw security audit --fix # Provider: http://127.0.0.1:11434
Abnahme: openclaw doctor, Port 18789 lauscht, Telegram-Roundtrip.
Schritt 4 – OpenHuman v0.53+:
curl -fsSL https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.sh | bash # config.toml: local_ai.runtime_enabled = true
Onboarding fuer Gmail/Notion/Slack; Ollama-Endpunkt 127.0.0.1:11434. Memory Tree verdichtet Quellen zu Markdown-Erinnerungen.
Schritt 5 – Ressourcen und Sicherheit: OLLAMA_MAX_LOADED_MODELS=1, Gateway nur auf 127.0.0.1:18789, SSH-Tunnel fuer Admin, verschluesselte Backups von ~/.openclaw und OpenHuman-Daten, Disk-Wipe vor Rueckgabe.
Abnahme-Checkliste: Telegram-Roundtrip, gruenes openclaw doctor, ollama run qwen2.5:7b antwortet, OpenHuman-Onboarding mit lokalem AI opt-in, launchctl list | grep -i openclaw zeigt Daemon. Bei Stoerungen zuerst Port 18789 und Ollama-RAM pruefen, alten LaunchAgent per launchctl bootout entfernen, dann neu installieren.
6. Technische Referenzdaten
- OpenClaw Gateway Standardport:
18789– bei Mehrfachinstanzen alten LaunchAgent perlaunchctl bootoutentfernen. - OpenHuman Stable: v0.53.43, Ollama-Lifecycle PR #1638.
- Node: OpenClaw empfiehlt Node.js ≥ 22.
- M4 Leistungsaufnahme: im Leerlauf etwa 4–8 W – geeignet fuer 24/7 im Rechenzentrum.
- Miet-Lieferung: exklusiver physischer Mac mini M4, SSH oft in ca. 10 Minuten (laut Tarif).
- Dual-Agent:
OLLAMA_MAX_LOADED_MODELS=1setzen, wenn OpenClaw und OpenHuman denselben gemieteten Host teilen.
7. FAQ
Muss ich mich entscheiden? Nein. Ueblich: OpenClaw fuer IM und Cron, OpenHuman fuer Gedaechtnis und Meetings. Auf 16 GB nicht zwei grosse Modelle parallel laden.
Windows oder WSL2? OpenClaw unter WSL2 moeglich, Produktion bevorzugt macOS launchd. OpenHuman ist auf macOS am reifsten.
Ist lokal schlechter als Claude? 8B–13B fuer enge Tasks und Routing; komplexe Reasoning-Pfade koennen per Provider in die Cloud ausweichen.
Zwei Agenten auf einem Host? Setzen Sie OLLAMA_MAX_LOADED_MODELS=1 und begrenzen Sie parallele IM-Sessions auf der gemieteten Mac-Instanz.
OpenHuman-GUI per VNC? Ja – fuer Onboarding und Einstellungen. Der Dauerbetrieb stuetzt sich auf OpenClaw Gateway und Ollama; GUI-Last nach Setup minimieren spart Ressourcen.
8. Fazit
Die beste Loesung 2026 ist oft nicht «noch eine GPU», sondern ein immer erreichbarer gemieteter Mac mini M4 mit OpenClaw, OpenHuman und Ollama auf einem Apple-Silicon-Stack: kontrollierbare Daten, sparsame Tokens, erweiterbare Kanaele.
Laptop-Kompromisse, erzwungene GUI auf Linux oder ein gekaufter Mac mit Abschreibungsfalle funktionieren fuer Demos, schulden aber Stabilitaet bei Memory Tree und launchd. Wer eine auditierbare lokale Agent-Produktionsbasis will, liegt mit VPSMAC exklusivem Mac mini M4 naeher am Design beider Frameworks. Im Panel Spezifikation waehlen und mit diesem Runbook in etwa 30 Minuten beide Stacks abnehmen.
Langfristig: monatlich Backup-Groessen von Memory Tree pruefen, Disk-Wipe vor Vertragsende im Runbook festhalten. Hardwarebeschaffung und Rechenzentrums-Kleinarbeit an die Miete auslagern – so bleibt Zeit fuer Agent-Logik. Das ist 2026 der pragmatische Kompromiss fuer Teams ohne eigene Mac-Flotte. Viele Startups koppeln OpenClaw-Support-Bots mit OpenHuman fuer interne Mail- und Wiki-Zusammenfassungen auf demselben Ollama-Stack.