Ist CoreWeave die guenstigste GPU Cloud?

Nein. Pro einzelner H200 GPU on demand (Mai 2026) liegt Vast.ai bei rund 2,29 USD, Lambda bei 3,79, RunPod 3,99 und CoreWeave 6,31 USD pro Stunde. CoreWeave konkurriert gegen AWS bei 4,98, Oracle 10 und Azure 10,60 USD und verkauft grosse reservierte Cluster mit Trainings SLAs, nicht die billigste Einzel GPU.

Wie arbeiten Mac VPS und GPU Cloud zusammen?

Ein Mac VPS dient als Steuerebene fuer OpenClaw, launchd, iOS Signierung, IM Kanaele und Cron, waehrend Training und Inferenz an CoreWeave, Lambda oder RunPod ausgelagert werden. Der Mac Knoten ruft GPU Cloud APIs ueber SSH oder HTTPS auf und legt Ergebnisse in Object Storage ab, sodass keine H200 Stunden fuer einen IM Bot verbraucht werden.

Hilft die Microsoft OpenAI Aenderung den Neoclouds?

Ja. Der Vertrag vom April 2026 streicht die AGI Klausel, macht die IP Lizenz bis 2032 nicht exklusiv und beendet die Azure Exklusivitaet. OpenAI Traffic kann nun ueber AWS, Google Cloud und CoreWeave fliessen, und Modelle anderer Labore koennen Multi Cloud Strategien fahren, was Neoclouds mit nachgewiesener Kapazitaet strukturell hebt.

2026 CoreWeave entschluesselt: Star der KI Rechenleistungs Vermietung und Neocloud Entscheidungsmatrix

Im April und Mai 2026 meldete CoreWeave (Nasdaq: CRWV) Q1 Umsatz von 2,08 Mrd USD und einen Backlog von 99,4 Mrd USD, schloss einen 21 Mrd USD Vertrag mit Meta bis Dezember 2032 und einen Mehrmilliarden Vertrag mit Anthropic ab und wurde zum groessten Star der KI Rechenleistungs Vermietung erklaert. Dieser Leitfaden richtet sich an CTOs, die GPU Clouds auswaehlen, an Produkt und Investmentleser, die das Neocloud Geschaeftsmodell verstehen wollen, und an vpsmac.com Nutzer, die Mac VPS mit gemieteter GPU Kapazitaet zu einem hybriden Stack kombinieren wollen. Vier nummerierte Painpoints, eine Kunden und Preis Tabelle, ein fuenfstufiges Auswahl Runbook, drei Risiko Pillen und eine FAQ ergeben eine Mac VPS plus GPU Cloud Entscheidungsmatrix.

1. Painpoints: Knappe Kapazitaet, gestreute Preise, Auswahlfallen

Preise variieren um Faktor 4,6: Pro einzelner H200 GPU reichen Listenpreise von 2,29 USD pro Stunde bei Vast.ai bis 10,60 USD pro Stunde bei Azure. Ein Budget von einer Million GPU Stunden kann je nach Anbieter um achtstellige Dollarbetraege schwanken.
Sichtbare Kapazitaet, die nicht buchbar ist: CoreWeave meldete zum 31. Maerz 2026 1 GW aktive Leistung und 3,5 GW vertraglich gesichert. GB200 und HGX B300 SKUs der Hyperscaler stehen zwar im Web, aber Laufzeit, Mindestmenge und Wartezeit sind fuer mittelgrosse Teams unfreundlich.
Misch Matrix aus Training und Inferenz: Training bevorzugt rack scale GB200 NVL72 und HGX B300 Fabrics. Inferenz braucht elastische, transparente Preise. Der optimale Anbieter fuer beide Enden ist 2026 selten dieselbe Firma.
Steuerebene gefangen im GPU Knoten: OpenClaw, launchd, iOS Signierung und IM Kanaele auf einem 50 USD pro Stunde H100 Knoten zu betreiben war ein verstecktes Failure Pattern aus 2025. Die GPU Auslastung sinkt, die Rechnung explodiert, und Ausfaelle haeufen sich.

2. Warum CoreWeave der groesste Star ist: vier harte Datenpunkte

Finanzgroesse: Q1 2026 Umsatz 2,08 Mrd USD (gegen 981,8 Mio im Vorjahr), Backlog 99,4 Mrd USD zum 31. Maerz, 2026 Guidance 12 bis 13 Mrd USD und annualisierte 2027 Outlook 30 bis 35 Mrd USD. NVIDIA hat im Quartal eine 2 Mrd USD Class A Investition abgeschlossen.
Leistung und Kapazitaet: 1 GW aktiv, ueber 3,5 GW vertraglich, Ziel ueber 8 GW bis 2030. Die neue DDTL 4.0 Fazilitaet liefert 8,5 Mrd USD GPU besicherte Finanzierung zusaetzlich zu einer 3,1 Mrd USD Kreditfazilitaet und macht GPU Vermoegen zum Industriestandard Sicherheitspool.
NVIDIA Tiefe: Erste Welle der NVIDIA Exemplar Cloud Validierung fuer Training und Inferenz auf GB200 NVL72. HGX B300 (Blackwell Ultra) wurde am 16. Maerz 2026 auf der GTC allgemein verfuegbar, Vera Rubin NVL72 ist fuer die zweite Haelfte 2026 geplant.
Unabhaengige Benchmarks: Einzige AI Cloud mit Platinum Status in SemiAnalysis ClusterMAX 1.0 und 2.0, Spitzenwerte in MLPerf Training und Inferenz, fuehrende Inferenz Preisleistung fuer Moonshot Kimi K2.6 in Artificial Analysis Tests.

3. Kunden: OpenAI, Meta, Anthropic und 9 von 10 Modell Labs

Am 9. und 10. April 2026 verkuendete CoreWeave eine 21 Mrd USD Erweiterung mit Meta bis Dezember 2032 und innerhalb von 24 Stunden einen Mehrmilliarden Vertrag mit Anthropic. Das Ergebnis: 9 von 10 Frontier Labs sind in seiner Cloud:

Kunde	Vertragswert	Laufzeit	Workload
OpenAI	~22,4 Mrd USD	Mehrjaehrig	Training und Inferenz
Meta	21 Mrd USD	Bis Dez 2032	Llama 5 Training, Meta AI Inferenz
Anthropic	est. 4 bis 7 Mrd USD	Mehrjaehrig	Claude Training und Inferenz
Microsoft Azure	~10 Mrd USD (geschaetzt)	Mehrjaehrig	Azure Ueberlauf, OpenAI Workloads
Backlog gesamt	66,8 Mrd (April) bis 99,4 Mrd (Q1)	—	9 von 10 Frontier Labs

Das Signal lautet: CoreWeave ist nicht laenger ein OpenAI Backup. Es ist die neutrale Neocloud, auf die Microsoft, Meta, Anthropic, IBM, Cohere, Mistral, NVIDIA und Google Research gleichzeitig setzen. Neutralitaet selbst ist 2026 das knappste Lieferantenattribut.

4. Entscheidungsmatrix: H200 8 GPU Knoten Preistabelle

Die Tabelle normalisiert Mai 2026 Listenpreise auf eine einzelne H200 Stunde. Hyperscaler SKUs sind 8 GPU Knoten, daher Knotenstunde durch acht teilen:

Anbieter	SKU	USD pro H200 Stunde (on demand)	Eignung
Vast.ai	Marktplatz	~2,29	Dev Experimente, niedrige SLA
Lambda	1 x H200	3,79	Pro Minute, kurze Bursts
RunPod	8 x H200	3,99	Container Training und Inferenz
AWS p5e.48xlarge	8 x H200 141GB	4,98 (mind. 1 Tag)	Bereits in AWS investiert
CoreWeave	8 x H200	6,31	Grosse Cluster, Production SLA
Oracle Cloud	BM.GPU.H200.8	10,00	Bare Metal Compliance
Azure ND96isr	H200 v5	10,60	Microsoft Enterprise Stack

H100 SXM folgt demselben Muster: Lambda 2,49 USD, RunPod 2,69, Vast.ai 2,95, CoreWeave 3,12, Hyperscaler 10 bis 12 USD pro GPU Stunde. CoreWeave verkauft nicht die guenstigste Einzel GPU, sondern die Mittelklasse, die 40 bis 60 Prozent unter Hyperscalern liegt und zugleich grosse reservierte Cluster und Trainings SLAs anbietet.

5. Microsoft OpenAI Umstellung als Schub

Am 26. April 2026 veroeffentlichten Microsoft und OpenAI einen geaenderten Vertrag: die AGI Kuendigungsklausel wurde gestrichen, die IP Lizenz wurde bis 2032 nicht exklusiv, und die Azure Exklusivitaet endete zugunsten von Azure first, jede Cloud erlaubt. Parallel sagte Amazon bis zu 38 Mrd USD Investitionen in OpenAI zu, und AWS wurde exklusiver Drittanbieter Distributor fuer OpenAI Frontier. Workloads verschieben sich von einem Zwei Anbieter Loop zu einem Mesh aus neutralen Neoclouds und mehreren Hyperscalern. CoreWeave profitiert dank bestehender Vertraege und aktiver Leistung am direktesten, waehrend jedes Team statt 1 oder 2 nun 5 bis 8 Anbieter waehlt.

6. Auswahl Runbook in fuenf Schritten

Schritt 1: Workloads klassifizieren. Vier Buckets: Frontier Training (GB200 NVL72 oder HGX B300), exploratives RL und Feintuning (H100 oder H200), Production Inferenz (H100 oder L40S elastisch), Build und Steuerung (iOS, Agents, IM, Cron).

Schritt 2: Vertragslaufzeit. Trainingsvertraege ueber drei Jahre an CoreWeave, AWS Capacity Blocks oder Oracle Bare Metal. Aufgaben unter drei Monaten an Lambda, RunPod oder Vast.ai on demand oder Spot. Steuerebene bleibt unbefristet auf einem Mac VPS bei vpsmac.com.

Schritt 3: GPU Stunden Preisbuch. Spot Zeilen mit 30 bis 60 Prozent Rabatt einbauen (CoreWeave HGX H100 Spot 19,71 USD pro Knotenstunde) und 25 Prozent Reserved Zeilen fuer 3 bis 6 Monate. Pro Workload nach GPU Stunden Gesamtkosten vergleichen, nicht nach Stueckpreis.

Schritt 4: Steuerebene isolieren. OpenClaw, IM Webhooks, SSH Bastions und Cron auf dem Mac VPS halten. GPU Knoten nehmen nur API Jobs und Object Storage IO an. Niemals eine langlaufende IM Verbindung auf einer H200 betreiben.

Schritt 5: Exit Trigger schreiben. H200 ueber 7 USD pro Stunde, monatliche Verfuegbarkeit unter 99,5 Prozent, weniger als 60 Tage Restlaufzeit oder GPU Auslastung dauerhaft unter 35 Prozent loesen einen Anbieterwechsel aus.

7. Risiken hinter dem 99,4 Mrd USD Backlog

Ergebnisdruck: Q1 2026 Nettoverlust 740 Mio USD (von 315 Mio), EPS minus 1,12 USD; mit 8,5 Mrd USD DDTL 4.0 aehnelt die Bilanz GPU besicherter Projektfinanzierung.
Kunden Konzentration: OpenAI, Meta, Anthropic und Microsoft dominieren den Wert; jeder einzelne koennte den Backlog daempfen.
GPU Abschreibung und Strom: GB200 und Vera Rubin verkuerzen die Nutzungsdauer aelterer Chips; acht GW bis 2030 erfordern jaehrlich ein GW neue Leistung, Energiezulassung und Trafos sind die wichtigsten US Engpaesse.

8. Mac VPS plus GPU Cloud: der hybride Sweet Spot

Die praktische Lehre fuer vpsmac.com Leser ist, Mac VPS und GPU Cloud als Steuerebene und Rechenebene zu betrachten, nicht als Konkurrenten. Ein Mac VPS ist konkurrenzlos fuer native iOS und macOS Toolchains, launchd 7x24 Daemons und Apple Agenten (siehe Onsite Beitrag Playwright skill-browser Deployment und v2026.5.20 Upgrade Runbook). GPU Clouds dominieren H100, H200 und GB200 Trainings SLAs.

Einen IM Kanal und eine iOS Signierungs Pipeline auf einem Linux Spot GPU Knoten oder einer Windows Workstation am Leben zu halten ist eine verlockende Abkuerzung mit drei harten Grenzen: Linux Container koennen Xcode und notarytool nicht nativ ausfuehren, daher umgeht die Signierungskette die Virtualisierung und die Stabilitaet leidet langfristig spuerbar; OpenClaw, launchd und Cron in stundenweise abgerechnete GPU Knoten zu mischen laesst die Rechnung mit der Auslastung schwanken, und selbst einfache Mac Simulatoren laufen selten sauber; Apple Toolchains vertiefen ihre Abhaengigkeit von SSH Gewohnheiten, auditierbaren plists und Apple Silicon. Fuer Teams, die einen einzigen SSH Workflow fuer OpenClaw 7x24, iOS Signierung, IM Kanaele, Cron und Remote GPU Scheduling wollen, ist die Anmietung eines Apple Silicon Mac Cloud Servers von VPSMAC meist die bessere Antwort: die Steuerebene wird auf einer einzigen Betriebsoberflaeche konsolidiert und CoreWeave, Lambda oder RunPod uebernehmen die GPU Rechenleistung, sodass die Gesamtkosten unter dem Stapeln aller Aufgaben auf dem GPU Knoten liegen.

9. FAQ

Koennen CoreWeave Sandboxes mein Docker Cluster ersetzen? Sandboxes (allgemein verfuegbar am 14. Mai 2026) sind isolierte Laufzeiten fuer Reinforcement Learning, Agent Werkzeuge und Modellbewertung, in Ihrem CoreWeave Cluster oder serverlos ueber Weights and Biases. Einfache Webapps und iOS CI muessen nicht migrieren, Agent Bewertung und RL Schleifen bringen echten ROI.

Spot oder Flex Reservations? Flex Reservations sind unterbrechbare monatliche Reservierungen zwischen on demand und mehrjaehrig, ideal fuer Inferenz Baselines. Spot bietet 30 bis 40 Prozent Rabatt fuer Datenbereinigung, Batch Verarbeitung und neustartbares Training, geplant per launchd auf dem Mac VPS mit Spot freundlichem Checkpointing.

Verhaeltnis zu Stargate, Azure und AWS Trainium? Stargate ist OpenAIs Joint Venture Programm, nicht fuer den allgemeinen Verkauf. Azure bleibt OpenAIs primaere Cloud, aber ohne Exklusivitaet. AWS haelt die exklusive Drittanbieter Distribution fuer Frontier sowie Trainium Kapazitaet. CoreWeave ist der neutrale GPU Cluster Lieferant. Alle vier koexistieren 2026.

10. Fazit

Die KI Rechenleistungs Vermietung 2026 ist ein dreischichtiges Oekosystem aus Neoclouds, Hyperscalern und Steuerebene. CoreWeave hat die Neocloud Decke mit 99,4 Mrd USD Backlog, dual ClusterMAX Platinum und 9 von 10 Frontier Labs bewiesen. Doch der groesste Star ist nicht immer die beste Wahl: Training an Neoclouds, Experimente an Lambda oder RunPod und OpenClaw, launchd und iOS Signierung auf einem nativen Mac VPS von vpsmac.com belassen, um GPU Rechnungen zu stabilisieren und TCO zu senken.

2026 CoreWeave entschluesselt: Der Star der KI Rechenleistungs Vermietung, 99,4 Mrd USD Backlog, 3,5 GW vertragliche Leistung und eine Neocloud Entscheidungsmatrix

Inhalt