2026 CoreWeave entschluesselt: Der Star der KI Rechenleistungs Vermietung, 99,4 Mrd USD Backlog, 3,5 GW vertragliche Leistung und eine Neocloud Entscheidungsmatrix

Im April und Mai 2026 meldete CoreWeave (Nasdaq: CRWV) Q1 Umsatz von 2,08 Mrd USD und einen Backlog von 99,4 Mrd USD, schloss einen 21 Mrd USD Vertrag mit Meta bis Dezember 2032 und einen Mehrmilliarden Vertrag mit Anthropic ab und wurde zum groessten Star der KI Rechenleistungs Vermietung erklaert. Dieser Leitfaden richtet sich an CTOs, die GPU Clouds auswaehlen, an Produkt und Investmentleser, die das Neocloud Geschaeftsmodell verstehen wollen, und an vpsmac.com Nutzer, die Mac VPS mit gemieteter GPU Kapazitaet zu einem hybriden Stack kombinieren wollen. Vier nummerierte Painpoints, eine Kunden und Preis Tabelle, ein fuenfstufiges Auswahl Runbook, drei Risiko Pillen und eine FAQ ergeben eine Mac VPS plus GPU Cloud Entscheidungsmatrix.

Diagramm: CoreWeave GPU Cluster gepaart mit Mac VPS Steuerebene als Hybrid Architektur fuer KI Rechenleistungs Vermietung 2026

Inhalt

1. Painpoints: Knappe Kapazitaet, gestreute Preise, Auswahlfallen

  1. Preise variieren um Faktor 4,6: Pro einzelner H200 GPU reichen Listenpreise von 2,29 USD pro Stunde bei Vast.ai bis 10,60 USD pro Stunde bei Azure. Ein Budget von einer Million GPU Stunden kann je nach Anbieter um achtstellige Dollarbetraege schwanken.
  2. Sichtbare Kapazitaet, die nicht buchbar ist: CoreWeave meldete zum 31. Maerz 2026 1 GW aktive Leistung und 3,5 GW vertraglich gesichert. GB200 und HGX B300 SKUs der Hyperscaler stehen zwar im Web, aber Laufzeit, Mindestmenge und Wartezeit sind fuer mittelgrosse Teams unfreundlich.
  3. Misch Matrix aus Training und Inferenz: Training bevorzugt rack scale GB200 NVL72 und HGX B300 Fabrics. Inferenz braucht elastische, transparente Preise. Der optimale Anbieter fuer beide Enden ist 2026 selten dieselbe Firma.
  4. Steuerebene gefangen im GPU Knoten: OpenClaw, launchd, iOS Signierung und IM Kanaele auf einem 50 USD pro Stunde H100 Knoten zu betreiben war ein verstecktes Failure Pattern aus 2025. Die GPU Auslastung sinkt, die Rechnung explodiert, und Ausfaelle haeufen sich.

2. Warum CoreWeave der groesste Star ist: vier harte Datenpunkte

3. Kunden: OpenAI, Meta, Anthropic und 9 von 10 Modell Labs

Am 9. und 10. April 2026 verkuendete CoreWeave eine 21 Mrd USD Erweiterung mit Meta bis Dezember 2032 und innerhalb von 24 Stunden einen Mehrmilliarden Vertrag mit Anthropic. Das Ergebnis: 9 von 10 Frontier Labs sind in seiner Cloud:

KundeVertragswertLaufzeitWorkload
OpenAI~22,4 Mrd USDMehrjaehrigTraining und Inferenz
Meta21 Mrd USDBis Dez 2032Llama 5 Training, Meta AI Inferenz
Anthropicest. 4 bis 7 Mrd USDMehrjaehrigClaude Training und Inferenz
Microsoft Azure~10 Mrd USD (geschaetzt)MehrjaehrigAzure Ueberlauf, OpenAI Workloads
Backlog gesamt66,8 Mrd (April) bis 99,4 Mrd (Q1)9 von 10 Frontier Labs

Das Signal lautet: CoreWeave ist nicht laenger ein OpenAI Backup. Es ist die neutrale Neocloud, auf die Microsoft, Meta, Anthropic, IBM, Cohere, Mistral, NVIDIA und Google Research gleichzeitig setzen. Neutralitaet selbst ist 2026 das knappste Lieferantenattribut.

4. Entscheidungsmatrix: H200 8 GPU Knoten Preistabelle

Die Tabelle normalisiert Mai 2026 Listenpreise auf eine einzelne H200 Stunde. Hyperscaler SKUs sind 8 GPU Knoten, daher Knotenstunde durch acht teilen:

AnbieterSKUUSD pro H200 Stunde (on demand)Eignung
Vast.aiMarktplatz~2,29Dev Experimente, niedrige SLA
Lambda1 x H2003,79Pro Minute, kurze Bursts
RunPod8 x H2003,99Container Training und Inferenz
AWS p5e.48xlarge8 x H200 141GB4,98 (mind. 1 Tag)Bereits in AWS investiert
CoreWeave8 x H2006,31Grosse Cluster, Production SLA
Oracle CloudBM.GPU.H200.810,00Bare Metal Compliance
Azure ND96isrH200 v510,60Microsoft Enterprise Stack

H100 SXM folgt demselben Muster: Lambda 2,49 USD, RunPod 2,69, Vast.ai 2,95, CoreWeave 3,12, Hyperscaler 10 bis 12 USD pro GPU Stunde. CoreWeave verkauft nicht die guenstigste Einzel GPU, sondern die Mittelklasse, die 40 bis 60 Prozent unter Hyperscalern liegt und zugleich grosse reservierte Cluster und Trainings SLAs anbietet.

5. Microsoft OpenAI Umstellung als Schub

Am 26. April 2026 veroeffentlichten Microsoft und OpenAI einen geaenderten Vertrag: die AGI Kuendigungsklausel wurde gestrichen, die IP Lizenz wurde bis 2032 nicht exklusiv, und die Azure Exklusivitaet endete zugunsten von Azure first, jede Cloud erlaubt. Parallel sagte Amazon bis zu 38 Mrd USD Investitionen in OpenAI zu, und AWS wurde exklusiver Drittanbieter Distributor fuer OpenAI Frontier. Workloads verschieben sich von einem Zwei Anbieter Loop zu einem Mesh aus neutralen Neoclouds und mehreren Hyperscalern. CoreWeave profitiert dank bestehender Vertraege und aktiver Leistung am direktesten, waehrend jedes Team statt 1 oder 2 nun 5 bis 8 Anbieter waehlt.

6. Auswahl Runbook in fuenf Schritten

Schritt 1: Workloads klassifizieren. Vier Buckets: Frontier Training (GB200 NVL72 oder HGX B300), exploratives RL und Feintuning (H100 oder H200), Production Inferenz (H100 oder L40S elastisch), Build und Steuerung (iOS, Agents, IM, Cron).

Schritt 2: Vertragslaufzeit. Trainingsvertraege ueber drei Jahre an CoreWeave, AWS Capacity Blocks oder Oracle Bare Metal. Aufgaben unter drei Monaten an Lambda, RunPod oder Vast.ai on demand oder Spot. Steuerebene bleibt unbefristet auf einem Mac VPS bei vpsmac.com.

Schritt 3: GPU Stunden Preisbuch. Spot Zeilen mit 30 bis 60 Prozent Rabatt einbauen (CoreWeave HGX H100 Spot 19,71 USD pro Knotenstunde) und 25 Prozent Reserved Zeilen fuer 3 bis 6 Monate. Pro Workload nach GPU Stunden Gesamtkosten vergleichen, nicht nach Stueckpreis.

Schritt 4: Steuerebene isolieren. OpenClaw, IM Webhooks, SSH Bastions und Cron auf dem Mac VPS halten. GPU Knoten nehmen nur API Jobs und Object Storage IO an. Niemals eine langlaufende IM Verbindung auf einer H200 betreiben.

Schritt 5: Exit Trigger schreiben. H200 ueber 7 USD pro Stunde, monatliche Verfuegbarkeit unter 99,5 Prozent, weniger als 60 Tage Restlaufzeit oder GPU Auslastung dauerhaft unter 35 Prozent loesen einen Anbieterwechsel aus.

7. Risiken hinter dem 99,4 Mrd USD Backlog

8. Mac VPS plus GPU Cloud: der hybride Sweet Spot

Die praktische Lehre fuer vpsmac.com Leser ist, Mac VPS und GPU Cloud als Steuerebene und Rechenebene zu betrachten, nicht als Konkurrenten. Ein Mac VPS ist konkurrenzlos fuer native iOS und macOS Toolchains, launchd 7x24 Daemons und Apple Agenten (siehe Onsite Beitrag Playwright skill-browser Deployment und v2026.5.20 Upgrade Runbook). GPU Clouds dominieren H100, H200 und GB200 Trainings SLAs.

Einen IM Kanal und eine iOS Signierungs Pipeline auf einem Linux Spot GPU Knoten oder einer Windows Workstation am Leben zu halten ist eine verlockende Abkuerzung mit drei harten Grenzen: Linux Container koennen Xcode und notarytool nicht nativ ausfuehren, daher umgeht die Signierungskette die Virtualisierung und die Stabilitaet leidet langfristig spuerbar; OpenClaw, launchd und Cron in stundenweise abgerechnete GPU Knoten zu mischen laesst die Rechnung mit der Auslastung schwanken, und selbst einfache Mac Simulatoren laufen selten sauber; Apple Toolchains vertiefen ihre Abhaengigkeit von SSH Gewohnheiten, auditierbaren plists und Apple Silicon. Fuer Teams, die einen einzigen SSH Workflow fuer OpenClaw 7x24, iOS Signierung, IM Kanaele, Cron und Remote GPU Scheduling wollen, ist die Anmietung eines Apple Silicon Mac Cloud Servers von VPSMAC meist die bessere Antwort: die Steuerebene wird auf einer einzigen Betriebsoberflaeche konsolidiert und CoreWeave, Lambda oder RunPod uebernehmen die GPU Rechenleistung, sodass die Gesamtkosten unter dem Stapeln aller Aufgaben auf dem GPU Knoten liegen.

9. FAQ

Koennen CoreWeave Sandboxes mein Docker Cluster ersetzen? Sandboxes (allgemein verfuegbar am 14. Mai 2026) sind isolierte Laufzeiten fuer Reinforcement Learning, Agent Werkzeuge und Modellbewertung, in Ihrem CoreWeave Cluster oder serverlos ueber Weights and Biases. Einfache Webapps und iOS CI muessen nicht migrieren, Agent Bewertung und RL Schleifen bringen echten ROI.

Spot oder Flex Reservations? Flex Reservations sind unterbrechbare monatliche Reservierungen zwischen on demand und mehrjaehrig, ideal fuer Inferenz Baselines. Spot bietet 30 bis 40 Prozent Rabatt fuer Datenbereinigung, Batch Verarbeitung und neustartbares Training, geplant per launchd auf dem Mac VPS mit Spot freundlichem Checkpointing.

Verhaeltnis zu Stargate, Azure und AWS Trainium? Stargate ist OpenAIs Joint Venture Programm, nicht fuer den allgemeinen Verkauf. Azure bleibt OpenAIs primaere Cloud, aber ohne Exklusivitaet. AWS haelt die exklusive Drittanbieter Distribution fuer Frontier sowie Trainium Kapazitaet. CoreWeave ist der neutrale GPU Cluster Lieferant. Alle vier koexistieren 2026.

10. Fazit

Die KI Rechenleistungs Vermietung 2026 ist ein dreischichtiges Oekosystem aus Neoclouds, Hyperscalern und Steuerebene. CoreWeave hat die Neocloud Decke mit 99,4 Mrd USD Backlog, dual ClusterMAX Platinum und 9 von 10 Frontier Labs bewiesen. Doch der groesste Star ist nicht immer die beste Wahl: Training an Neoclouds, Experimente an Lambda oder RunPod und OpenClaw, launchd und iOS Signierung auf einem nativen Mac VPS von vpsmac.com belassen, um GPU Rechnungen zu stabilisieren und TCO zu senken.