2026 CoreWeave entschluesselt: Der Star der KI Rechenleistungs Vermietung, 99,4 Mrd USD Backlog, 3,5 GW vertragliche Leistung und eine Neocloud Entscheidungsmatrix
Im April und Mai 2026 meldete CoreWeave (Nasdaq: CRWV) Q1 Umsatz von 2,08 Mrd USD und einen Backlog von 99,4 Mrd USD, schloss einen 21 Mrd USD Vertrag mit Meta bis Dezember 2032 und einen Mehrmilliarden Vertrag mit Anthropic ab und wurde zum groessten Star der KI Rechenleistungs Vermietung erklaert. Dieser Leitfaden richtet sich an CTOs, die GPU Clouds auswaehlen, an Produkt und Investmentleser, die das Neocloud Geschaeftsmodell verstehen wollen, und an vpsmac.com Nutzer, die Mac VPS mit gemieteter GPU Kapazitaet zu einem hybriden Stack kombinieren wollen. Vier nummerierte Painpoints, eine Kunden und Preis Tabelle, ein fuenfstufiges Auswahl Runbook, drei Risiko Pillen und eine FAQ ergeben eine Mac VPS plus GPU Cloud Entscheidungsmatrix.
Inhalt
- 1. Painpoints: Knappe Kapazitaet, gestreute Preise, Auswahlfallen
- 2. Warum CoreWeave der groesste Star ist: vier harte Datenpunkte
- 3. Kunden: OpenAI, Meta, Anthropic und 9 von 10 Modell Labs
- 4. Entscheidungsmatrix: H200 8 GPU Knoten Preistabelle
- 5. Microsoft OpenAI Umstellung als Schub
- 6. Auswahl Runbook in fuenf Schritten
- 7. Risiken hinter dem 99,4 Mrd USD Backlog
- 8. Mac VPS plus GPU Cloud: der hybride Sweet Spot
- 9. FAQ
- 10. Fazit
1. Painpoints: Knappe Kapazitaet, gestreute Preise, Auswahlfallen
- Preise variieren um Faktor 4,6: Pro einzelner H200 GPU reichen Listenpreise von 2,29 USD pro Stunde bei Vast.ai bis 10,60 USD pro Stunde bei Azure. Ein Budget von einer Million GPU Stunden kann je nach Anbieter um achtstellige Dollarbetraege schwanken.
- Sichtbare Kapazitaet, die nicht buchbar ist: CoreWeave meldete zum 31. Maerz 2026 1 GW aktive Leistung und 3,5 GW vertraglich gesichert. GB200 und HGX B300 SKUs der Hyperscaler stehen zwar im Web, aber Laufzeit, Mindestmenge und Wartezeit sind fuer mittelgrosse Teams unfreundlich.
- Misch Matrix aus Training und Inferenz: Training bevorzugt rack scale GB200 NVL72 und HGX B300 Fabrics. Inferenz braucht elastische, transparente Preise. Der optimale Anbieter fuer beide Enden ist 2026 selten dieselbe Firma.
- Steuerebene gefangen im GPU Knoten: OpenClaw, launchd, iOS Signierung und IM Kanaele auf einem 50 USD pro Stunde H100 Knoten zu betreiben war ein verstecktes Failure Pattern aus 2025. Die GPU Auslastung sinkt, die Rechnung explodiert, und Ausfaelle haeufen sich.
2. Warum CoreWeave der groesste Star ist: vier harte Datenpunkte
- Finanzgroesse: Q1 2026 Umsatz 2,08 Mrd USD (gegen 981,8 Mio im Vorjahr), Backlog 99,4 Mrd USD zum 31. Maerz, 2026 Guidance 12 bis 13 Mrd USD und annualisierte 2027 Outlook 30 bis 35 Mrd USD. NVIDIA hat im Quartal eine 2 Mrd USD Class A Investition abgeschlossen.
- Leistung und Kapazitaet: 1 GW aktiv, ueber 3,5 GW vertraglich, Ziel ueber 8 GW bis 2030. Die neue DDTL 4.0 Fazilitaet liefert 8,5 Mrd USD GPU besicherte Finanzierung zusaetzlich zu einer 3,1 Mrd USD Kreditfazilitaet und macht GPU Vermoegen zum Industriestandard Sicherheitspool.
- NVIDIA Tiefe: Erste Welle der NVIDIA Exemplar Cloud Validierung fuer Training und Inferenz auf GB200 NVL72. HGX B300 (Blackwell Ultra) wurde am 16. Maerz 2026 auf der GTC allgemein verfuegbar, Vera Rubin NVL72 ist fuer die zweite Haelfte 2026 geplant.
- Unabhaengige Benchmarks: Einzige AI Cloud mit Platinum Status in SemiAnalysis ClusterMAX 1.0 und 2.0, Spitzenwerte in MLPerf Training und Inferenz, fuehrende Inferenz Preisleistung fuer Moonshot Kimi K2.6 in Artificial Analysis Tests.
3. Kunden: OpenAI, Meta, Anthropic und 9 von 10 Modell Labs
Am 9. und 10. April 2026 verkuendete CoreWeave eine 21 Mrd USD Erweiterung mit Meta bis Dezember 2032 und innerhalb von 24 Stunden einen Mehrmilliarden Vertrag mit Anthropic. Das Ergebnis: 9 von 10 Frontier Labs sind in seiner Cloud:
| Kunde | Vertragswert | Laufzeit | Workload |
|---|---|---|---|
| OpenAI | ~22,4 Mrd USD | Mehrjaehrig | Training und Inferenz |
| Meta | 21 Mrd USD | Bis Dez 2032 | Llama 5 Training, Meta AI Inferenz |
| Anthropic | est. 4 bis 7 Mrd USD | Mehrjaehrig | Claude Training und Inferenz |
| Microsoft Azure | ~10 Mrd USD (geschaetzt) | Mehrjaehrig | Azure Ueberlauf, OpenAI Workloads |
| Backlog gesamt | 66,8 Mrd (April) bis 99,4 Mrd (Q1) | — | 9 von 10 Frontier Labs |
Das Signal lautet: CoreWeave ist nicht laenger ein OpenAI Backup. Es ist die neutrale Neocloud, auf die Microsoft, Meta, Anthropic, IBM, Cohere, Mistral, NVIDIA und Google Research gleichzeitig setzen. Neutralitaet selbst ist 2026 das knappste Lieferantenattribut.
4. Entscheidungsmatrix: H200 8 GPU Knoten Preistabelle
Die Tabelle normalisiert Mai 2026 Listenpreise auf eine einzelne H200 Stunde. Hyperscaler SKUs sind 8 GPU Knoten, daher Knotenstunde durch acht teilen:
| Anbieter | SKU | USD pro H200 Stunde (on demand) | Eignung |
|---|---|---|---|
| Vast.ai | Marktplatz | ~2,29 | Dev Experimente, niedrige SLA |
| Lambda | 1 x H200 | 3,79 | Pro Minute, kurze Bursts |
| RunPod | 8 x H200 | 3,99 | Container Training und Inferenz |
| AWS p5e.48xlarge | 8 x H200 141GB | 4,98 (mind. 1 Tag) | Bereits in AWS investiert |
| CoreWeave | 8 x H200 | 6,31 | Grosse Cluster, Production SLA |
| Oracle Cloud | BM.GPU.H200.8 | 10,00 | Bare Metal Compliance |
| Azure ND96isr | H200 v5 | 10,60 | Microsoft Enterprise Stack |
H100 SXM folgt demselben Muster: Lambda 2,49 USD, RunPod 2,69, Vast.ai 2,95, CoreWeave 3,12, Hyperscaler 10 bis 12 USD pro GPU Stunde. CoreWeave verkauft nicht die guenstigste Einzel GPU, sondern die Mittelklasse, die 40 bis 60 Prozent unter Hyperscalern liegt und zugleich grosse reservierte Cluster und Trainings SLAs anbietet.
5. Microsoft OpenAI Umstellung als Schub
Am 26. April 2026 veroeffentlichten Microsoft und OpenAI einen geaenderten Vertrag: die AGI Kuendigungsklausel wurde gestrichen, die IP Lizenz wurde bis 2032 nicht exklusiv, und die Azure Exklusivitaet endete zugunsten von Azure first, jede Cloud erlaubt. Parallel sagte Amazon bis zu 38 Mrd USD Investitionen in OpenAI zu, und AWS wurde exklusiver Drittanbieter Distributor fuer OpenAI Frontier. Workloads verschieben sich von einem Zwei Anbieter Loop zu einem Mesh aus neutralen Neoclouds und mehreren Hyperscalern. CoreWeave profitiert dank bestehender Vertraege und aktiver Leistung am direktesten, waehrend jedes Team statt 1 oder 2 nun 5 bis 8 Anbieter waehlt.
6. Auswahl Runbook in fuenf Schritten
Schritt 1: Workloads klassifizieren. Vier Buckets: Frontier Training (GB200 NVL72 oder HGX B300), exploratives RL und Feintuning (H100 oder H200), Production Inferenz (H100 oder L40S elastisch), Build und Steuerung (iOS, Agents, IM, Cron).
Schritt 2: Vertragslaufzeit. Trainingsvertraege ueber drei Jahre an CoreWeave, AWS Capacity Blocks oder Oracle Bare Metal. Aufgaben unter drei Monaten an Lambda, RunPod oder Vast.ai on demand oder Spot. Steuerebene bleibt unbefristet auf einem Mac VPS bei vpsmac.com.
Schritt 3: GPU Stunden Preisbuch. Spot Zeilen mit 30 bis 60 Prozent Rabatt einbauen (CoreWeave HGX H100 Spot 19,71 USD pro Knotenstunde) und 25 Prozent Reserved Zeilen fuer 3 bis 6 Monate. Pro Workload nach GPU Stunden Gesamtkosten vergleichen, nicht nach Stueckpreis.
Schritt 4: Steuerebene isolieren. OpenClaw, IM Webhooks, SSH Bastions und Cron auf dem Mac VPS halten. GPU Knoten nehmen nur API Jobs und Object Storage IO an. Niemals eine langlaufende IM Verbindung auf einer H200 betreiben.
Schritt 5: Exit Trigger schreiben. H200 ueber 7 USD pro Stunde, monatliche Verfuegbarkeit unter 99,5 Prozent, weniger als 60 Tage Restlaufzeit oder GPU Auslastung dauerhaft unter 35 Prozent loesen einen Anbieterwechsel aus.
7. Risiken hinter dem 99,4 Mrd USD Backlog
- Ergebnisdruck: Q1 2026 Nettoverlust 740 Mio USD (von 315 Mio), EPS minus 1,12 USD; mit 8,5 Mrd USD DDTL 4.0 aehnelt die Bilanz GPU besicherter Projektfinanzierung.
- Kunden Konzentration: OpenAI, Meta, Anthropic und Microsoft dominieren den Wert; jeder einzelne koennte den Backlog daempfen.
- GPU Abschreibung und Strom: GB200 und Vera Rubin verkuerzen die Nutzungsdauer aelterer Chips; acht GW bis 2030 erfordern jaehrlich ein GW neue Leistung, Energiezulassung und Trafos sind die wichtigsten US Engpaesse.
8. Mac VPS plus GPU Cloud: der hybride Sweet Spot
Die praktische Lehre fuer vpsmac.com Leser ist, Mac VPS und GPU Cloud als Steuerebene und Rechenebene zu betrachten, nicht als Konkurrenten. Ein Mac VPS ist konkurrenzlos fuer native iOS und macOS Toolchains, launchd 7x24 Daemons und Apple Agenten (siehe Onsite Beitrag Playwright skill-browser Deployment und v2026.5.20 Upgrade Runbook). GPU Clouds dominieren H100, H200 und GB200 Trainings SLAs.
Einen IM Kanal und eine iOS Signierungs Pipeline auf einem Linux Spot GPU Knoten oder einer Windows Workstation am Leben zu halten ist eine verlockende Abkuerzung mit drei harten Grenzen: Linux Container koennen Xcode und notarytool nicht nativ ausfuehren, daher umgeht die Signierungskette die Virtualisierung und die Stabilitaet leidet langfristig spuerbar; OpenClaw, launchd und Cron in stundenweise abgerechnete GPU Knoten zu mischen laesst die Rechnung mit der Auslastung schwanken, und selbst einfache Mac Simulatoren laufen selten sauber; Apple Toolchains vertiefen ihre Abhaengigkeit von SSH Gewohnheiten, auditierbaren plists und Apple Silicon. Fuer Teams, die einen einzigen SSH Workflow fuer OpenClaw 7x24, iOS Signierung, IM Kanaele, Cron und Remote GPU Scheduling wollen, ist die Anmietung eines Apple Silicon Mac Cloud Servers von VPSMAC meist die bessere Antwort: die Steuerebene wird auf einer einzigen Betriebsoberflaeche konsolidiert und CoreWeave, Lambda oder RunPod uebernehmen die GPU Rechenleistung, sodass die Gesamtkosten unter dem Stapeln aller Aufgaben auf dem GPU Knoten liegen.
9. FAQ
Koennen CoreWeave Sandboxes mein Docker Cluster ersetzen? Sandboxes (allgemein verfuegbar am 14. Mai 2026) sind isolierte Laufzeiten fuer Reinforcement Learning, Agent Werkzeuge und Modellbewertung, in Ihrem CoreWeave Cluster oder serverlos ueber Weights and Biases. Einfache Webapps und iOS CI muessen nicht migrieren, Agent Bewertung und RL Schleifen bringen echten ROI.
Spot oder Flex Reservations? Flex Reservations sind unterbrechbare monatliche Reservierungen zwischen on demand und mehrjaehrig, ideal fuer Inferenz Baselines. Spot bietet 30 bis 40 Prozent Rabatt fuer Datenbereinigung, Batch Verarbeitung und neustartbares Training, geplant per launchd auf dem Mac VPS mit Spot freundlichem Checkpointing.
Verhaeltnis zu Stargate, Azure und AWS Trainium? Stargate ist OpenAIs Joint Venture Programm, nicht fuer den allgemeinen Verkauf. Azure bleibt OpenAIs primaere Cloud, aber ohne Exklusivitaet. AWS haelt die exklusive Drittanbieter Distribution fuer Frontier sowie Trainium Kapazitaet. CoreWeave ist der neutrale GPU Cluster Lieferant. Alle vier koexistieren 2026.
10. Fazit
Die KI Rechenleistungs Vermietung 2026 ist ein dreischichtiges Oekosystem aus Neoclouds, Hyperscalern und Steuerebene. CoreWeave hat die Neocloud Decke mit 99,4 Mrd USD Backlog, dual ClusterMAX Platinum und 9 von 10 Frontier Labs bewiesen. Doch der groesste Star ist nicht immer die beste Wahl: Training an Neoclouds, Experimente an Lambda oder RunPod und OpenClaw, launchd und iOS Signierung auf einem nativen Mac VPS von vpsmac.com belassen, um GPU Rechnungen zu stabilisieren und TCO zu senken.