2026 CoreWeave decode : la star de la location de calcul IA, 99,4 milliards de carnet, 3,5 GW de puissance contractee et une matrice de decision neocloud
En avril et mai 2026, CoreWeave (Nasdaq : CRWV) a publie un chiffre d affaires Q1 de 2,08 milliards de dollars et un carnet de 99,4 milliards, signe un contrat Meta de 21 milliards jusqu en decembre 2032 et un accord pluri-milliardaire avec Anthropic, et a ete sacre plus grande star de la location de calcul IA. Ce guide s adresse aux CTO qui choisissent un cloud GPU, aux lecteurs produit et investissement qui decodent le modele neocloud, et aux utilisateurs vpsmac.com qui veulent associer un Mac VPS et de la capacite GPU louee dans une pile hybride : quatre points de douleur, un tableau clients et prix, un runbook de selection en cinq etapes, trois piliers de risque et une FAQ se rejoignent dans une matrice de decision Mac VPS plus cloud GPU.
Sommaire
- 1. Points de douleur : capacite, prix, pieges de selection
- 2. Pourquoi CoreWeave est la plus grande star : quatre donnees
- 3. Roster client : OpenAI, Meta, Anthropic et 9 sur 10 labos
- 4. Matrice de decision : tableau prix H200 8 GPU
- 5. L avenant Microsoft OpenAI comme accelerateur
- 6. Runbook de selection en cinq etapes
- 7. Risques derriere les 99,4 milliards de carnet
- 8. Mac VPS plus cloud GPU : le sweet spot hybride
- 9. FAQ
- 10. Conclusion
1. Points de douleur : capacite, prix, pieges de selection
- Prix multiplies par 4,6: pour un H200 a la demande, les tarifs publics vont de 2,29 dollars de l heure chez Vast.ai a 10,60 dollars chez Azure. Un budget d un million d heures GPU peut varier de huit chiffres en dollars selon le fournisseur retenu.
- Capacite visible mais inaccessible: CoreWeave a declare 1 GW actif et 3,5 GW contractes au 31 mars 2026. Les SKU GB200 et HGX B300 des hyperscalers existent en ligne, mais duree, minimum de commande et file d attente sont durs pour les equipes moyennes.
- Mauvaise matrice entrainement et inference: l entrainement reclame des fabriques rack scale GB200 NVL72 et HGX B300, l inference exige elasticite et prix transparents. Le fournisseur optimal a chaque bout est rarement le meme en 2026.
- Plan de controle pris en otage par le GPU: faire tourner OpenClaw, launchd, signature iOS et canaux IM sur un H100 a 50 dollars de l heure etait un mode d echec cache de 2025 ; l utilisation GPU s effondre, la facture flambe.
2. Pourquoi CoreWeave est la plus grande star : quatre donnees
- Echelle financiere: chiffre d affaires Q1 2026 de 2,08 milliards (contre 981,8 millions), carnet de 99,4 milliards au 31 mars, guidance 2026 de 12 a 13 milliards, perspective 2027 de 30 a 35 milliards ; NVIDIA a souscrit 2 milliards de Class A.
- Puissance et capacite: 1 GW actif, plus de 3,5 GW contractes, objectif 8 GW en 2030 ; DDTL 4.0 de 8,5 milliards et credit de 3,1 milliards transforment le GPU en collateral standard.
- Profondeur NVIDIA: premiere vague NVIDIA Exemplar Cloud entrainement et inference GB200 NVL72 ; HGX B300 GA au GTC du 16 mars 2026, Vera Rubin NVL72 prevu second semestre 2026.
- Benchmarks independants: seul cloud IA Platinum dans ClusterMAX 1.0 et 2.0, top scores MLPerf et Artificial Analysis pour Moonshot Kimi K2.6.
3. Roster client : OpenAI, Meta, Anthropic et 9 sur 10 labos
Les 9 et 10 avril 2026, CoreWeave a annonce une extension Meta de 21 milliards jusqu en decembre 2032 puis, dans les 24 heures, un accord pluri-milliardaire avec Anthropic, ramenant 9 des 10 plus grands labos frontiere sur son cloud :
| Client | Valeur contrat | Duree | Charge principale |
|---|---|---|---|
| OpenAI | ~22,4 milliards | Pluriannuel | Entrainement et inference |
| Meta | 21 milliards | Jusqu en dec 2032 | Entrainement Llama 5, inference Meta AI |
| Anthropic | est. 4 a 7 milliards | Pluriannuel | Entrainement et inference Claude |
| Microsoft Azure | ~10 milliards (estime) | Pluriannuel | Debordement Azure, charges OpenAI |
| Total carnet | 66,8 (avril) a 99,4 milliards (Q1) | — | 9 labos sur 10 |
Le signal : CoreWeave n est plus une sauvegarde OpenAI mais le neocloud neutre sur lequel Microsoft, Meta, Anthropic, IBM, Cohere, Mistral, NVIDIA et Google Research parient simultanement. La neutralite est l attribut fournisseur le plus rare en 2026.
4. Matrice de decision : tableau prix H200 8 GPU
Le tableau ramene les prix publics de mai 2026 a une heure H200 unitaire (les SKU hyperscalers sont a 8 GPU, on divise donc l heure de noeud par 8) :
| Fournisseur | SKU | USD par H200 heure (a la demande) | Usage |
|---|---|---|---|
| Vast.ai | Marketplace | ~2,29 | Experiences dev, faible SLA |
| Lambda | 1 x H200 | 3,79 | Facturation a la minute |
| RunPod | 8 x H200 | 3,99 | Entrainement et inference conteneurises |
| AWS p5e.48xlarge | 8 x H200 141GB | 4,98 (1 jour mini) | Deja sur AWS |
| CoreWeave | 8 x H200 | 6,31 | Grands clusters, SLA prod |
| Oracle Cloud | BM.GPU.H200.8 | 10,00 | Conformite bare metal |
| Azure ND96isr | H200 v5 | 10,60 | Stack Microsoft entreprise |
Le H100 SXM suit la meme logique : Lambda 2,49, RunPod 2,69, Vast.ai 2,95, CoreWeave 3,12, hyperscalers 10 a 12 dollars par GPU heure. CoreWeave ne vend pas le GPU le moins cher mais le segment 40 a 60 pourcent sous les hyperscalers avec gros clusters reserves et SLA entrainement.
5. L avenant Microsoft OpenAI comme accelerateur
Le 26 avril 2026, Microsoft et OpenAI ont publie un accord modifie : suppression de la clause AGI, licence IP non exclusive jusqu en 2032, fin de l exclusivite Azure au profit de Azure d abord, tout cloud autorise. Amazon a engage jusqu a 38 milliards aupres d OpenAI et AWS est devenu distributeur tiers exclusif pour Frontier. Les charges passent d une boucle a deux fournisseurs a un maillage de neoclouds neutres et hyperscalers ; chaque equipe choisit parmi 5 a 8 fournisseurs au lieu de 1 ou 2.
6. Runbook de selection en cinq etapes
Etape 1 : classer. Quatre paniers : entrainement frontiere (GB200 NVL72 ou HGX B300), RL et fine tuning (H100 ou H200), inference (H100 ou L40S), build et controle (iOS, Agents, IM, Cron).
Etape 2 : duree. Plus de trois ans : CoreWeave, AWS Capacity Blocks ou Oracle bare metal. Moins de trois mois : Lambda, RunPod ou Vast.ai a la demande ou Spot. Plan de controle sur Mac VPS vpsmac.com.
Etape 3 : livre prix. Ajouter des lignes Spot 30 a 60 pourcent (CoreWeave HGX H100 Spot a 19,71 dollars par heure noeud) et reservations 25 pourcent pour 3 a 6 mois. Comparer le cout total GPU heure par charge.
Etape 4 : isoler. OpenClaw, webhooks IM, bastions SSH et Cron sur Mac VPS. Noeuds GPU : jobs API et object storage seulement. Pas de connexion IM longue duree sur un H200.
Etape 5 : sorties. H200 au-dessus de 7 dollars de l heure, disponibilite sous 99,5 pourcent, moins de 60 jours restants ou utilisation sous 35 pourcent declenchent une bascule fournisseur.
7. Risques derriere les 99,4 milliards de carnet
- Resultat: perte nette Q1 2026 de 740 millions (contre 315 millions), BPA ajuste -1,12 dollar ; DDTL 4.0 de 8,5 milliards rapproche le bilan d un financement adosse GPU.
- Concentration clients: OpenAI, Meta, Anthropic et Microsoft dominent la valeur publiee ; un retrait entamerait le carnet.
- GPU et puissance: GB200 et Vera Rubin raccourcissent la vie des silicon anciens ; 8 GW d ici 2030 demande 1 GW de puissance et transformateurs par an, et l autorisation energetique reste le principal goulot US.
8. Mac VPS plus cloud GPU : le sweet spot hybride
La lecon pratique est de traiter Mac VPS et cloud GPU comme un plan de controle et un plan de calcul, pas comme des concurrents. Un Mac VPS reste sans rival pour les chaines iOS et macOS natives, les daemons launchd 7 sur 24 et les agents Apple (voir deploiement Playwright skill-browser et le runbook v2026.5.20). Les clouds GPU dominent la courbe de cout des SLA H100, H200 et GB200. Maintenir un canal IM et un pipeline de signature iOS sur un noeud GPU Linux Spot ou un poste Windows reste un raccourci tentant : les conteneurs Linux ne lancent pas Xcode nativement, melanger OpenClaw, launchd et Cron a une facturation GPU horaire fait osciller la facture, et les chaines Apple se reposent toujours plus sur SSH, plists et Apple Silicon. Pour les equipes qui veulent un seul flux SSH pour piloter OpenClaw 7 sur 24, signature iOS, IM, Cron et planification GPU distante, louer un serveur Apple Silicon Mac cloud chez VPSMAC est generalement la meilleure reponse : on consolide le plan de controle et CoreWeave, Lambda ou RunPod gerent le GPU, TCO sous celui d une pile empilee sur le noeud GPU.
9. FAQ
CoreWeave Sandboxes peut-il remplacer mon cluster Docker ? Sandboxes (disponibilite 14 mai 2026) offrent des runtimes isoles pour reinforcement learning, outils d agent et evaluation de modeles, sur votre cluster CoreWeave ou en serverless via Weights and Biases. Les apps web et la CI iOS classique n ont pas a migrer, mais l evaluation d agents et les boucles RL apportent un vrai ROI.
Spot ou Flex Reservations ? Flex Reservations sont des reservations mensuelles interruptibles entre a la demande et pluriannuel, ideales pour les baselines d inference. Spot offre 30 a 40 pourcent de remise pour le nettoyage de donnees, les batchs et l entrainement redemarrable, planifie via launchd sur le Mac VPS avec checkpoint Spot friendly.
Lien avec Stargate, Azure et AWS Trainium ? Stargate est un programme infrastructure en coentreprise OpenAI, non commercialise. Azure reste le cloud principal d OpenAI mais sans exclusivite. AWS detient la distribution tierce exclusive de Frontier et la capacite Trainium. CoreWeave est le fournisseur GPU neutre. Les quatre coexistent en 2026.
10. Conclusion
La location de calcul IA 2026 est un ecosysteme a trois couches : neoclouds, hyperscalers et plan de controle. CoreWeave a prouve le plafond neocloud (99,4 milliards, dual ClusterMAX Platinum, 9 labos sur 10) ; l avenant Microsoft OpenAI elargit la route. Mais la plus grande star n est pas toujours le meilleur choix : trier les charges, entrainement vers neoclouds, inference vers Lambda ou RunPod, et garder OpenClaw, launchd et signature iOS sur un Mac VPS natif vpsmac.com.