Compute landscape — MaQI
Pour Charles-Albert. Ce catalogue paire
docs/providers/catalog.yaml(côté données) avec son pendant exécution : où tournent les notebooks, où vivent les GPUs, qui facture qui.Source canonique :
vendors.yaml. Ce README est une projection humaine — en cas de divergence, le YAML fait foi.
Le problème à résoudre
Reformulation du doc CAL tech-solutions.md :
- Étudiants \((\approx\) 40) — VMs avec notebook (Colab-like), GPU/FPGA pour les projets LLM, interface habituelle = notebook.
- Chercheurs — temps long, peu de datasets, besoin de remonter des artefacts (notebooks, données nettoyées) vers une zone "cours".
- Contrainte licence — pas de redistribution. Tout accès aux données doit rester lecture seule (pas de download massif).
- Contrainte égress — les données vivent sur Wasabi
(
eu-central-1, Amsterdam, no egress fee côté Wasabi). Le coût réel devient celui du cloud de compute (lecture S3 vers le VM).
Cible architecturale (CAL) : un lecteur Athena-like server-less déployable chez plusieurs providers via Terraform, qui préserve les autorisations sans documenter.
Vue d'ensemble
flowchart TB
subgraph HYP["Hyperscalers"]
direction LR
gcp["GCP<br>Colab + Vertex"]
aws["AWS<br>SageMaker + Athena"]
az["Azure<br>ML Studio"]
end
subgraph EU["AI clouds EU"]
direction LR
neb["Nebius<br>GPU-first, NL"]
ovh["OVHcloud<br>AI Notebooks, FR"]
end
subgraph SOV["Sovereign EU (SecNumCloud)"]
direction LR
s3n["S3NS<br>Thales × GCP"]
end
subgraph MKT["Marketplaces GPU"]
direction LR
fs["FluidStack<br>SLURM / K8s"]
end
style HYP fill:#dfd,stroke:#0a0
style EU fill:#ffd,stroke:#cc0
style SOV fill:#fed,stroke:#c60
style MKT fill:#eef,stroke:#448
Catégories retenues
| Catégorie | Signification | Action par défaut |
|---|---|---|
hyperscaler | GCP / AWS / Azure — étendue maximale, credits académiques disponibles, Athena-like natif | Demander credits recherche avant tout PoC payant |
ai_cloud_eu | Opérateurs EU GPU-first (Nebius, OVHcloud) | Prioritaire pour souveraineté / RGPD |
sovereign_eu | Cloud de Confiance certifié SecNumCloud (S3NS) | Angle souveraineté fort, narratif Polytechnique cohérent |
gpu_marketplace | Agrégateurs multi-DC (FluidStack…) | Valider localisation GPU avant signature |
academic_partner | Accès institutionnel (DSI Polytechnique, Jean Zay, etc.) | Capter en complément, pas en pivot |
Statut opérationnel
Le même vocabulaire qu'ADR-002 :
operational_status | Sens |
|---|---|
not_started | Rien n'a été fait |
explored | Lu la doc, noté prix / SKUs / caveats |
validated | Compte créé, PoC tourné, reproductible |
in_negotiation | Contrat / credits en discussion |
quoted | Contact établi, RDV ou première proposition en cours |
blocked | Attend un tiers (CAL, vendor, légal) |
Vendors
Hyperscalers
| Vendor | Souveraineté | Notebook natif | Region EU la plus proche de Wasabi | Fiche |
|---|---|---|---|---|
| Google Cloud | US | Colab / Vertex Workbench | europe-west4 (Eemshaven, NL) | gcp.md |
| AWS | US | SageMaker Studio | eu-central-1 (Frankfurt — même région que Wasabi) | aws.md |
| Azure | US | Azure ML Studio | westeurope (Amsterdam) | azure.md |
AI clouds EU
| Vendor | Jurisdiction | Offre | Fiche |
|---|---|---|---|
| Nebius | NL | AI cloud GPU-first, Academy Program (credits universitaires) | nebius.md |
| OVHcloud | FR (Roubaix) | AI Notebooks managé, public pricing, compute européen historique | ovh.md |
Sovereign EU (SecNumCloud)
| Vendor | Jurisdiction | Offre | Fiche |
|---|---|---|---|
| S3NS | FR (Paris) — Thales \(\times\) Google Cloud | Hyperscaler-class SecNumCloud 3.2 (déc. 2025), infrastructure GCP opérée par Thales | s3ns.md |
GPU marketplace
| Vendor | Accès | Fiche |
|---|---|---|
| FluidStack | Clusters K8s / SLURM, NVIDIA Inception | fluidstack.md |
Axes de décision
- Coût réseau / egress — c'est le poste différenciant. Voir
cost-model.mdpour le détail par vendor et la projection S&P chiffrée. Dynamique de marché 2024-2027 : l'egress est en voie de gratuité sous pression Data Act UE ; les providers bandwidth-included (OVH, Nebius, Hetzner, Wasabi) ont anticipé, les hyperscalers US (GCP/AWS/Azure) attendent la deadline du 12 janvier 2027. Sur l'horizon MaQI 2026, le différentiel coûte ~€600+/an pour la charge étudiants+profs attendue. - Souveraineté / RGPD — priorité EU pour les données S&P Global (non-redistribution, licence académique). S3NS ajoute la certification SecNumCloud 3.2 (atout trust labélisé).
- Proximité Wasabi —
eu-central-1(Frankfurt) \(\Rightarrow\) AWS eu-central-1 et OVHcloud SBG colocalisés = lecture S3 bas coût/latence. - Notebook-first — Colab (GCP), AI Notebooks (OVH), SageMaker Studio (AWS) minimisent le setup pour 40 étudiants.
- Credits recherche — GCP $5K/chercheur, AWS rolling, Azure for Research. Nebius a un programme Academy explicite. OVH est contracté OCRE 2024 (framework européen recherche/éducation).
- Multi-provider via Terraform — cible CAL : une même pile (lecture S3 + notebook + GPU ponctuel) déployable sur \(\geq\) 2 clouds.
Aucune décision n'est prise ici : ce catalogue documente l'éventail. La décision fera l'objet d'une ADR dédiée quand les PoCs auront tranché.
Synthèse
Source canonique :
vendors.yaml— 7 entrées.
| Catégorie | Nombre | Observation |
|---|---|---|
hyperscaler | 3 | GCP / AWS / Azure — credits à capter |
ai_cloud_eu | 2 | Nebius / OVHcloud — priorité souveraineté |
sovereign_eu | 1 | S3NS (Thales \(\times\) GCP) — SecNumCloud 3.2, angle trust |
gpu_marketplace | 1 | FluidStack — à scruter pour bursts GPU |
Voir aussi
vendors.yaml— source machine-lisiblecost-model.md— structure de coût détaillée (qui facture l'egress et qui pas), projection S&P Global chiffrée../cal/tech-solutions.md— contraintes CAL (non-redistribution, S3, Athena-like)../providers/catalog.yaml— côté données, pendant de ce catalogue../wasabi/state.md— état des données sur Wasabi (régions, volumes)../adr/002-data-sources-cartography.md— format des fiches (squelette réutilisé ici)