View as:

Matrice use cases × architectures compute — programme MaQI

Pour le point tech jeudi 7 mai. Livrable d'arbitrage compute. Croise 5 use cases concrets indexés sur les données réellement chargées sur Wasabi avec 10 architectures candidates (5 all-in + 5 mixé Wasabi + compute externe). Pour chaque cellule : coût annuel approx, friction technique, lock-in, souveraineté, contraintes spéciales.

Source canonique des tarifs : vendors.yaml + fiches fournisseurs docs/compute/{nebius,ovh,scaleway,s3ns,gcp,aws,azure}.md. Source canonique des volumes : ../wasabi/state.md. Doctrine egress : cost-model.md.


1. Use cases (UC)

Cinq workloads indexés sur les buckets Wasabi MaQI réels (état 2026-04-14, total \(\approx\) 5,7 TiB sur 6 buckets).

UC-01 — TP étudiant Databento NASDAQ ITCH (léger)

UC-02 — TP étudiant S&P Compustat × RavenPack (factor model joint)

UC-03 — Backtest cross-asset 1 an multi-frequency (lourd)

UC-04 — Training GPU recherche (sentiment fine-tune)

UC-05 — Hackathon agentique (LLM + données marché)


2. Architectures candidates

Dix architectures sur deux familles structurelles : all-in (storage et compute chez le même fournisseur — l'ingestion vendor est routée directement vers le storage cible, pas de migration legacy depuis Wasabi) versus mixé (storage Wasabi eu-central-1 Frankfurt + compute externe).

IDPatternStorageCompute
A1All-in Nebius FINebius S3 (Mäntsälä)Nebius (CPU + GPU H100/H200/B200)
A2All-in OVH FROVH Object Storage (Gravelines / Roubaix)OVH Public Cloud (CPU + GPU)
A3All-in Scaleway FRScaleway Object Storage (PAR1/PAR2)Scaleway (CPU + GPU L4 / H100 PAR2)
A4All-in S3NS FRS3NS storage (FR, dérivé GCS)S3NS compute (GCP-derived, opéré Thales)
A5All-in GCPGCS (europe-west9 Paris ou eu-west4)GCP Compute Engine + Vertex
M1MixéWasabi (FRA)Nebius FI compute
M2MixéWasabi (FRA)OVH compute
M3MixéWasabi (FRA)Scaleway compute
M4MixéWasabi (FRA)GCP compute
M5MixéWasabi (FRA)Colab / GCP via crédits académiques (faculty + PhD)

Contrainte structurelle S3NS (A4) : le RDV 17/04 a verrouillé que S3NS ne permet pas de dissocier compute et storage (citations Véronique Poirson : « Tout est chez nous, tout est chez nous », « mes machines, elles doivent être SecNumCloud »). Le storage Wasabi n'est admis qu'en ingestion, pas en opérationnel. Conséquence : il n'existe pas d'architecture mixte M-S3NS ; seul A4 est techniquement réalisable côté S3NS.


3. Hypothèses de coût

Ordres de grandeur pour comparer, pas un budget figé. À refixer au moment de l'engagement contractuel.

3.1 Coûts compute annuels par architecture (rolled-up sur les 5 UC)

Volumes annuels intégrés sur les 5 UC :

ArchiTarif CPU effectifTarif GPU effectifCompute total/an
A1 / M1 — Nebius~$0,40/h CPU bundle\(2,95/h H100 (PAR avec commit ~\)2,00/h)~€875/an (520 \(\times\) $0,40 + 240 \(\times\) $2,95) \(\approx\) €825
A2 / M2 — OVH~€0,20/h B3-32 / R2-30~€2,50/h H100 (Public Cloud, à confirmer commercial)~€700/an
A3 / M3 — Scaleway€0,22/h PRO2-S (8c/32G) ou €0,32/h STANDARD3-X8C€0,75/h L4 (PAR1) ; H100 PAR2 non chiffré (à demander)~€340/an (sur L4) ; ~€800/an si H100 PAR2 \(\approx\) €3/h
A4 — S3NS~€0,30/h (GCP-derived n2-standard-8)~€3,00/h H100 (GCP-derived a3-highgpu)~€875/an + premium « confiance » (chiffrage promis post-RDV, pas reçu)
A5 / M4 — GCP~€0,30/h (n2-standard-8 europe-west)~€3,00/h H100 (a3-highgpu)~€875/an
M5 — Colab/GCP via crédits$0 (Colab Free, préemptif) ou $10/mo Procrédits research couvrent~€0–60/an côté factu MaQI ; capacité GPU non garantie

3.2 Coûts egress

ArchiEgress \(storage\leftrightarrow{}compute\)Egress sortant (downloads étudiants)
A1, A2, A3 (all-in EU)0 € (intra-provider)0 € (bande passante incluse pour les trois)
A4 (all-in S3NS)0 € intra-provider, mais egress sortant GCP-like si réseau hérité (~\(0,08–\)0,12/GB) — à clarifier post-RDV~€600/an au volume MaQI 8 TB
A5 (all-in GCP)0 € intra-region~$0,08/GB sortant Internet \(\approx\) €600/an sur 8 TB
M1, M2, M3 (mixé bandwidth-included)0 € côté Wasabi (free egress sous régime « \(\leq\) \(1\times\) volume stocké ») + 0 € côté provider compute (incluse)0 €
M4 (Wasabi storage + GCP compute)0 € côté Wasabi (read), $0,08/GB côté GCP sur writes back vers Wasabi~€600/an au volume MaQI
M5 (Wasabi + Colab/GCP credits)identique M4 mais absorbé par credits faculty $5K + PhD $1Kabsorbé par credits

3.3 Coûts storage annuels (5,7 TiB)

StockageTarifCoût annuel 5,7 TiB
Wasabi eu-central-1 (situation actuelle)$6,99/TB/mois \((\approx\) €6,50/TB/mois)\(\approx\) €445/an
Nebius Object Storage FI~\(0,018/GB/mois ≈ ~\)18/TB/mois\(\approx\) €1 200/an
OVH Object Storage S3 standard~€7,80/TB/mois (€0,0078/GB/mois)\(\approx\) €530/an
Scaleway Object Storage Multi-AZ Standard~€12,00/TB/mois (€0,012/GB/mois)\(\approx\) €820/an
S3NS storage (GCS-derived France)~€20/TB/mois (GCS Standard EU + premium)\(\approx\) €1 400/an
GCS Standard europe-west9 Paris~€20/TB/mois\(\approx\) €1 400/an

3.4 Construction de la couche storage — pas de coût de migration

Le programme se construit from scratch : il n'y a pas de système legacy à migrer. Les données viennent des fournisseurs (S&P Global, Databento, RavenPack, GDELT, CausalityLink) et l'ingestion peut être routée directement vers le storage cible — Wasabi aujourd'hui, ou un autre storage demain. Le « coût de migration » qui apparaît parfois dans les arbitrages cloud (legacy \(\to\) nouveau provider) ne s'applique pas ici.

Ce qui compte effectivement quand on bascule de Wasabi vers all-in :


4. Matrice UC × architecture

Légende :

4.1 UC-01 — TP Databento ITCH (léger, 50 CPU-h/an)

ArchiCoût/anFrictionLock-inSouvNotes
A1 Nebius all-in~€20 + storage €1 200L (intra-Mäntsälä)ÉEU⚠ re-route ingestion
A2 OVH all-in~€10 + storage €530L (intra-OVH)ÉFR⚠ re-route ingestion
A3 Scaleway all-in~€11 + storage €820L (intra-Scaleway)ÉFR⚠ re-route ingestion
A4 S3NS all-in~€15 + storage €1 400L (intra-S3NS)ÉFR (SecNumCloud 3.2)⚠ re-route ingestion + chiffrage absent
A5 GCP all-in~€15 + storage €1 400L (intra-europe-west9)ÉUS⚠ re-route ingestion
M1 Wasabi+Nebius~€20M (FI \(\leftrightarrow\) FRA, ~40–60 ms RTT)FEUbon trade-off compute
M2 Wasabi+OVH~€10M (SBG/GRA \(\leftrightarrow\) FRA, ~5–15 ms)FFR✅ moins cher + souverain FR
M3 Wasabi+Scaleway~€11M (PAR1 \(\leftrightarrow\) FRA, ~10–20 ms via DE-CIX, à mesurer)FFR✅ alternative FR
M4 Wasabi+GCP~€15 + ~€10 egressM (europe-west9 \(\leftrightarrow\) FRA)FUSegress write-back facturé
M5 Wasabi+Colab/credits~€0 (Colab Free / Pro $10/mo)M (préemptif)FUS⚠ session Colab préemptive, pas garantie

Recommandation UC-01 : M2 (Wasabi + OVH) ou M5 (Colab + Wasabi). Critère de bascule : « est-ce que les TP doivent tourner sur une infra contrôlée par MaQI (M2) ou est-ce qu'on accepte la préemption Colab contre l'expérience étudiant familière (M5) ? »

4.2 UC-02 — TP Compustat × RavenPack (moyen, 100 CPU-h/an)

ArchiCoût/anFrictionLock-inSouvNotes
A1 Nebius all-in~€40 + storage €1 200LÉEU⚠ re-route ingestion
A2 OVH all-in~€20 + storage €530LÉFR⚠ re-route ingestion
A3 Scaleway all-in~€32 + storage €820LÉFR⚠ re-route ingestion
A4 S3NS all-in~€30 + storage €1 400LÉFR (SecNumCloud)⚠ re-route ingestion + GPU SKUs à confirmer
A5 GCP all-in~€30 + storage €1 400LÉUS⚠ re-route ingestion
M1 Wasabi+Nebius~€40MFEUviable ; throughput RavenPack à valider
M2 Wasabi+OVH~€20L–M (intra-EU court)FFR✅ favori coût + souveraineté
M3 Wasabi+Scaleway~€32MFFR✅ alternative FR
M4 Wasabi+GCP~€30 + ~€20 egressL–MFUSegress sur écritures notebook
M5 Wasabi+Colab/credits~€0–10M (préemptif)FUSRAM Colab Pro 50 GB \(\to\) limite UC-02

Recommandation UC-02 : M2 (Wasabi + OVH) ou M3 (Wasabi + Scaleway). Critère de bascule : « faut-il l'AI Notebooks d'OVH pour la commodité Jupyter managée (M2), ou les credits academic potentiels Scaleway via mise en concurrence (M3) ? ». Colab Pro reste limite côté RAM pour factor model joint multi-trimestres.

4.3 UC-03 — Backtest cross-asset 1 an (lourd, 240 CPU-h/an)

ArchiCoût/anFrictionLock-inSouvNotes
A1 Nebius all-in~€100 + storage €1 200LÉEU⚠ re-route ingestion
A2 OVH all-in~€50 + storage €530LÉFR⚠ re-route ingestion
A3 Scaleway all-in~€80 + storage €820LÉFR⚠ re-route ingestion
A4 S3NS all-in~€75 + storage €1 400LÉFR (SecNumCloud)⚠ re-route ingestion + chiffrage
A5 GCP all-in~€75 + storage €1 400LÉUS⚠ re-route ingestion
M1 Wasabi+Nebius~€100 + 0 € egressM (40–60 ms ; throughput ~50–80 MB/s estimé)FEU⚠ 500 GB read par run = ~2–3 h juste à streamer
M2 Wasabi+OVH~€50L–M (Frankfurt OVH proche Wasabi FRA)FFR✅ meilleur ratio prix/latence
M3 Wasabi+Scaleway~€80M (PAR1 \(\leftrightarrow\) FRA via DE-CIX)FFR⚠ throughput \(PAR1\leftrightarrow{}Wasabi\) à mesurer
M4 Wasabi+GCP~€75 + ~€60 egressMFUSegress sur write-back results
M5 Wasabi+Colab/credits~€0–60M (sessions préemptives 12 h max)FUS⚠ inadapté UC-03 (sessions Colab plafonnées 12 h)

**Recommandation UC-03 : M2 (Wasabi + OVH région DE/FR) ou M1 (Wasabi

4.4 UC-04 — Training GPU sentiment fine-tune (240 GPU-h/an)

ArchiCoût/anFrictionLock-inSouvNotes
A1 Nebius all-in (H100)~€700 + storage €1 200LÉEU⚠ re-route ingestion ; H100 $2,95/h ; commit -35% possible
A2 OVH all-in (H100)~€600 + storage €530LÉFR⚠ re-route ingestion ; H100 OVH dispo, prix à figer commercial
A3 Scaleway all-in (L4 PAR1)~€180 (sur L4) ou ~€720 (sur H100 PAR2) + storage €820LÉFR⚠ re-route ingestion ; H100 PAR2 chiffrage commercial absent
A4 S3NS all-in (H100)~€720 + storage €1 400LÉFR (SecNumCloud)⚠ re-route ingestion ; SKUs GPU H100/A100 hérités GCP, file d'attente non discutée
A5 GCP all-in (H100)~€720 + storage €1 400LÉUS⚠ re-route ingestion ; quotas a3 sensibles
M1 Wasabi+Nebius (H100)~€700 + 0 € egressM (FI \(\leftrightarrow\) FRA pour read 300 GB initial — ~1 h streaming)FEU✅ favori GPU + souveraineté EU
M2 Wasabi+OVH (H100)~€600 + 0 € egressL–MFFR✅ favori si OVH H100 dispo + tarif compétitif (à confirmer)
M3 Wasabi+Scaleway (L4)~€180 + 0 € egressMFFRviable pour 4 \(\times\) L4 = 24 h vs 8 h H100 ; tradeoff temps/coût
M4 Wasabi+GCP (H100)~€720 + ~€10 egress (writes checkpoints petits)L–MFUSegress dominé par writes checkpoints (~10 GB) ; négligeable
M5 Wasabi+Colab/credits~€0–60 (credits absorbent)M (sessions préemptives, A100/H100 non garanti Pro)FUS⚠ inadapté training >8 h continu

Recommandation UC-04 : M1 (Wasabi + Nebius H100) ou M2 (Wasabi + OVH H100). Critère de bascule : « si OVH H100 chiffré \(\leq\) €2,80/h GPU, M2 gagne pour la souveraineté FR ; sinon M1 pour la grille tarif publique stable de Nebius ($2,95/h, -35% sur commit) ». M5 inadapté (Colab Pro ne garantit pas H100, sessions préemptives 12 h plafonnées).

4.5 UC-05 — Hackathon agentique (130 CPU-h/an + tokens API)

ArchiCoût/anFrictionLock-inSouvNotes
A1 Nebius all-in~€55 + storage €1 200LÉEU⚠ disproportionné pour hackathon ponctuel
A2 OVH all-in~€26 + storage €530LÉFR⚠ disproportionné pour hackathon
A3 Scaleway all-in~€42 + storage €820LÉFR⚠ disproportionné pour hackathon
A4 S3NS all-in~€40 + storage €1 400LÉFR (SecNumCloud 3.2)✅ angle partenariat S3NS — hébergement Paris 9e proposé en RDV 17/04, « encadrer ça avec nos architectes sans souci » (Émilie Daelman)
A5 GCP all-in~€40 + storage €1 400LÉUS⚠ disproportionné pour hackathon
M1 Wasabi+Nebius~€55 + tokensMFEUviable ; tokens via APIs externes
M2 Wasabi+OVH~€26 + tokensL–MFFRviable + souverain
M3 Wasabi+Scaleway~€42 + tokensMFFR✅ Scaleway propose des LLM managés (Mistral) — angle bundle
M4 Wasabi+GCP~€40 + tokens (Gemini natif)L–MFUS✅ tokens Gemini natif si l'arène l'exige
M5 Wasabi+Colab/credits~€0 (credits + Colab)MFUS✅ favori coût zéro ; Vertex AI / Gemini accès facile

Recommandation UC-05 : A4 (S3NS all-in pour le signal partenariat) ou M5 (Wasabi + Colab/credits pour le coût zéro). Critère de bascule : « le hackathon est-il un livrable du partenariat S3NS (donnant-donnant 17/04) \(\to\) A4 ; ou un événement organisé en autonomie avec budget zéro \(\to\) M5 ». UC-05 est le seul UC où A4 est techniquement défendable : le volume de données est marginal, donc le coût caché de migration storage 5,7 TiB ne s'applique pas (on ouvre un bucket éphémère hackathon-only).


4bis. Opposabilité juridique — CLOUD Act et Data Act 2027

Le ranking technique-pédagogique se double d'un ranking d'opposabilité juridique. Synthèse en deux dimensions par architecture, à croiser avec les coûts ci-dessus pour décider .

4bis.1 Exposition extra-européenne (CLOUD Act / FISA 702)

ArchiCôté storageCôté computeExposition globale
A1 Nebius all-inNebius (Pays-Bas, Nebius Group N.V.)Nebius FIHors scope CLOUD Act
A2 OVH all-inOVH SAS (FR)OVH FRHors scope CLOUD Act
A3 Scaleway all-inScaleway SAS (FR, groupe Iliad)Scaleway FRHors scope CLOUD Act
A4 S3NS all-inS3NS (Thales Cloud Sécurisé, FR)S3NS FRSecNumCloud 3.2 qualifié 19/12/2025 ; ANSSI : « offers protection against extra-European law »
A5 GCP all-inGCS (Google LLC, US)GCP europe-westPleinement soumis CLOUD Act + FISA 702
M1 Wasabi+NebiusWasabi US Inc. (eu-central-1)Nebius (hors)Storage soumis CLOUD Act ; mesures Schrems II requises
M2 Wasabi+OVHWasabi US Inc. (eu-central-1)OVH (hors)Idem M1
M3 Wasabi+ScalewayWasabi US Inc. (eu-central-1)Scaleway (hors)Idem M1
M4 Wasabi+GCPWasabi US Inc. (eu-central-1)GCP (US)Pleinement exposé sur les deux côtés
M5 Wasabi+Colab/creditsWasabi US Inc. (eu-central-1)GCP (US)Pleinement exposé sur les deux côtés

Lecture transverse : toute architecture mixée Wasabi-X reste exposée côté storage tant que Wasabi n'est pas remplacé par OVH Cold Archive qualifié ou par S3NS sur la couche storage. Mesures supplémentaires Schrems II (chiffrement clés FR + pseudonymisation) à documenter en TIA pour les transferts US.

4bis.2 Conformité Data Act EU 2023/2854 (12 janvier 2027)

Articles structurants à l'horizon 2027 — applicables à tout contrat signé après le 12 septembre 2025 :

Conséquence pratique : tout triptyque mixé Wasabi-X EU (M1/M2/M3) bénéficie immédiatement du zéro-egress côté compute (acquis contractuel) et mécaniquement du zéro switching cost au 12/01/2027 (Data Act). L'architecture all-in EU (A1/A2/A3) reste équivalente sur ce critère mais perd la flexibilité multi-fournisseur.

4bis.3 Recommandation transverse — clauses contractuelles à exiger

Pour les RFP S3NS, Scaleway, Nebius, OVH (et tout futur fournisseur), trois clauses minimales :

  1. Conformité Data Act art. 25 verbatim (contrat-type EU obligatoire pour tout service signé après 12/09/2025).
  2. Engagement art. 28 sur la transparence des requêtes gouvernementales tierces (notification, périmètre, défense).
  3. Mesures supplémentaires Schrems II documentées : chiffrement de bout en bout avec clés détenues côté MaQI / tiers de confiance FR ; pseudonymisation des données dérivées avant export US.

Source canonique des extraits : maqi-internal/docs/legal/sovereignty-corpus.md (corpus interne, sources primaires verbatim — accessible derrière magic-link sur la projection privée).


5. Synthèse — recommandations transverses

5.1 Règle de décision par défaut

Pour les UC-01 à UC-04 (workloads pédagogiques et recherche récurrents), la famille mixée Wasabi + compute externe domine la famille all-in sur trois critères structurels :

  1. Coût : storage Wasabi (~€445/an pour 5,7 TiB) reste \(1,2\times\) à \(3,2\times\) moins cher que les alternatives storage cloud souverain ou hyperscaler.
  2. Lock-in : la dissociation storage/compute permet de pivoter de provider compute en quelques jours sans toucher la donnée.
  3. Egress : la combinaison Wasabi (free egress sous régime \(\leq\) \(1\times\) volume stocké) + compute bandwidth-included (OVH / Scaleway / Nebius) ramène le coût réseau à 0 € sur l'usage MaQI.

Top choix par défaut : M2 (Wasabi + OVH) pour CPU et M1 (Wasabi + Nebius) pour GPU H100 lourd. Bascule M3 (Wasabi + Scaleway) si crédit académique négocié.

5.2 Place de S3NS

S3NS est techniquement positionné uniquement sur A4 (all-in SecNumCloud) par contrainte architecturale propre. Conséquences :

5.3 Place de GCP / Colab

5.4 ⚠ Coût caché de la migration storage all-in

À rappeler explicitement à l'arbitrage :

Migrer 5,7 TiB de Wasabi vers un storage all-in (A1–A5) coûte 0 € en facture egress (Wasabi free + ingress universal) mais représente 9–18 jours de transfert continu sur lien commercial (PoC home WiFi : ~25–47 Mbps), avec risque de cohérence sur les buckets sans checksum vendor (CausalityLink, RavenPack), et abandon de la doctrine zéro-egress Wasabi sur les flux futurs.

Mesures réelles (5 mai 2026) :

La migration n'est pas un non-événement : elle requiert un fenêtre opérationnelle dédiée + reprise + vérification.

5.5 Arbitrage pour jeudi 7 mai

Trois questions atomiques à porter au point tech :

  1. La souveraineté SecNumCloud est-elle un livrable pédagogique du Master ? Si oui, A4 (all-in S3NS) revient dans la course pour UC-01 à UC-04 — sous condition d'un chiffrage compétitif.
  2. L'option hackathon (UC-05) chez S3NS est-elle activée ? Si oui, A4 sur ce seul UC permet un partenariat sans imposer la migration des autres usages.
  3. Quel provider compute privilégier pour UC-01 à UC-04 ? Recommandation transverse : Wasabi storage + OVH compute (M2) par défaut, Nebius (M1) sur GPU H100 lourds, Scaleway (M3) en alternative FR si crédit académique négocié.

6. Questions ouvertes et inputs manquants


Sources