Matrice use cases × architectures compute — programme MaQI
Pour le point tech jeudi 7 mai. Livrable d'arbitrage compute. Croise 5 use cases concrets indexés sur les données réellement chargées sur Wasabi avec 10 architectures candidates (5 all-in + 5 mixé Wasabi + compute externe). Pour chaque cellule : coût annuel approx, friction technique, lock-in, souveraineté, contraintes spéciales.
Source canonique des tarifs : vendors.yaml + fiches
fournisseurs docs/compute/{nebius,ovh,scaleway,s3ns,gcp,aws,azure}.md.
Source canonique des volumes : ../wasabi/state.md.
Doctrine egress : cost-model.md.
1. Use cases (UC)
Cinq workloads indexés sur les buckets Wasabi MaQI réels (état 2026-04-14, total \(\approx\) 5,7 TiB sur 6 buckets).
UC-01 — TP étudiant Databento NASDAQ ITCH (léger)
- Objectif pédagogique : décodage 1 jour MBP-10 + signal extraction simple en DuckDB.
- Données lues :
maqi-databento(1,43 TiB live), 1 fichierxnas-itch-YYYYMMDD.mbp-10.dbn.zst. - Volume read : ~5–50 GB selon la journée (lots
834CY4QERNtypiques ~50 MB compressés ;TUD5WDMULMmars 2025 = lot full-depth lourd). - Compute requis : 8 vCPU + 16 GB RAM, ~1 h par session étudiant.
- Cohorte : 25 étudiants \(\times\) 1–2 sessions/an \(\approx\) 50 compute-h/an.
- Outputs : ~1 GB/étudiant (notebook + figures).
UC-02 — TP étudiant S&P Compustat × RavenPack (factor model joint)
- Objectif pédagogique : factor model joint fundamentals + sentiment sur plusieurs trimestres.
- Données lues :
maqi-spglobal(3,75 TiB streaming attendus, dont Compustat Xpressfeed) +maqi-ravenpack(249 GiB, archives annuelles). - Volume read : ~10–50 GB (un sous-package Compustat + 1–2 années RavenPack).
- Compute requis : 16 vCPU + 64 GB RAM, ~2 h par session.
- Cohorte : 25 étudiants \(\times\) 2 sessions/an \(\approx\) 100 compute-h/an.
- Outputs : ~5 GB/étudiant.
UC-03 — Backtest cross-asset 1 an multi-frequency (lourd)
- Objectif pédagogique : 1 an cross Databento + Compustat + RavenPack, série temporelle multi-frequency.
- Données lues : 3 buckets joints, ~100–500 GB selon la fenêtre.
- Compute requis : 32 vCPU + 128 GB RAM, 6–12 h par run.
- Cohorte : 5 PhD \(\times\) 4–8 runs/an \(\approx\) 240 compute-h/an.
- Outputs : ~10 GB par run (résultats backtest + métriques).
UC-04 — Training GPU recherche (sentiment fine-tune)
- Objectif recherche : fine-tune sentiment model sur RavenPack history (12 ans) + Transcripts S&P.
- Données lues :
maqi-ravenpack(249 GiB) + sous-pack Transcripts S&P, ~100–300 GB. - Compute requis : 1 \(\times\) H100 (~8 h par run) ou 4 \(\times\) L4 (~24 h par run).
- Cohorte : 3 chercheurs \(\times\) 10 runs/an \(\approx\) 240 GPU-h/an (H100) ou 720 GPU-h/an (L4).
- Outputs : ~10 GB checkpoints + logs.
UC-05 — Hackathon agentique (LLM + données marché)
- Objectif pédagogique : agents LLM + données marché. Cf. discussion S3NS du 17/04 (idée de hackathon Paris janvier 2027, possibilité d'hébergement par S3NS).
- Données lues : marginal (~1–10 GB échantillonné par équipe).
- Compute requis : léger côté CPU (~8 vCPU + 16 GB), tokens API dominants (Gemini, Mistral, Cohere selon disponibilité).
- Cohorte : 8 équipes \(\times\) 2 jours \(\times\) 8 h \(\approx\) 130 compute-h. Tokens ~5–10 M tokens/équipe.
2. Architectures candidates
Dix architectures sur deux familles structurelles : all-in (storage
et compute chez le même fournisseur — l'ingestion vendor est routée
directement vers le storage cible, pas de migration legacy depuis
Wasabi) versus mixé (storage Wasabi eu-central-1 Frankfurt + compute
externe).
| ID | Pattern | Storage | Compute |
|---|---|---|---|
| A1 | All-in Nebius FI | Nebius S3 (Mäntsälä) | Nebius (CPU + GPU H100/H200/B200) |
| A2 | All-in OVH FR | OVH Object Storage (Gravelines / Roubaix) | OVH Public Cloud (CPU + GPU) |
| A3 | All-in Scaleway FR | Scaleway Object Storage (PAR1/PAR2) | Scaleway (CPU + GPU L4 / H100 PAR2) |
| A4 | All-in S3NS FR | S3NS storage (FR, dérivé GCS) | S3NS compute (GCP-derived, opéré Thales) |
| A5 | All-in GCP | GCS (europe-west9 Paris ou eu-west4) | GCP Compute Engine + Vertex |
| M1 | Mixé | Wasabi (FRA) | Nebius FI compute |
| M2 | Mixé | Wasabi (FRA) | OVH compute |
| M3 | Mixé | Wasabi (FRA) | Scaleway compute |
| M4 | Mixé | Wasabi (FRA) | GCP compute |
| M5 | Mixé | Wasabi (FRA) | Colab / GCP via crédits académiques (faculty + PhD) |
Contrainte structurelle S3NS (A4) : le RDV 17/04 a verrouillé que S3NS ne permet pas de dissocier compute et storage (citations Véronique Poirson : « Tout est chez nous, tout est chez nous », « mes machines, elles doivent être SecNumCloud »). Le storage Wasabi n'est admis qu'en ingestion, pas en opérationnel. Conséquence : il n'existe pas d'architecture mixte M-S3NS ; seul A4 est techniquement réalisable côté S3NS.
3. Hypothèses de coût
Ordres de grandeur pour comparer, pas un budget figé. À refixer au moment de l'engagement contractuel.
3.1 Coûts compute annuels par architecture (rolled-up sur les 5 UC)
Volumes annuels intégrés sur les 5 UC :
- CPU-h : 50 (UC-01) + 100 (UC-02) + 240 (UC-03) + 130 (UC-05) \(\approx\) 520 CPU-h/an.
- GPU-h : 240 (UC-04 sur H100) ou 720 (UC-04 sur 4 \(\times\) L4).
| Archi | Tarif CPU effectif | Tarif GPU effectif | Compute total/an |
|---|---|---|---|
| A1 / M1 — Nebius | ~$0,40/h CPU bundle | \(2,95/h H100 (PAR avec commit ~\)2,00/h) | ~€875/an (520 \(\times\) $0,40 + 240 \(\times\) $2,95) \(\approx\) €825 |
| A2 / M2 — OVH | ~€0,20/h B3-32 / R2-30 | ~€2,50/h H100 (Public Cloud, à confirmer commercial) | ~€700/an |
| A3 / M3 — Scaleway | €0,22/h PRO2-S (8c/32G) ou €0,32/h STANDARD3-X8C | €0,75/h L4 (PAR1) ; H100 PAR2 non chiffré (à demander) | ~€340/an (sur L4) ; ~€800/an si H100 PAR2 \(\approx\) €3/h |
| A4 — S3NS | ~€0,30/h (GCP-derived n2-standard-8) | ~€3,00/h H100 (GCP-derived a3-highgpu) | ~€875/an + premium « confiance » (chiffrage promis post-RDV, pas reçu) |
| A5 / M4 — GCP | ~€0,30/h (n2-standard-8 europe-west) | ~€3,00/h H100 (a3-highgpu) | ~€875/an |
| M5 — Colab/GCP via crédits | $0 (Colab Free, préemptif) ou $10/mo Pro | crédits research couvrent | ~€0–60/an côté factu MaQI ; capacité GPU non garantie |
3.2 Coûts egress
| Archi | Egress \(storage\leftrightarrow{}compute\) | Egress sortant (downloads étudiants) |
|---|---|---|
| A1, A2, A3 (all-in EU) | 0 € (intra-provider) | 0 € (bande passante incluse pour les trois) |
| A4 (all-in S3NS) | 0 € intra-provider, mais egress sortant GCP-like si réseau hérité (~\(0,08–\)0,12/GB) — à clarifier post-RDV | ~€600/an au volume MaQI 8 TB |
| A5 (all-in GCP) | 0 € intra-region | ~$0,08/GB sortant Internet \(\approx\) €600/an sur 8 TB |
| M1, M2, M3 (mixé bandwidth-included) | 0 € côté Wasabi (free egress sous régime « \(\leq\) \(1\times\) volume stocké ») + 0 € côté provider compute (incluse) | 0 € |
| M4 (Wasabi storage + GCP compute) | 0 € côté Wasabi (read), $0,08/GB côté GCP sur writes back vers Wasabi | ~€600/an au volume MaQI |
| M5 (Wasabi + Colab/GCP credits) | identique M4 mais absorbé par credits faculty $5K + PhD $1K | absorbé par credits |
3.3 Coûts storage annuels (5,7 TiB)
| Stockage | Tarif | Coût annuel 5,7 TiB |
|---|---|---|
Wasabi eu-central-1 (situation actuelle) | $6,99/TB/mois \((\approx\) €6,50/TB/mois) | \(\approx\) €445/an |
| Nebius Object Storage FI | ~\(0,018/GB/mois ≈ ~\)18/TB/mois | \(\approx\) €1 200/an |
| OVH Object Storage S3 standard | ~€7,80/TB/mois (€0,0078/GB/mois) | \(\approx\) €530/an |
| Scaleway Object Storage Multi-AZ Standard | ~€12,00/TB/mois (€0,012/GB/mois) | \(\approx\) €820/an |
| S3NS storage (GCS-derived France) | ~€20/TB/mois (GCS Standard EU + premium) | \(\approx\) €1 400/an |
GCS Standard europe-west9 Paris | ~€20/TB/mois | \(\approx\) €1 400/an |
3.4 Construction de la couche storage — pas de coût de migration
Le programme se construit from scratch : il n'y a pas de système legacy à migrer. Les données viennent des fournisseurs (S&P Global, Databento, RavenPack, GDELT, CausalityLink) et l'ingestion peut être routée directement vers le storage cible — Wasabi aujourd'hui, ou un autre storage demain. Le « coût de migration » qui apparaît parfois dans les arbitrages cloud (legacy \(\to\) nouveau provider) ne s'applique pas ici.
Ce qui compte effectivement quand on bascule de Wasabi vers all-in :
- Re-route de l'ingestion vendor : reconfigurer les pipelines ETL pour pointer vers le nouveau storage. Coût opérateur \(\approx\) 0,5–1 ETP \(\times\) 2 j selon le nombre de pipelines actifs (Databento + S&P + RavenPack). Pas de transfert de données de Wasabi vers la cible — on re-ingère.
- Continuité d'accès aux données déjà sur Wasabi : pendant la période de bascule, soit on accepte une rupture (ré-télécharger les buckets vendor depuis archives), soit on synchronise les buckets clean déjà constitués (5,7 TiB cumulés, \(\approx\) 13 h sur lien fibré 1 Gbps \(DC\leftrightarrow{}DC\), négligeable en coût €). C'est plutôt un coût de fenêtre opérationnelle (1 ETP \(\times\) 2 j de pilotage) que de bande passante.
- Coût récurrent post-bascule : différentiel storage par rapport à Wasabi, calculé en §3.3. Ex. A2 (OVH) : +€150/an ; A1 (Nebius) : +€820/an ; A4 (S3NS) ou A5 (GCS) : +€1 020/an. C'est ce différentiel qui pèse sur la décision, pas une migration fictive.
4. Matrice UC × architecture
Légende :
- Coût/an : compute + egress, hors storage (le storage est constant par architecture, voir §3.3).
- Friction : H = haute (latence cross-Internet pour gros reads), M = moyenne (Internet public mesuré ~5–20 ms RTT intra-EU), L = basse (intra-region).
- Lock-in : F = faible (data + compute découplés), M = moyen (un service propriétaire engagé), É = élevé (storage + compute liés).
- Souveraineté : FR / EU / US.
- ⚠ : contrainte spéciale — voir note en bas de cellule.
4.1 UC-01 — TP Databento ITCH (léger, 50 CPU-h/an)
| Archi | Coût/an | Friction | Lock-in | Souv | Notes |
|---|---|---|---|---|---|
| A1 Nebius all-in | ~€20 + storage €1 200 | L (intra-Mäntsälä) | É | EU | ⚠ re-route ingestion |
| A2 OVH all-in | ~€10 + storage €530 | L (intra-OVH) | É | FR | ⚠ re-route ingestion |
| A3 Scaleway all-in | ~€11 + storage €820 | L (intra-Scaleway) | É | FR | ⚠ re-route ingestion |
| A4 S3NS all-in | ~€15 + storage €1 400 | L (intra-S3NS) | É | FR (SecNumCloud 3.2) | ⚠ re-route ingestion + chiffrage absent |
| A5 GCP all-in | ~€15 + storage €1 400 | L (intra-europe-west9) | É | US | ⚠ re-route ingestion |
| M1 Wasabi+Nebius | ~€20 | M (FI \(\leftrightarrow\) FRA, ~40–60 ms RTT) | F | EU | bon trade-off compute |
| M2 Wasabi+OVH | ~€10 | M (SBG/GRA \(\leftrightarrow\) FRA, ~5–15 ms) | F | FR | ✅ moins cher + souverain FR |
| M3 Wasabi+Scaleway | ~€11 | M (PAR1 \(\leftrightarrow\) FRA, ~10–20 ms via DE-CIX, à mesurer) | F | FR | ✅ alternative FR |
| M4 Wasabi+GCP | ~€15 + ~€10 egress | M (europe-west9 \(\leftrightarrow\) FRA) | F | US | egress write-back facturé |
| M5 Wasabi+Colab/credits | ~€0 (Colab Free / Pro $10/mo) | M (préemptif) | F | US | ⚠ session Colab préemptive, pas garantie |
Recommandation UC-01 : M2 (Wasabi + OVH) ou M5 (Colab + Wasabi). Critère de bascule : « est-ce que les TP doivent tourner sur une infra contrôlée par MaQI (M2) ou est-ce qu'on accepte la préemption Colab contre l'expérience étudiant familière (M5) ? »
4.2 UC-02 — TP Compustat × RavenPack (moyen, 100 CPU-h/an)
| Archi | Coût/an | Friction | Lock-in | Souv | Notes |
|---|---|---|---|---|---|
| A1 Nebius all-in | ~€40 + storage €1 200 | L | É | EU | ⚠ re-route ingestion |
| A2 OVH all-in | ~€20 + storage €530 | L | É | FR | ⚠ re-route ingestion |
| A3 Scaleway all-in | ~€32 + storage €820 | L | É | FR | ⚠ re-route ingestion |
| A4 S3NS all-in | ~€30 + storage €1 400 | L | É | FR (SecNumCloud) | ⚠ re-route ingestion + GPU SKUs à confirmer |
| A5 GCP all-in | ~€30 + storage €1 400 | L | É | US | ⚠ re-route ingestion |
| M1 Wasabi+Nebius | ~€40 | M | F | EU | viable ; throughput RavenPack à valider |
| M2 Wasabi+OVH | ~€20 | L–M (intra-EU court) | F | FR | ✅ favori coût + souveraineté |
| M3 Wasabi+Scaleway | ~€32 | M | F | FR | ✅ alternative FR |
| M4 Wasabi+GCP | ~€30 + ~€20 egress | L–M | F | US | egress sur écritures notebook |
| M5 Wasabi+Colab/credits | ~€0–10 | M (préemptif) | F | US | RAM Colab Pro 50 GB \(\to\) limite UC-02 |
Recommandation UC-02 : M2 (Wasabi + OVH) ou M3 (Wasabi + Scaleway). Critère de bascule : « faut-il l'AI Notebooks d'OVH pour la commodité Jupyter managée (M2), ou les credits academic potentiels Scaleway via mise en concurrence (M3) ? ». Colab Pro reste limite côté RAM pour factor model joint multi-trimestres.
4.3 UC-03 — Backtest cross-asset 1 an (lourd, 240 CPU-h/an)
| Archi | Coût/an | Friction | Lock-in | Souv | Notes |
|---|---|---|---|---|---|
| A1 Nebius all-in | ~€100 + storage €1 200 | L | É | EU | ⚠ re-route ingestion |
| A2 OVH all-in | ~€50 + storage €530 | L | É | FR | ⚠ re-route ingestion |
| A3 Scaleway all-in | ~€80 + storage €820 | L | É | FR | ⚠ re-route ingestion |
| A4 S3NS all-in | ~€75 + storage €1 400 | L | É | FR (SecNumCloud) | ⚠ re-route ingestion + chiffrage |
| A5 GCP all-in | ~€75 + storage €1 400 | L | É | US | ⚠ re-route ingestion |
| M1 Wasabi+Nebius | ~€100 + 0 € egress | M (40–60 ms ; throughput ~50–80 MB/s estimé) | F | EU | ⚠ 500 GB read par run = ~2–3 h juste à streamer |
| M2 Wasabi+OVH | ~€50 | L–M (Frankfurt OVH proche Wasabi FRA) | F | FR | ✅ meilleur ratio prix/latence |
| M3 Wasabi+Scaleway | ~€80 | M (PAR1 \(\leftrightarrow\) FRA via DE-CIX) | F | FR | ⚠ throughput \(PAR1\leftrightarrow{}Wasabi\) à mesurer |
| M4 Wasabi+GCP | ~€75 + ~€60 egress | M | F | US | egress sur write-back results |
| M5 Wasabi+Colab/credits | ~€0–60 | M (sessions préemptives 12 h max) | F | US | ⚠ inadapté UC-03 (sessions Colab plafonnées 12 h) |
**Recommandation UC-03 : M2 (Wasabi + OVH région DE/FR) ou M1 (Wasabi
- Nebius FI)**. Critère de bascule : « si throughput \(Wasabi\leftrightarrow{}OVH\) mesuré \(\geq\) 100 MB/s, M2 gagne ; sinon M1 (Nebius FI plus loin mais infra dimensionnée throughput) ».
4.4 UC-04 — Training GPU sentiment fine-tune (240 GPU-h/an)
| Archi | Coût/an | Friction | Lock-in | Souv | Notes |
|---|---|---|---|---|---|
| A1 Nebius all-in (H100) | ~€700 + storage €1 200 | L | É | EU | ⚠ re-route ingestion ; H100 $2,95/h ; commit -35% possible |
| A2 OVH all-in (H100) | ~€600 + storage €530 | L | É | FR | ⚠ re-route ingestion ; H100 OVH dispo, prix à figer commercial |
| A3 Scaleway all-in (L4 PAR1) | ~€180 (sur L4) ou ~€720 (sur H100 PAR2) + storage €820 | L | É | FR | ⚠ re-route ingestion ; H100 PAR2 chiffrage commercial absent |
| A4 S3NS all-in (H100) | ~€720 + storage €1 400 | L | É | FR (SecNumCloud) | ⚠ re-route ingestion ; SKUs GPU H100/A100 hérités GCP, file d'attente non discutée |
| A5 GCP all-in (H100) | ~€720 + storage €1 400 | L | É | US | ⚠ re-route ingestion ; quotas a3 sensibles |
| M1 Wasabi+Nebius (H100) | ~€700 + 0 € egress | M (FI \(\leftrightarrow\) FRA pour read 300 GB initial — ~1 h streaming) | F | EU | ✅ favori GPU + souveraineté EU |
| M2 Wasabi+OVH (H100) | ~€600 + 0 € egress | L–M | F | FR | ✅ favori si OVH H100 dispo + tarif compétitif (à confirmer) |
| M3 Wasabi+Scaleway (L4) | ~€180 + 0 € egress | M | F | FR | viable pour 4 \(\times\) L4 = 24 h vs 8 h H100 ; tradeoff temps/coût |
| M4 Wasabi+GCP (H100) | ~€720 + ~€10 egress (writes checkpoints petits) | L–M | F | US | egress dominé par writes checkpoints (~10 GB) ; négligeable |
| M5 Wasabi+Colab/credits | ~€0–60 (credits absorbent) | M (sessions préemptives, A100/H100 non garanti Pro) | F | US | ⚠ inadapté training >8 h continu |
Recommandation UC-04 : M1 (Wasabi + Nebius H100) ou M2 (Wasabi + OVH H100). Critère de bascule : « si OVH H100 chiffré \(\leq\) €2,80/h GPU, M2 gagne pour la souveraineté FR ; sinon M1 pour la grille tarif publique stable de Nebius ($2,95/h, -35% sur commit) ». M5 inadapté (Colab Pro ne garantit pas H100, sessions préemptives 12 h plafonnées).
4.5 UC-05 — Hackathon agentique (130 CPU-h/an + tokens API)
| Archi | Coût/an | Friction | Lock-in | Souv | Notes |
|---|---|---|---|---|---|
| A1 Nebius all-in | ~€55 + storage €1 200 | L | É | EU | ⚠ disproportionné pour hackathon ponctuel |
| A2 OVH all-in | ~€26 + storage €530 | L | É | FR | ⚠ disproportionné pour hackathon |
| A3 Scaleway all-in | ~€42 + storage €820 | L | É | FR | ⚠ disproportionné pour hackathon |
| A4 S3NS all-in | ~€40 + storage €1 400 | L | É | FR (SecNumCloud 3.2) | ✅ angle partenariat S3NS — hébergement Paris 9e proposé en RDV 17/04, « encadrer ça avec nos architectes sans souci » (Émilie Daelman) |
| A5 GCP all-in | ~€40 + storage €1 400 | L | É | US | ⚠ disproportionné pour hackathon |
| M1 Wasabi+Nebius | ~€55 + tokens | M | F | EU | viable ; tokens via APIs externes |
| M2 Wasabi+OVH | ~€26 + tokens | L–M | F | FR | viable + souverain |
| M3 Wasabi+Scaleway | ~€42 + tokens | M | F | FR | ✅ Scaleway propose des LLM managés (Mistral) — angle bundle |
| M4 Wasabi+GCP | ~€40 + tokens (Gemini natif) | L–M | F | US | ✅ tokens Gemini natif si l'arène l'exige |
| M5 Wasabi+Colab/credits | ~€0 (credits + Colab) | M | F | US | ✅ favori coût zéro ; Vertex AI / Gemini accès facile |
Recommandation UC-05 : A4 (S3NS all-in pour le signal partenariat) ou M5 (Wasabi + Colab/credits pour le coût zéro). Critère de bascule : « le hackathon est-il un livrable du partenariat S3NS (donnant-donnant 17/04) \(\to\) A4 ; ou un événement organisé en autonomie avec budget zéro \(\to\) M5 ». UC-05 est le seul UC où A4 est techniquement défendable : le volume de données est marginal, donc le coût caché de migration storage 5,7 TiB ne s'applique pas (on ouvre un bucket éphémère hackathon-only).
4bis. Opposabilité juridique — CLOUD Act et Data Act 2027
Le ranking technique-pédagogique se double d'un ranking d'opposabilité juridique. Synthèse en deux dimensions par architecture, à croiser avec les coûts ci-dessus pour décider .
4bis.1 Exposition extra-européenne (CLOUD Act / FISA 702)
| Archi | Côté storage | Côté compute | Exposition globale |
|---|---|---|---|
| A1 Nebius all-in | Nebius (Pays-Bas, Nebius Group N.V.) | Nebius FI | Hors scope CLOUD Act |
| A2 OVH all-in | OVH SAS (FR) | OVH FR | Hors scope CLOUD Act |
| A3 Scaleway all-in | Scaleway SAS (FR, groupe Iliad) | Scaleway FR | Hors scope CLOUD Act |
| A4 S3NS all-in | S3NS (Thales Cloud Sécurisé, FR) | S3NS FR | SecNumCloud 3.2 qualifié 19/12/2025 ; ANSSI : « offers protection against extra-European law » |
| A5 GCP all-in | GCS (Google LLC, US) | GCP europe-west | Pleinement soumis CLOUD Act + FISA 702 |
| M1 Wasabi+Nebius | Wasabi US Inc. (eu-central-1) | Nebius (hors) | Storage soumis CLOUD Act ; mesures Schrems II requises |
| M2 Wasabi+OVH | Wasabi US Inc. (eu-central-1) | OVH (hors) | Idem M1 |
| M3 Wasabi+Scaleway | Wasabi US Inc. (eu-central-1) | Scaleway (hors) | Idem M1 |
| M4 Wasabi+GCP | Wasabi US Inc. (eu-central-1) | GCP (US) | Pleinement exposé sur les deux côtés |
| M5 Wasabi+Colab/credits | Wasabi US Inc. (eu-central-1) | GCP (US) | Pleinement exposé sur les deux côtés |
Lecture transverse : toute architecture mixée Wasabi-X reste exposée côté storage tant que Wasabi n'est pas remplacé par OVH Cold Archive qualifié ou par S3NS sur la couche storage. Mesures supplémentaires Schrems II (chiffrement clés FR + pseudonymisation) à documenter en TIA pour les transferts US.
4bis.2 Conformité Data Act EU 2023/2854 (12 janvier 2027)
Articles structurants à l'horizon 2027 — applicables à tout contrat signé après le 12 septembre 2025 :
- Art. 25 — clauses contractuelles obligatoires pour les services de traitement de données. À insérer verbatim dans le contrat-type compute MaQI.
- Art. 28 — obligation de transparence sur l'accès gouvernemental tiers (alignement RGPD art. 48 + reportable au DPO).
- Art. 29 §1 — gratuité totale du switching au 12 janvier 2027. Les egress fees deviennent caduques pour la sortie d'un fournisseur.
- Art. 30 — functional equivalence : le provider est tenu de fournir une équivalence fonctionnelle pour permettre le switch.
- Art. 34(2) — egress charges en usage courant (distinctes des switching charges) : restent légales jusqu'à régulation spécifique, mais la pression concurrentielle EU les compresse déjà (Nebius, OVH, Scaleway zero-egress).
Conséquence pratique : tout triptyque mixé Wasabi-X EU (M1/M2/M3) bénéficie immédiatement du zéro-egress côté compute (acquis contractuel) et mécaniquement du zéro switching cost au 12/01/2027 (Data Act). L'architecture all-in EU (A1/A2/A3) reste équivalente sur ce critère mais perd la flexibilité multi-fournisseur.
4bis.3 Recommandation transverse — clauses contractuelles à exiger
Pour les RFP S3NS, Scaleway, Nebius, OVH (et tout futur fournisseur), trois clauses minimales :
- Conformité Data Act art. 25 verbatim (contrat-type EU obligatoire pour tout service signé après 12/09/2025).
- Engagement art. 28 sur la transparence des requêtes gouvernementales tierces (notification, périmètre, défense).
- Mesures supplémentaires Schrems II documentées : chiffrement de bout en bout avec clés détenues côté MaQI / tiers de confiance FR ; pseudonymisation des données dérivées avant export US.
Source canonique des extraits : maqi-internal/docs/legal/sovereignty-corpus.md
(corpus interne, sources primaires verbatim — accessible derrière
magic-link sur la projection privée).
5. Synthèse — recommandations transverses
5.1 Règle de décision par défaut
Pour les UC-01 à UC-04 (workloads pédagogiques et recherche récurrents), la famille mixée Wasabi + compute externe domine la famille all-in sur trois critères structurels :
- Coût : storage Wasabi (~€445/an pour 5,7 TiB) reste \(1,2\times\) à \(3,2\times\) moins cher que les alternatives storage cloud souverain ou hyperscaler.
- Lock-in : la dissociation storage/compute permet de pivoter de provider compute en quelques jours sans toucher la donnée.
- Egress : la combinaison Wasabi (free egress sous régime \(\leq\) \(1\times\) volume stocké) + compute bandwidth-included (OVH / Scaleway / Nebius) ramène le coût réseau à 0 € sur l'usage MaQI.
Top choix par défaut : M2 (Wasabi + OVH) pour CPU et M1 (Wasabi + Nebius) pour GPU H100 lourd. Bascule M3 (Wasabi + Scaleway) si crédit académique négocié.
5.2 Place de S3NS
S3NS est techniquement positionné uniquement sur A4 (all-in SecNumCloud) par contrainte architecturale propre. Conséquences :
- Pour UC-01 à UC-04, A4 implique migration de 5,7 TiB Wasabi \(\to\) S3NS storage, perte du découplage stratégique, et coût annuel storage +€1 020/an vs Wasabi. Le rapport coût/bénéfice ne se justifie que si la souveraineté SecNumCloud devient un deliverable pédagogique du Master — décision politique, pas technique.
- Pour UC-05 (hackathon), A4 est défendable car (a) volumes marginaux \(\to\) migration sans coût caché, (b) S3NS a explicitement proposé d'héberger l'événement Paris 9e + accompagnement architectes, (c) angle « démonstration souveraineté en action » cohérent avec le narratif Master.
5.3 Place de GCP / Colab
- A5 (GCP all-in) : pas de logique pour MaQI (US, pas de souveraineté EU, +€1 020/an storage, +€600/an egress).
- M4 (Wasabi + GCP) : envisageable si BigQuery / Vertex AI spécifique requis. ~€600/an d'egress writes-back à budgéter.
- M5 (Wasabi + Colab/credits) : utile pour UC-01, UC-02 et UC-05 comme « plan B sans budget » via crédits faculty $5K + PhD $1K. Pas utilisable sur UC-03 (sessions 12 h plafonnées) ni UC-04 (H100 non garanti Pro).
5.4 ⚠ Coût caché de la migration storage all-in
À rappeler explicitement à l'arbitrage :
Migrer 5,7 TiB de Wasabi vers un storage all-in (A1–A5) coûte 0 € en facture egress (Wasabi free + ingress universal) mais représente 9–18 jours de transfert continu sur lien commercial (PoC home WiFi : ~25–47 Mbps), avec risque de cohérence sur les buckets sans checksum vendor (CausalityLink, RavenPack), et abandon de la doctrine zéro-egress Wasabi sur les flux futurs.
Mesures réelles (5 mai 2026) :
- Single-stream rclone home WiFi \(\to\) Wasabi
eu-central-1: ~25 Mbps. - Multi-thread (4 streams parallèles) \(\to\) Wasabi
eu-central-1: ~47 Mbps. - Sur lien fibré opérateur 1 Gbps : ~13 h pour 5,7 TiB.
- Sur lien \(DC\leftrightarrow{}DC\) 10 Gbps (peering provider) : ~1,3 h.
La migration n'est pas un non-événement : elle requiert un fenêtre opérationnelle dédiée + reprise + vérification.
5.5 Arbitrage pour jeudi 7 mai
Trois questions atomiques à porter au point tech :
- La souveraineté SecNumCloud est-elle un livrable pédagogique du Master ? Si oui, A4 (all-in S3NS) revient dans la course pour UC-01 à UC-04 — sous condition d'un chiffrage compétitif.
- L'option hackathon (UC-05) chez S3NS est-elle activée ? Si oui, A4 sur ce seul UC permet un partenariat sans imposer la migration des autres usages.
- Quel provider compute privilégier pour UC-01 à UC-04 ? Recommandation transverse : Wasabi storage + OVH compute (M2) par défaut, Nebius (M1) sur GPU H100 lourds, Scaleway (M3) en alternative FR si crédit académique négocié.
6. Questions ouvertes et inputs manquants
- [ ] Tarif H100 / L40S Scaleway PAR2 (à demander commercial — checklist
scaleway.md). - [ ] Tarif H100 OVH Public Cloud à figer (grille publique mais à confirmer au commercial pour académique).
- [ ] Chiffrage S3NS pour académique (promis post-RDV 17/04, pas reçu à date du 5 mai).
- [ ] Politique egress S3NS sortie VM \(\to\) Internet (GCP-like ou rabais ?).
- [ ] Mesure throughput réelle Wasabi
eu-central-1\(\leftrightarrow\) OVH SBG/FRA et Wasabi \(\leftrightarrow\) Scaleway PAR1 sur fichier Databento 10 GB référence. - [ ] Eligibilité OCRE 2024 via École Polytechnique (cf. fiche
ovh.mdpriorité 1 — leverage institutionnel non activé). - [ ] Validation Wissal sur le périmètre des UC (les 5 UC retenus ici sont une projection de l'usage anticipé, pas un contrat pédagogique).
Sources
vendors.yaml— catalogue vendor compute structuré.cost-model.md— doctrine egress + projections S&P.nebius.md,ovh.md,scaleway.md,s3ns.md,gcp.md,aws.md,azure.md— fiches fournisseurs.../wasabi/state.md— totaux buckets MaQI (snapshot 2026-04-14).../providers/databento-commercial-facts.md— volumes Databento.