View as:

MaQI — Compute Vendor Landscape (sprint brief)

Contexte

Le Master MaQI ouvre en septembre 2026. Côté stockage, le choix est fait : Wasabi S3 (eu-central-1, egress gratuit) — documenté dans docs/wasabi/. Côté compute, rien n'est encore figé. CAL et Emmanuel sont en tour d'horizon vendor cette semaine : Nebius (16/04 matin), Gradium/FluidStack (16/04 13h), Sense (17/04), avec en arrière-plan OVH (déjà utilisé par Emmanuel), GCP (coût transfert jugé excessif), AWS et Azure (classiques).

Ce brief capture :

  1. L'analyse de l'appel Nebius du 16/04 \((\approx22\) min, Emmanuel + CAL + Mankaran Ahluwalia).
  2. Le contexte WhatsApp échangé entre CAL et Emmanuel post-appel.
  3. Le cadrage du livrable docs/compute/ à produire.

1. Appel Nebius — 16/04/2026 matin

Participants

QuiRôle
Mankaran AhluwaliaNebius (contact principal)
Artem (pas dans l'appel)Nebius — dirige Academy program + AI Day Amsterdam 17/04
Charles-Albert LehalleCo-directeur MaQI, Polytechnique
Emmanuel SériéCollaborateur scientifique MaQI

Agenda tel que dit par CAL

Points clés exprimés par Nebius (Mankaran)

  1. Nebius = AI cloud GPU-first. Ils opèrent principalement sur GPU. Fournissent des CPU en complément, mais ce n'est pas leur terrain naturel.
  2. Academy Program : mécanisme de crédits GPU pour des programmes universitaires alignés (AI, quant + GPU intersection = fit). Contact interne pour ça = Artem, que Mankaran va sync après l'AI Day Amsterdam du 17/04.
  3. Startup credits : existent aussi, mais plus adaptés à une startup qu'à une université — Mankaran va chercher le bon framework pour MaQI.
  4. Marché GPU tendu : Nebius vend déjà les capacités Q3 2026 alors qu'on est en Q2. Les créneaux dispos sont ad hoc (quand un client upgrade ou qu'une startup échoue).
  5. Trois modes de consommation :

    • On-demand : pool partagé, pas de garantie d'instance immédiate, utilisé avec les crédits Academy.
    • Reserved capacity : l'instance est à toi, disponible quand tu l'allumes.
    • Hybrid : mix selon usage (recommandé pour les pics d'examens où il faut de la garantie).
  6. Côté CPU : Nebius peut fournir en plus, mais leur structure tarifaire et leur offre sont pensées GPU. Mankaran va regarder en interne si un setup CPU-principal pour MaQI est faisable ou s'il faut construire un pattern hybride.
  7. Timing retour : Mankaran indique que la semaine suivante est chargée (QBRs, AI Day), il reviendra "dans les prochains jours" avec une proposition structurée.

Points clés exprimés par CAL / Emmanuel

Actions issues de l'appel

#ActionOwnerDeadline
1Sync interne Nebius (Academy + CPU setup)Mankaransemaine 17 avril
2Introduire Artem (Academy lead)Mankaranaprès AI Day Amsterdam (17/04)
3Chiffrer l'enveloppe compute MaQI (CPU/GPU burst + long)Emmanuel + CALavant fin avril
4Itérer avec Nebius sur la propositionMaQI + Nebiusmai

Opportunités side-quest mentionnées

2. Contexte WhatsApp post-appel (CAL ↔ Emmanuel)

Extraits pertinents du 16/04 12:23 \(\to\) 15:40 :

Lecture stratégique

La semaine du 14-17 avril est une semaine de cartographie compute menée par CAL + Emmanuel en parallèle du stream data S&P Global. Les critères de sélection implicites qui émergent :

  1. Coût transfer / egress (critique — Emmanuel a expérimenté GCP sur ce point et a jugé rédhibitoire).
  2. Souveraineté européenne (CAL, résonance LeCun / Nebius).
  3. Branding académique (LeCun, communauté ML FR, French Tech).
  4. Fit CPU-dominant + GPU-burst (contraire du marché actuel qui est GPU-first).
  5. Période d'expérimentation "gratuite" ou subventionnée (crédits Academy, crédits startup, etc.).
  6. Qualité de la relation (Nebius a marqué des points en 22 min sur l'écoute + la perspective GPU-market).

3. Livrable attendu — docs/compute/

Structure parallèle à docs/providers/ (données) et docs/wasabi/ (stockage) :

docs/compute/
├── README.md               Landing page : 3 questions, comment choisir
├── catalog.yaml            Source of truth machine-readable (typed)
├── cartography.md          Vue matricielle provider × critère
└── <provider>.md           Une fiche par vendor documenté
    ├── nebius.md           (call 16/04 — cf. ce brief pour source)
    ├── ovh.md              (déjà utilisé en prod pour stream S&P)
    ├── gradium.md          (Laurent Mazaré, LeCun BA)
    ├── fluidstack.md       (underlying chez Gradium)
    ├── sense.md            (call 17/04 à venir)
    ├── gcp.md              (classique, transfer cost jugé élevé)
    ├── aws.md              (classique)
    └── azure.md            (classique, jugé "nightmare paperwork" par CAL)

Schéma catalog.yaml (à formaliser par le worker)

Champs minimaux par vendor :

ChampTypeExemple
idslug stablenebius
namedisplay nameNebius AI Cloud
categorygpu_cloud | hybrid_cloud | cpu_cloud | hyperscaler | sovereign_eu | startup_friendlygpu_cloud
primary_offerCPU / GPU / bothGPU-first
statusactive_discussion | evaluated | in_use | to_explore | rejectedactive_discussion
egress_costshort qualitativecheap / expensive / included
region_euy/n/partialyes
sovereigntyEU / US / mixedEU
credits_programy/n + short noteAcademy + startup credits
contactslist {name, role, email}Mankaran Ahluwalia
first_contactdate2026-04-16
last_actionshort text + date"appel 22min, retour attendu semaine 17/04"
operational_statusnot_started | explored | quoted | piloting | in_production | blocked | rejectedexplored
last_revieweddate2026-04-16
detail_docrelative pathdocs/compute/nebius.md
notesfree text (FR ok)

Squelette imposé par fiche docs/compute/<id>.md

Reprendre le pattern ADR-002 §2 (providers data) mais adapté :

---
id: <slug>
name: <display>
category: <gpu_cloud | ...>
operational_status: not_started | explored | quoted | piloting | in_production | blocked | rejected
last_reviewed: YYYY-MM-DD
upstream: docs/compute/catalog.yaml#<id>
---

# <Nom du vendor>

## Offre

<ce que le vendor propose : CPU / GPU / storage / auctions mode,
régions, souveraineté, SLAs publics.>

## Positionnement pour MaQI

<fit vs. besoin : CPU-dominant + GPU-burst + experimentation +
sovereignty. Signal extérieur (ex. Nebius = fournisseur GPU LeCun).>

## Interactions

<log daté des appels / emails / demos. Format :
`2026-04-16 — appel 22min avec Mankaran (Emmanuel + CAL), retour
prévu semaine du 17/04`. Pas de prix, pas de NDA, pas de secret.>

## Critères d'évaluation

<grille de notation qualitative sur les 6 critères de ce brief :
egress cost, souveraineté, branding, fit CPU/GPU, experimentation,
relation.>

## Décisions ouvertes

<questions en suspens + bloquants pour passer à
`quoted` ou `piloting`.>

README.md — structure 3 questions (parallèle wasabi/)

Les trois questions :

Contraintes héritées de ADR-002

Ce qui N'EST PAS dans le scope de cette molécule

Sources

Critère de complétion