Nebius AI Cloud
Explore
- Positionnement — AI cloud européen, spin-off technique des infrastructures Yandex restructurées post-2022. Coté Nasdaq (NBIS, 2024). Orientation GPU-first, pas d'ambition généraliste.
- Notebook natif — pas de "Colab managé" ; on provisionne un JupyterLab / MLflow sur une VM. Pilier = Nebius AI Studio pour l'inférence, et Managed Kubernetes + SLURM pour training.
-
GPUs disponibles — H100, H200, B200, L40S. Tarifs publics à jour (2026-04-16) :
SKU Prix on-demand Bundle H100 (HGX) $2.95 / h \(\cdot\) GPU 16 vCPU + 200 GB RAM H200 (HGX) $3.50 / h \(\cdot\) GPU 16 vCPU + 200 GB RAM Depuis 2025-10-01, Nebius facture GPU + vCPU + RAM groupés pour B200 / H200 / H100.
- Régions — Finlande (Mäntsälä), Islande, USA (Kansas City). Pas de région FR directe ; la FI est la plus proche pour MaQI.
- Lecture de Wasabi
eu-central-1— Internet public, égress Wasabi gratuit, ingress Nebius inclus dans le prix on-demand. Latence \(Mäntsälä\leftrightarrow{}Frankfurt\) ~40–60 ms — acceptable pour streaming, moins pour random read intensif. - Credits recherche — Nebius Research Credits Program — accès ciblé labos / universités, application avec description projet.
- Commit discounts — jusqu'à ~35 % pour engagement multi-mois (H100 \(\to\) ~$2.00/h avec réservation).
Validate
Pas encore de PoC déclenché depuis MaQI.
Checklist :
- [ ] Demande au Research Credits Program.
- [ ] PoC training (ex : fine-tune d'un modèle sentiment sur RavenPack) sur \(1\times{}H100\) à Mäntsälä.
- [ ] Mesurer throughput S3 \(Wasabi\to{}Nebius\) FI (
rclone cat+ polars streaming). - [ ] Valider l'intégration SLURM / K8s avec le pipeline Hamilton du lab de recherche.
Negotiate
Points ouverts :
- Nebius est européen mais pas français — à vérifier avec CAL si la contrainte "souveraineté FR" s'impose ou si "EU" suffit.
- Absence de région FR = latence Wasabi non optimale (comparer avec OVH sur un même PoC).
Coût réseau / egress
- Bande passante incluse sur les workloads compute (politique neocloud standard 2025-2026). Egress Object Storage à confirmer sur les docs officielles et au meeting Mankaran / Artem (attendu semaine du 21/04).
- Projection S&P : ingestion 3.75 TiB \(\approx\) ~€5 (VM hours uniquement) ; usage annuel \(\approx\) ~€0 sur le réseau.
- Question à poser en call : garantie contractuelle de la politique zero-egress sur la durée du partenariat Master (pas juste snapshot marketing 2026).
Détails : cost-model.md.
Decisions
- Voir
vendors.yaml#nebius. - Candidat crédible pour un besoin training massif occasionnel (budget dominé par les H100-hours, pas par la latence S3).