Nebius AI Cloud

Explore

Positionnement — AI cloud européen, spin-off technique des infrastructures Yandex restructurées post-2022. Coté Nasdaq (NBIS, 2024). Orientation GPU-first, pas d'ambition généraliste.
Notebook natif — pas de "Colab managé" ; on provisionne un JupyterLab / MLflow sur une VM. Pilier = Nebius AI Studio pour l'inférence, et Managed Kubernetes + SLURM pour training.
GPUs disponibles — H100, H200, B200, L40S. Tarifs publics à jour (2026-04-16) :

SKU Prix on-demand Bundle

H100 (HGX) $2.95 / h $\cdot$ GPU 16 vCPU + 200 GB RAM

H200 (HGX) $3.50 / h $\cdot$ GPU 16 vCPU + 200 GB RAM

Depuis 2025-10-01, Nebius facture GPU + vCPU + RAM groupés pour B200 / H200 / H100.
Régions — Finlande (Mäntsälä), Islande, USA (Kansas City). Pas de région FR directe ; la FI est la plus proche pour MaQI.
Lecture de Wasabi eu-central-1 — Internet public, égress Wasabi gratuit, ingress Nebius inclus dans le prix on-demand. Latence $Mäntsälä\leftrightarrow{}Frankfurt$ ~40–60 ms — acceptable pour streaming, moins pour random read intensif.
Credits recherche — Nebius Research Credits Program — accès ciblé labos / universités, application avec description projet.
Commit discounts — jusqu'à ~35 % pour engagement multi-mois (H100 $\to$ ~$2.00/h avec réservation).

SKU	Prix on-demand	Bundle
H100 (HGX)	$2.95 / h \(\cdot\) GPU	16 vCPU + 200 GB RAM
H200 (HGX)	$3.50 / h \(\cdot\) GPU	16 vCPU + 200 GB RAM

Pas encore de PoC déclenché depuis MaQI.

Checklist :

[ ] Demande au Research Credits Program.
[ ] PoC training (ex : fine-tune d'un modèle sentiment sur RavenPack) sur $1\times{}H100$ à Mäntsälä.
[ ] Mesurer throughput S3 $Wasabi\to{}Nebius$ FI (rclone cat + polars streaming).
[ ] Valider l'intégration SLURM / K8s avec le pipeline Hamilton du lab de recherche.

Points ouverts :

Nebius est européen mais pas français — à vérifier avec CAL si la contrainte "souveraineté FR" s'impose ou si "EU" suffit.
Absence de région FR = latence Wasabi non optimale (comparer avec OVH sur un même PoC).

Bande passante incluse sur les workloads compute (politique neocloud standard 2025-2026). Egress Object Storage à confirmer sur les docs officielles et au meeting Mankaran / Artem (attendu semaine du 21/04).
Projection S&P : ingestion 3.75 TiB $\approx$ ~€5 (VM hours uniquement) ; usage annuel $\approx$ ~€0 sur le réseau.
Question à poser en call : garantie contractuelle de la politique zero-egress sur la durée du partenariat Master (pas juste snapshot marketing 2026).

Voir vendors.yaml#nebius.
Candidat crédible pour un besoin training massif occasionnel (budget dominé par les H100-hours, pas par la latence S3).