Amazon Web Services
Explore
- Positionnement — hyperscaler US, référence de l'écosystème Athena-like. Le plus aligné avec la cible architecturale CAL (lecteur S3 server-less).
- Notebook natif — SageMaker Studio, SageMaker Notebooks (instances managées), et SageMaker Studio Lab (gratuit, orienté éducation).
- GPUs disponibles — H100 (p5), H200 (p5e), A100 (p4d), L4, L40S, ainsi que Trainium / Inferentia (ARM maison) pour coûts réduits.
- Régions EU pertinentes —
eu-central-1(Frankfurt — colocalisé avec Wasabi, donc latence minimale),eu-west-3(Paris),eu-west-1(Dublin). - Lecture de Wasabi
eu-central-1— même région physique \(\Rightarrow\) inter-AZ ou inter-region traffic nul côté Wasabi, facturé par AWS comme inbound. Trajet court, coût dominé par la requête S3. - Athena-like — Amazon Athena natif, déploiement Terraform bien documenté. Glue Catalog = catalogue de schémas partagé. Fits CAL target.
- Credits recherche — AWS Cloud Credit for Research (rolling, revue 90 j, éligibilité institutionnelle).
- Autre — AWS Educate (gratuit pour étudiants, compute limité mais utile comme entrée).
Validate
Pas encore de PoC déclenché depuis MaQI.
Checklist :
- [ ] Compte AWS organisation créé côté Polytechnique.
- [ ] Demande
Cloud Credit for Researchrédigée (Emmanuel / CAL). - [ ] PoC : Athena sur bucket Wasabi via S3 cross-account (possible via presigned URLs ou via AWS Glue ETL puis dépôt sur S3 AWS) — à spécifier.
- [ ] Mesurer la latence S3-Wasabi depuis
eu-central-1. - [ ] SageMaker Studio Lab évalué comme alternative Colab.
Negotiate
Points ouverts :
- Les données restent sur Wasabi (politique MaQI). AWS est ici pour le compute, pas pour héberger la donnée \(\to\) négocier un modèle compute-only, sans transfer massif vers S3 AWS.
- AWS Educate en parallèle pour les étudiants (gratuité, quotas bas).
- Attention au verrouillage Athena : exporter la définition Glue Catalog vers un format portable (Iceberg, Delta Lake) pour préserver l'ADR Terraform multi-cloud.
Decisions
- Voir
vendors.yaml#aws. - AWS est le choix "Athena-like par défaut" dans la discussion CAL ; à formaliser dans une ADR si retenu.
Coût réseau / egress
- ~$0.09/GB egress EU \(\to\) Internet (1ère 100 GB/mois gratuite).
- AWS a supprimé les egress fees uniquement lors d'une migration de sortie complète (mars 2024, 60 jours de crédits, fermeture de compte requise). Pas applicable à l'usage MaQI courant.
- Projection S&P : ingestion 3.75 TiB \(\approx\) ~€315 ; usage annuel 8 TB \(\approx\) ~€680/an.
- Horizon régulatoire : EU Data Act supprime les switching charges à partir du 12 janvier 2027 — l'egress "normal" restera facturé jusqu'à cette date.
Détails : cost-model.md.