View as:

Sprint MaQI — 2026-04-14

Public : Emmanuel, Charles-Albert, Wissal. Objectif M1 : rendre visible et actionnable ce que Charles-Albert partage sur son Google Drive, et poser un premier catalogue de providers qui servira de source unique pour les décisions d'achat / négociation.

Contexte

Charles-Albert (CAL) centralise dans son dossier partagé Google Drive (~/gdrive/cal-shared/) deux documents de travail qui décrivent l'intégralité de la stratégie data du Master AI for Market & Quantitative Investment :

  1. Datasets pipeline for MaQI.docx — l'inventaire vivant : données détenues (S&P Global), données gratuites, données à acheter, données à négocier, et providers à documenter.
  2. Tech solutions for MaQI.docx — les contraintes techniques (non-redistribution, S3 egress, accès étudiants vs. chercheurs) et la piste d'architecture pressentie (Wasabi/Backblaze + Athena).

Ces documents sont des sources vivantes, rédigées en dehors du repo. Ils ne peuvent pas être la vérité de terrain pour un travail d'ingénierie : on ne peut pas les lire en ligne, les diff, les lier depuis un notebook, ni les citer depuis un ticket.

Objectif M1

Transformer le contenu CAL en artefacts versionnés dans le repo MaQI, pour :

Livrables

#LivrableChemin
1Copie markdown idempotente des docs CALdocs/cal/
2Script de re-synchronisation depuis ~/gdrive/cal-shared/scripts/sync-cal-docs.sh
3Catalogue de providers (source machine-lisible)docs/providers/catalog.yaml
4Catalogue de providers (vue humaine, publique CAL)docs/providers/README.md
5Ce brief de sprintdocs/sprint/2026-04-14-maqi-sprint.md

Flux de synchronisation

flowchart LR
    gdrive["~/gdrive/cal-shared/<br>(source CAL)"]
    docx["*.docx / *.pdf"]
    script["scripts/sync-cal-docs.sh<br>(pandoc)"]
    md["docs/cal/*.md<br>(versionné)"]
    catalog["docs/providers/catalog.yaml<br>(curé à la main)"]
    readme["docs/providers/README.md<br>(lisible CAL)"]

    gdrive --> docx
    docx -->|resync| script
    script --> md
    md -->|extraction manuelle| catalog
    catalog --> readme

    style gdrive fill:#eef,stroke:#448
    style script fill:#fed,stroke:#c60
    style md fill:#dfd,stroke:#0a0
    style catalog fill:#dfd,stroke:#0a0
    style readme fill:#dfd,stroke:#0a0

La synchronisation est à sens unique : gdrive → repo. Les corrections apportées au catalogue retournent vers Charles-Albert par revue directe du repo, pas par édition du docx. Cela évite le problème classique de la double vérité.

Hors périmètre

Définition de terminé (M1)