View as:

Catalogue des providers de données MaQI

Pour Charles-Albert. Ce catalogue est extrait du document Datasets pipeline for MaQI.docx (synchronisé dans ../cal/datasets-pipeline.md) et curé à la main dans catalog.yaml.

Le but : te donner une vue stable et diffable de tous les providers nommés, classés par statut, avec les contacts et les contraintes connus, de manière à pouvoir décider sans relire le docx.

Comment le lire

Source canonique : catalog.yaml (28 entrées). Ce README est une projection lisible, maintenue à la main. En cas de divergence, catalog.yaml fait foi. Pour proposer une correction, édite le YAML puis mets à jour ce README en conséquence.

Vue d'ensemble

flowchart TB
    subgraph OWNED["Possédés (sous contrat)"]
        direction LR
        spgmi["S&P Global<br>5 services"]
    end

    subgraph FREE["Gratuits (sans contrat écrit)"]
        direction LR
        tfm["TheForecastingMachine"]
        eur["EuropeanReports.com"]
        ship["Shipfix"]
    end

    subgraph BUY["À acheter"]
        direction LR
        sk["SpaceKnow"]
    end

    subgraph NEGO["À négocier"]
        direction LR
        db["Databento<br>(tick-by-tick)"]
        pl["Premialab / SocGen<br>(facteurs)"]
        mb["Macrobond / Turnleaf<br>(macro)"]
        tr["Tradition<br>(bond OTC)"]
        rp["RavenPack<br>(sentiment)"]
    end

    subgraph SCRAPE["Scrapables"]
        direction LR
        ard["Ardian × Artefact<br>(fondamentaux)"]
        mar["MarineTraffic / PortWatch"]
        oim["OpenInfraMap / ICIS"]
    end

    subgraph DOC["À documenter"]
        direction LR
        ic["ICEYE (SAR)"]
        misc["Brain / NewMark /<br>Quant Insight / Babbl"]
    end

    style OWNED fill:#dfd,stroke:#0a0
    style FREE fill:#ffd,stroke:#cc0
    style BUY fill:#fed,stroke:#c60
    style NEGO fill:#eef,stroke:#448
    style SCRAPE fill:#fef,stroke:#c6c
    style DOC fill:#eee,stroke:#888

Légende des statuts

StatutSignificationAction par défaut
ownedDonnées sous contrat, livrées et stockéesIntégrer au pipeline MaQI
freeAccès de fait, sans contrat écritFormaliser un contrat avant toute dépendance opérationnelle
to_buyContact établi, décision d'achat attendueDéclencher le bon de commande
to_negotiateDécision achat/négociation ouverteOuvrir la négociation ou choisir une alternative
to_scrapeSource publique, à ingérer nous-mêmesSpiker un script de collecte + vérifier licence
to_documentPas assez d'info pour déciderLever un ticket "fiche provider"

Possédés — S&P Global

Contrat académique au nom du Master "AI for Market and Quantitative Investment", livré via Xpressfeed. Commencement : 31 décembre 2025.

ServiceCatégorieCouvertureFréquenceHistorique
Compustat with Market DataFondamentaux + marchéGlobal (hors Amérique du Nord)DailyCurrent + full history
Transcripts & Machine Readable FilingsFondamentauxGlobalSpanFull history (filings)
GICRS Cross ReferenceIdentifiantsGlobalDailyCurrent
ESG — Physical RiskESG climatGlobalDailyCurrent + full history
Panjiva Trade DataSupply chainGlobalDailyCurrent

Le PDF complet du contrat reste dans : ~/gdrive/cal-shared/doc_data_MaQI/S&P Global/SPGMI - Ecole Polytechnique - Mars 2025.pdf


Gratuits, à formaliser

Ces sources sont accessibles de fait mais sans contrat écrit. Elles ne peuvent pas être intégrées à un pipeline critique tant que leur usage n'est pas sécurisé.

ProviderCatégorieAccèsAction
TheForecastingMachineNarratifs / nowcastingEmailContrat écrit
EuropeanReports.comRapports d'entreprises européennesEmailContrat écrit
Shipfix (Veson — ppagnotta@veson.com)Trafic maritimeLogin CAL, .tar downloadContrat écrit

À acheter

ProviderCatégorieNotes
SpaceKnowNowcasting satellitaireContact existant, décision attendue

À négocier

Market data

ProviderPour quoiContact
DatabentoTick-by-tick multi-venue— (déjà un dump NASDAQ, cf. docs/wasabi/anomalies.md §4)
PremialabFacteursAdrien Geliot — adriengeliot@gmail.com (email envoyé)
SocGen Indices FeedsFacteursportail public
Tradition — Bond LOBCarnet d'ordres bond OTCDavid Parker — bonds.com/bond-data

Macro

ProviderNotes
MacrobondRéférence macro
TurnleafContact Alex Denev + Charles-Albert — détient GDELT

Sentiment

ProviderNotes
RavenPackDump historique déjà présent (cf. docs/wasabi/anomalies.md §2, année 2020 manquante) — à négocier pour un flux continu

Gratuits, à scraper

Fondamentaux (texte)

Ardian \(\times\) Artefact — partenariat potentiel pour un dataset benchmark de texte financier. Ardian collabore avec l'École Polytechnique via Charles-Albert.

Contacts :

Ressources existantes :

Maritime

ProviderURL
MarineTrafficmarinetraffic.com
IMF PortWatchportwatch.imf.org

Énergie et matières premières

ProviderURL
OpenInfraMap — centralesopeninframap.org
ICIS — carte fertilisants 2025PDF

À documenter

Sources mentionnées par Charles-Albert mais pour lesquelles nous n'avons pas encore assez de contexte pour statuer.

ProviderTypeLien
ICEYESatellite SARiceye.com/sar-data
Brain Company — Francesco CricchioLead / podcastbraincompany.co
NewMark Risk — Frank FerstlerLeadLinkedIn
Quant InsightMacro/factor platformquant-insight.com
BabblSentiment datastorebabbl.mydatastorefront.com

Synthèse

Source canonique : catalog.yaml — 28 entrées.

StatutNombreObservation
owned7 (5 S&P Global + 2 legacy)Contrat actif ou dump vérifié — à intégrer
free3Non sécurisés — contrats à rédiger
to_buy1Décision à prendre sur SpaceKnow
to_negotiate7Fenêtre de négociation ouverte
to_scrape5Collecte à spiker, attention aux licences
to_document5Leads à instruire

Voir aussi