Databento — NASDAQ tick legacy lot (2018–2025)
Explore
- Produit livré : Databento — données de marché tick-by-tick du NASDAQ (XNAS), 10 niveaux de profondeur du carnet d'ordres.
- Forme du livrable : fichiers
.dbn.zst(format binaire Databento compressé Zstandard), groupés en 3 sous-lots, reçus sur disque dur externe Seagate. - Couverture annoncée : mai 2018 \(\to\) mars 2025.
- Couverture observée : conforme — 3 042 fichiers, 1,4 To, 3 lots.
- Vérification cryptographique : disponible — un fichier
manifest.jsonpar sous-lot, contenant l'empreinte SHA-256 de chaque fichier livré. - Licence du dump : usage Master "AI for market and quantitative investment". Aucune redistribution autorisée.
Validate
État au 2026-04-14 — repris de docs/wasabi/anomalies.md §4 :
| Sous-lot | Période | Taille | Fichiers | Manifest | Statut |
|---|---|---|---|---|---|
copy_XNAS-20250411-834CY4QERN | 2020-04 \(\to\) 2025-03 | 52 Go | 1 260 | OK | conforme |
copy_XNAS-20250411-TUD5WDMULM | 2025-03 (récent) | 1,3 To | 26 | OK | conforme |
XNAS-20250416-MHYNAA5XGU | 2018-05 \(\to\) 2020-04 | 34 Go | 1 753 | OK | conforme |
| Total | 2018-05 \(\to\) 2025-03 | 1,4 To | 3 042 | — | conforme |
Anomalies retenues : aucune. Chaque sous-lot contient exactement
les fichiers listés dans son manifest.json. La vérification
SHA-256 bit-à-bit de la copie locale est déclarée en cours dans
docs/wasabi/anomalies.md ; elle confirmera que la copie locale est
identique à l'original livré.
Notes opérationnelles :
- Les trois sous-lots se chevauchent au mois pivot 2020-04 — il faudra choisir un sous-lot canonique pour ce mois lors de la consommation (le lot le plus récent est généralement préférable car il intègre les corrections post-livraison Databento).
- Le format
.dbn.zstse lit avec le SDK Pythondatabento(open source). Pas de dépendance commerciale pour la relecture. - Le sous-lot
TUD5WDMULM(1,3 To pour 26 fichiers) est dense : il s'agit vraisemblablement de fichiers MBO complets (chaque message individuel) sur une fenêtre courte.
Ce qui n'est pas validé ici :
- La continuité jour-à-jour à l'intérieur des sous-lots (présence de chaque jour de bourse ouvert).
- La cohérence des
instrument_idDatabento entre sous-lots.
Ces deux points seront audités au moment où une tâche consommatrice lira effectivement le lot.
Negotiate
Pas de négociation portée par cette tâche. La négociation d'un
accès continu (API Databento, abonnement live) est portée par l'entrée
databento du catalogue.
Decisions
- ADR-002 — Cartographie opérationnelle des sources — fixe le squelette de ce document.
- Lien retour vers le catalogue :
catalog.yaml#databento-nasdaq-lot. - Source du diagnostic :
docs/wasabi/anomalies.md §4.