Skip to content

sidalidev/etl-demo

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Jan 8, 2025
e842f77 · Jan 8, 2025

History

5 Commits
Jan 8, 2025
Jan 8, 2025
Jan 8, 2025
Dec 19, 2024
Dec 19, 2024
Jan 8, 2025
Dec 19, 2024
Dec 19, 2024
Dec 19, 2024
Dec 19, 2024
Dec 19, 2024
Dec 19, 2024
Dec 19, 2024
Dec 19, 2024
Dec 19, 2024
Dec 19, 2024
Dec 19, 2024
Dec 19, 2024
Dec 19, 2024
Dec 19, 2024

Repository files navigation

Demo ETL

Exemple simple d'un pipeline ETL complet.

Structure

etl-demo/
├── data/
│   ├── raw/           # Données brutes (JSON)
│   └── processed/     # Données nettoyées (CSV)
├── 1-extract.js       # Scraping avec Playwright
├── 2-transform.py     # Nettoyage avec Pandas
└── 3-load.py         # Chargement dans Cassandra

Utilisation

  1. Extraction :
node 1-extract.js
  1. Transformation :
python 2-transform.py
  1. Chargement :
python 3-load.py

Notes

  • Le scraping est configuré pour la Fnac
  • Les données sont sauvegardées à chaque étape
  • Utilise des batch pour Cassandra

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published