Skip to content

HugoBarjot/make-open-data

 
 

Repository files navigation

Bienvenue sur Make Open Data.

Des données publiques exploitables déployées sur une BDD Postgres/PostGIS accessibles depuis l'outil de votre choix.

Make Open Data est ELT Open Source pour données publiques :

  • Extrait les fichiers sources (data.gouv, INSEE, Etalab, etc.) les plus adaptés et les récents ;
  • Transforme ces données selon des règles transparentes et le moins irréversibles possibles ;
  • Stocke ces données dans une base de données PostgreSQL (avec PostGIS) ;
  • Teste des présupposés sur ces données. Un prix par transaction immobilière sur DVF par exemple.

Données spatiales intégrables dans QGIS et autres SIG.

Déploiement managé par Make Open Data

Nous fournissons les accès à une Postgres dans le cloud avec des données à jour.

Contactez-nous https://make-open-data.fr/

Déploiement manuel

Prérequis: : Accès à une instance Postgres > 15, cloud ou local, avec 40 Go de disque et 4 Go de mémoire.

  • Cloner le repo
git clone [email protected]:make-open-data/make-open-data.git
  • Installer et activer un environnement virtuel
python3.11 -m venv dbt-env 
source dbt-env/bin/activate
pip install --upgrade pip
pip install -r requirements.txt
  • Exporter les clés d'une instance PostgreSQL avec l’extension PostGIS de 10 GB min
export POSTGRES_USER=<YOUR_POSTGRES_USER>  
export POSTGRES_PASSWORD=<YOUR_POSTGRES_PASSWORD> 
export POSTGRES_HOST=<YOUR_POSTGRES_HOST> 
export POSTGRES_PORT=<YOUR_POSTGRES_PORT>  
export POSTGRES_DB=<YOUR_POSTGRES_DB>
  • Installer PostGis :
psql postgresql://$POSTGRES_USER:$POSTGRES_PASSWORD@$POSTGRES_HOST:$POSTGRES_PORT/$POSTGRES_DB
CREATE EXTENSION postgis;  
  • Extraire les données sources dans le schema sources:
python -m load # -> environ 20 min
  • Connecter DBT à la base de données
export DBT_PROFILES_DIR=.  
dbt debug
dbt deps
  • Réaliser et tester les transformations pour obtenir les tables finales
dbt seed
dbt run --target dev # environ 15 minutes -> tables logement sur région Occitanie et dvf sur Hérault. Utile pour tester rapidement. 
dbt run --target production # environ 1 heure
dbt test
  • Les tables sources et préparées sont disponibles dans la BDD.

About

make-open-data

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%