La Direction des ventes de LatDior Data cherche à exploiter leurs données de transactions pour mieux comprendre les performances de vente de leurs produits à travers différents pays. Pour ce faire, ils ont besoin d'un Data Analyste capable d'analyser ces données en utilisant Apache Spark sous la plateforme DataBricks.
L'objectif de ce projet est de réaliser plusieurs analyses de données, incluant :
- 📥 Chargement des données : Lire et structurer les données de transactions et de devis à partir d'un fichier JSON.
- 🔢 Agrégation simple : Calculer le nombre de commandes par produit et par pays.
- 🔗 Jointure des données : Convertir les prix des transactions en euros en joignant les données de taux de change.
- 🪟 Agrégation avec fenêtre : Identifier les deux transactions les plus lucratives par pays.
- 🔄 Agrégation combinée : Utiliser la fonction cube pour une agrégation combinée sur les types de produits et les pays.
Ces analyses permettent à LatDior Data de prendre des décisions éclairées et d'optimiser leurs stratégies de vente.
Ce projet a permis de démontrer l'efficacité de l'utilisation de Apache Spark sous DataBricks pour l'analyse des données de ventes. Les différentes fonctions définies offrent une vue approfondie des performances de vente par produit et par pays. Grâce à ces analyses, LatDior Data peut désormais prendre des décisions stratégiques basées sur des données précises, optimiser leurs opérations commerciales, et identifier les opportunités de croissance sur différents marchés.