cours-2023-2024 | Documents de mes cours pour l'année 2023-2024 | FX Jollois

Système pour la Data Science

Master AMSD/MLSD

Mini-projet Tableaux de bord temps réel

DEADLINE : 3 MARS 23h59

RENDU : https://cloud.parisdescartes.fr/index.php/s/K8Hkn5wqLqQyCHN

Demande à réaliser

Sujet

Vous êtes missionné pour réfléchir à la création un tableau de bord temps réel, représentant l’activité journalière de ce que vous voulez (activités humaines, activités géologiques, activités climatiques..) sur une zone de votre choix (terre, continent, pays, ville…).

L’idée du projet est principalement de mettre en place la partie extraction des données et stockage, pas forcément la partie analyse et visualisation.

A partir de sources de données temps réel, vous devez récupérer les données en 3 étapes :

  1. Créer un script téléchargeant les données de l’API toutes les minutes (ou heures selon la source)
    • Script bash
    • Dans un fichier JSON (ou XML)
    • Stocké dans un répertoire dédié, avec un nom de fichier explicite sur la date et l’horaire de téléchargement (format au choix)
    • Définir la tâche chron à associé pour la programmation automatique de ce script
  2. Créer un script résumant les données stockées dans les fichiers toutes les heures (ou tous les jours selon la source)
    • Script Python ou R
    • Stockage du résultat dans Mongo
    • Suppression des fichiers résumés
    • Définir la tâche chron à associé pour la programmation automatique de ce script
  3. Créer un script d’analyse des données tous les jours (ou semaines voire mois selon la source)
    • Script Python ou R
    • Génération d’un fichier PDF ou d’une appli web (shiny ou streamlit)
    • Définir la tâche chron à associé pour la programmation automatique de ce script

Contraintes

Livrables à rendre