TP noté

Rendu par mail à l'adresse francois-xavier.jollois@u-paris.fr

  • Objet : [LP IoT] TP noté - NOM ($\rightarrow$ votre nom à mettre)
  • Sujet : un petit bonjour ne fait pas de mal
  • Pièce jointe : le fichier .ipynb à télécharger en cliquant sur File -> Download as -> Notebook (.ipynb)

Délai : A rendre avant la fin du TP le jour même

Données

Ce jeu de données restitue la production d'électricité par jour des points d'injection raccordés au réseau Enedis, par filière de production. Elles proviennent du site open data d'Enedis (plus d'informations, cliquez-ici.

Vous devez télécharger le fichier de données (au format csv), et qui s'importe comme ci-dessous.

In [1]:
import pandas

prod = pandas.read_csv("FilieresProduction.csv")
prod.head()
Out[1]:
Date F1 : Thermique non renouvelable F2 : Bioénergies F3 : Hydraulique F4 : Eolien F5 : Solaire F6 : Autres
0 20180101 3.810881e+10 1.499302e+10 1.531824e+10 2.080416e+11 7.040696e+09 137993136.0
1 20180102 3.862201e+10 1.457315e+10 1.579756e+10 1.525662e+11 5.392546e+09 136383120.0
2 20180103 3.812646e+10 1.414417e+10 1.525426e+10 2.081919e+11 5.503013e+09 230064480.0
3 20180104 3.852517e+10 1.486626e+10 1.398220e+10 1.905919e+11 5.847942e+09 327682464.0
4 20180105 3.891543e+10 1.491484e+10 1.366702e+10 1.140034e+11 7.785438e+09 328796976.0

A faire

Sous la forme d'un notebook le plus propre et le mieux organisé possible, vous devez :

  • Décrire les données (distribution des variables, évolution au cours du temps, données aberrantes)
  • Réaliser une ACP sur les données
    • en justifiant s'il faut ou non standardiser les variables au préalable
  • Représenter les jours sur le plan factoriel
    • commenter celui-ci
  • Décrire les axes en se basant sur le cercle des corrélations des variables
  • Déterminer un nombre de classes adapté à ce jeu de données, à l'aide d'une CAH
  • Trouver la partition des jours, avec le nombre de classes optimal obtenu ci-dessus
  • Décrire les classes et les comparer entre elles
  • Efectuer toutes les représentations qui vous semblent utiles pour décrire vos résultats et accompagner votre conclusion