Le travail est à faire en autonomie et à déposer sur cette page. Il faut y mettre votre fichier .ipynb
à télécharger en cliquant sur :
File -> Download as -> Notebook (.ipynb)
Nous travaillerons les données de production d'électricité au niveau national, fournies par ENEDIS et disponibles directement sur cette page.
Celles-ci ont été travaillées pour obtenir le fichier Production.csv
, dont le contenu est présenté ci-dessous.
import pandas
pandas.read_csv("https://fxjollois.github.io/cours-2022-2023/insa-ms-esd--ml/Production.csv", delimiter = ";")
date | Filière de production | Plage de puissance injection | Total | |
---|---|---|---|---|
0 | 2018-01-01 | F0 : Total toutes filières | P0 : Total toutes puissances | 282288260320 |
1 | 2018-01-01 | F0 : Total toutes filières | P1 : ]0 - 3] kW | 2081998048 |
2 | 2018-01-01 | F0 : Total toutes filières | P2 : ]3 - 9] kW | 375723566 |
3 | 2018-01-01 | F0 : Total toutes filières | P3 : ]9 - 100] kW | 1550524687 |
4 | 2018-01-01 | F0 : Total toutes filières | P4 : ]100 - 250] kW | 2660935897 |
... | ... | ... | ... | ... |
71507 | 2021-06-30 | F6 : Autres | P3 : ]9 - 100] kW | 28401076 |
71508 | 2021-06-30 | F6 : Autres | P4 : ]100 - 250] kW | 10975153 |
71509 | 2021-06-30 | F6 : Autres | P5 : ]250 - 1000] kW | 364832 |
71510 | 2021-06-30 | F6 : Autres | P6 : ]1000 - 12000] kW | 200862197 |
71511 | 2021-06-30 | F6 : Autres | P7 : > 12000 kW | 0 |
71512 rows × 4 columns
Voici le détails des colonnes, dont vous trouverez un explicatif plus précis sur ce document :
date
: jour de production (entre janvier 2018 et juin 2021)Filière de production
: type de filière (de F0 à F6)Plage de puissance injection
: plage de puissance (de P0 à P7)Total
: total de la puissance produite ce jour-laPour cette première partie, nous voulons voir si certaines filières sont liées à certaines plages, et inversement. Pour cela, nous étudions le tableau Filière x Plage comme une table de contingence particulière.
Nous souhaitons analyser les jours de production en fonction :
Il faut donc faire deux analyses, une pour chaque type de variable. Il vous faudra avant transformer les données pour avoir en colonnes les filières (respectivement les plages), et dans chaque cellule le total de la production de jour pour chaque filière (resp. chaque plage).
Au final, nous voulons une segmentation expliquée des jours en fonction de la filière de production d'une part, et en fonction de la plage d'autre part. Vous devez détailler le cheminement pour avoir la segmentation. Et vous devrez la présenter du mieux possible, en particulier à l'aide de graphiques. Vous devez aussi vous demander si les jours dans chaque classe ont une signification particulière.