Statistiques sous `Python`¶

Nous allons utiliser dans ce TP le module pandas facilitant la manipulation de données avec Python. Nous allons aussi utiliser les modules matplotlib et scipy.

Il faut tout d'abord importer ces modules. La dernière ligne permettra de voir le résultat des graphiques dans le document.

import matplotlib.pyplot
import pandas
import scipy.stats
import numpy

%matplotlib inline

Données¶

Nous allons travailler sur les données tips. Vous pouvez trouver des informations (ici). Voici comment lire ces données dans python avec read_csv() de pandas.

# Lecture d'un fichier texte
tips = pandas.read_csv("tips.csv", header = 0, sep = ",")
tips.head()

Sur ces données, il est bien évidemment possible de voir quelques informations classiques.

type(tips)

pandas.core.frame.DataFrame

# informations diverses
tips.shape

(244, 7)

tips.count()

total_bill    244
tip           244
sex           244
smoker        244
day           244
time          244
size          244
dtype: int64

tips.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 244 entries, 0 to 243
Data columns (total 7 columns):
total_bill    244 non-null float64
tip           244 non-null float64
sex           244 non-null object
smoker        244 non-null object
day           244 non-null object
time          244 non-null object
size          244 non-null int64
dtypes: float64(2), int64(1), object(4)
memory usage: 13.5+ KB

list(tips.columns)

['total_bill', 'tip', 'sex', 'smoker', 'day', 'time', 'size']

list(tips)

['total_bill', 'tip', 'sex', 'smoker', 'day', 'time', 'size']

Manipulation de données¶

Une fois qu'on a des données, la première chose qu'on souhaite savoir faire souvent, est de pouvoir manipuler ces données; C'est-à-dire réaliser les opérations classiques en bases de données, à savoir :

Restriction
Projection
Tri et limitation des résultats
Ajout de nouvelles variables (via des valeurs ou un calcul à partir des autres)
Agrégats
Jointures (qui ne seront pas vues ici)

Il y a d'autres opérations, spécifiques à Python, qu'on ne verra pas ici. La dernière opération que l'on verra est la modification de la forme du tableau de données.

Note Bene : certaines fonctions renvoient un nouvel objet qu'il faudra donc stocker dans une variable (nouvelle ou la même). Par contre, d'autres fonctions modifient directement l'objet en question.

Restriction¶

Première étape essentiel, cela consiste à sélectionner un certain nombre de lignes de la table, selon une condition sur les valeurs des variables. Il exite pour cela la fonction query() prenant en paramètre une chaîne de caractères contenant la condition à appliquer. Voici quelques exemples de condition. Il y a bien évidemment beaucoup d'autres fonctions existantes, en particuliers pour les chaînes.

tips.query('total_bill > 48') # que les factures de plus de 48$

tips.query('day.isin(("Sat", "Sun"))') # que les factures ayant eu lieu un samedi ou un dimanche

tips.query('size > 4 & sex == "Male"') # que les tables de plus de 4 convives et payées par un homme

Projection¶

Deuxième étape, celle-ci consiste tout simple à sélectionner certaines colonnes de la tables. En python, on utilise la fonction filter(). Il faut noter que celle-ci peut aussi fonctionner sur les lignes (quand celles-ci ont un index - pas vu ici).

tips.filter(["sex", "total_bill"])

Quand on fait ce genre d'opérations, il est courant que nous nous retrouvions avec des lignes identiques. Pour supprimer les doublons, nous utilisons la fonction drop_duplicates() sur le résultat.

tips.filter(["sex", "smoker"]).drop_duplicates()

Tri et limitation des résultats¶

Pour le tri, il existe la fonction sort_values(), dans laquelle on indique la ou les variables à utiliser pour le tri. Si on veut un tri descendant, on modifie la valeur du paramètre ascending (True par défaut).

tips.sort_values(by = "total_bill")

tips.sort_values(by = "total_bill", ascending = False)

Pour se limiter aux premières lignes (respectivement les dernières), on utilise la fonction head() (resp. tail()), qui affiche par défaut 5 lignes. Cette valeur est bien évidemment modifiable, comme vu ci-après.

tips.head(10) # 5 premières lignes par défaut

tips.tail(3) # 5 premières lignes par défaut

Ajout de nouvelles variables¶

Il y a 2 possibilités ici :

à partir de valeurs déjà connues
à partir d'un calcul basé sur les autres variables

A partir de valeurs, soit vous en fournissez autant que de lignes, soit une seule qui sera donc dupliquée à toutes les lignes

tips['n_row'] = range(244)
tips['nouv'] = "nouvelle valeur"
tips.head()

Bien évidemment, on souhaite généralement faire un calcul à partir des autres variables. Ceci peut se faire avec la fonction assign().

# attention ici, l.size fait référence à la taille de l, car c'est un mot clé de python
tips.assign(per_person = lambda l: round(l.total_bill / l['size'], 2))

Agrégat¶

Le calcul d'un agrégat permet de calculer une statistique de base (dénombrement, somme, moyenne, minimum, maximum - rarement autre chose) sur un tableau de données. On peut soit calculer globalement, soit pour chaque modalité d'une variable (voire chaque couple de modalités de plusieurs variables).

Pour le faire globalement, on utilise la fonction aggregate() (ou agg()).

tips.filter(["total_bill", "tip", "size"]).aggregate(['count', "mean"])

Pour le faire pour chaque modalité d'une variable, on utilise la fonction groupby() en plus. Si on ne réalise qu'un seul calcul, on a directement les fonctions associées.

tips.filter(["sex", "total_bill", "tip", "size"]).groupby("sex").mean()

Si on a plusieurs variables dans le regroupement, le calcul se fait donc pour chaque couple de modalités de celles-ci.

tips.filter(["sex", "smoker", "total_bill", "tip", "size"]).groupby(["sex", "smoker"]).mean()

Modification du format d'un data frame (reshaping)¶

Traditionnellement, en statistique, les tableaux sont présentés sous la forme individus décrits par des variables, comme le tableau tips par exemple.

tips.head()

Parfois, il est utile (voire nécessaire) de modifier, via une pseudo-rotation, en un tableau avec une colonne (ou plusieurs) indiquant l'individu concerné, une colonne indiquant la variable et une autre avec la valeur de celle-ci. Il est aussi possible d'avoir les données directement comme ceci (comme vous le verrez plus loin). Pour cela, nous utilisons la fonction melt(), dans laquelle on précise quel est l'identifiant de chaque ligne (celui-ci peut être sur plusieurs colonnes).

tips2 = tips.melt(id_vars = "n_row")
tips2

Pour revenir à une présentation classique, il faut donc faire la aussi une pseudo-rotation, mais inverse cette fois-ci. Pour cela, nous utilisons la fonction pivot(), comme ci-dessous.

pandas.pivot(tips2, index = "n_row", columns = "variable", values = "value")

Statistiques descriptives univariés¶

La fonction describe() permet de décrire toutes les variables quantitatives d'un jeu de données directement.

# résumé basique
tips.describe()

tips.describe().round(2)

Quantitative¶

Il est possible de sélectionner les variables soit via les crochets [], soit par un point ..

Les fonctions ci-dessous permettent de décrire une variable quantitative (ici "total_bill").

tips.total_bill.describe()

count    244.000000
mean      19.785943
std        8.902412
min        3.070000
25%       13.347500
50%       17.795000
75%       24.127500
max       50.810000
Name: total_bill, dtype: float64

tips["total_bill"].describe()

count    244.000000
mean      19.785943
std        8.902412
min        3.070000
25%       13.347500
50%       17.795000
75%       24.127500
max       50.810000
Name: total_bill, dtype: float64

tips.total_bill.mean()

19.78594262295082

tips.total_bill.std()

8.902411954856856

tips.total_bill.var()

79.25293861397827

tips.total_bill.min()

3.07

tips.total_bill.max()

50.81

tips.total_bill.median()

17.795

tips.total_bill.quantile([.01, .1, .9, .99])

0.01     7.250
0.10    10.340
0.90    32.235
0.99    48.227
Name: total_bill, dtype: float64

scipy.stats.normaltest(tips.total_bill)

NormaltestResult(statistic=45.11781912347332, pvalue=1.5951078766352608e-10)

scipy.stats.shapiro(tips.total_bill)

(0.9197188019752502, 3.3245434183371003e-10)

Histogramme¶

Pour représenter graphiquement cette variable, pandas met à disposition (via le module matplotlib utilisé par pandas) des fonctions graphiques.

Pour réaliser un histogramme, nous utilisons la fonction hist(). Celle-ci peut prendre des options. La fonction plot() avec le paramètre kind avec la valeur "hist" revient au même résultat.

tips.plot.hist()

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb97cd76d8>

tips.total_bill.hist()

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb95c0cb00>

tips.total_bill.hist(bins = 20)

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb954a4c88>

tips.total_bill.plot(kind = "hist")

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb954345c0>

tips.total_bill.plot(kind = "hist", density = True)

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb97cd70f0>

tips.total_bill.plot(kind = "kde")

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb9532de80>

Pour avoir la densité et l'histogramme sur le même graphique, il est nécessaire de compiler les deux lignes suivantes ensemble.

tips.total_bill.plot(kind = "hist", normed = True, color = "lightgrey")
tips.total_bill.plot(kind = "kde")

/home/jollois/.local/lib/python3.6/site-packages/pandas/plotting/_matplotlib/hist.py:62: MatplotlibDeprecationWarning: 
The 'normed' kwarg was deprecated in Matplotlib 2.1 and will be removed in 3.1. Use 'density' instead.
  n, bins, patches = ax.hist(y, bins=bins, bottom=bottom, **kwds)

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb952f32b0>

Boîtes à moustaches¶

Enfin, pour les boîtes à moustaches, il faut passer par le DataFrame pour l'afficher, et choisir une variable spécifiquement éventuellement.

tips.boxplot()

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb9528f048>

tips.boxplot(column = "total_bill")

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb95198748>

tips.boxplot(column = "total_bill", grid = False)

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb9518be10>

Qualitative¶

Pour les variables qualitatives, il y a plusieurs façons de faire pour obtenir la table d'occurences (ou des effectifs), ainsi que la table des proportions des modalités.

tips.sex.describe()

count      244
unique       2
top       Male
freq       157
Name: sex, dtype: object

tips.sex.unique()

array(['Female', 'Male'], dtype=object)

tips.sex.value_counts()

Male      157
Female     87
Name: sex, dtype: int64

pandas.crosstab(tips.sex, "freq")

pandas.crosstab(tips.sex, "freq", normalize=True)

t = pandas.crosstab(tips.sex, "freq")
scipy.stats.chisquare(t)

Power_divergenceResult(statistic=array([20.08196721]), pvalue=array([7.41929371e-06]))

Diagramme en barres¶

Ensuite, pour réaliser un diagramme en barres, nous utilisons le type "bar" pour plot(). Les calculs de proportions précédents nous permettent d'afficher une représentation des proportions plutôt que des effectifs.

t = pandas.crosstab(tips.sex, "freq")
t.plot.bar()

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb95093470>

t.plot(kind = "bar")

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb95059898>

t = pandas.crosstab(tips.sex, "freq", normalize=True)
t.plot(kind = "bar")

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb94fe1048>

(t * 100).plot(kind = "bar")

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb94fc95f8>

Diagramme circulaire¶

Et pour un diagramme circulaire, seul le tableau des effectifs produit par value_counts() nous permet de le réaliser.

t = pandas.crosstab(tips.sex, "freq")
t.plot.pie(subplots=True, figsize = (6, 6))

array([<matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94f312b0>],
      dtype=object)

Statistiques descriptives bivariées¶

Quantitative - quantitative¶

tips.corr()

tips.total_bill.corr(tips.tip)

0.6757341092113641

tips.total_bill.cov(tips.tip)

8.323501629224854

scipy.stats.pearsonr(tips.total_bill, tips.tip)

(0.6757341092113647, 6.6924706468630016e-34)

scipy.stats.kendalltau(tips.total_bill, tips.tip)

KendalltauResult(correlation=0.517180972142381, pvalue=2.4455728480214792e-32)

Nuage de points¶

tips.plot.scatter("total_bill", "tip")

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb97d29f60>

pandas.plotting.scatter_matrix(tips)

array([[<matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94e7b6a0>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94e1ab00>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94dd8080>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94e094a8>],
       [<matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94dbaa20>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94d6bfd0>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94d285c0>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94cdaba8>],
       [<matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94cdabe0>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94cca710>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94c7acc0>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94c382b0>],
       [<matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94be7860>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94b9de10>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94b57400>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb94b8a9b0>]],
      dtype=object)

Qualitative - qualitative¶

pandas.crosstab(tips.sex, tips.smoker)

pandas.crosstab(tips.sex, tips.smoker, margins=True)

pandas.crosstab(tips.sex, tips.smoker, normalize = True)

pandas.crosstab(tips.sex, tips.smoker, normalize = "index")

pandas.crosstab(tips.sex, tips.smoker, normalize = "index", margins=True)

pandas.crosstab(tips.sex, tips.smoker, normalize = "columns")

pandas.crosstab(tips.sex, tips.smoker, normalize = "columns", margins=True)

t = pandas.crosstab(tips.sex, tips.smoker)
scipy.stats.chi2_contingency(t)

(0.008763290531773594, 0.925417020494423, 1, array([[53.84016393, 33.15983607],
        [97.15983607, 59.84016393]]))

Diagramme en barres¶

t = pandas.crosstab(tips.sex, tips.smoker)
t.plot.bar()

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb97d1b828>

t = pandas.crosstab(tips.sex, tips.smoker, normalize=True)
t.plot.bar()

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb941536d8>

t = pandas.crosstab(tips.sex, tips.smoker, normalize="index")
t.plot.bar(stacked=True)

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb94112748>

t = pandas.crosstab(tips.sex, tips.smoker)
t.plot.pie(subplots=True, figsize = (12, 6))

array([<matplotlib.axes._subplots.AxesSubplot object at 0x7fdb940acf28>,
       <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb9405c550>],
      dtype=object)

Qualitative - quantitative¶

tips.groupby("sex").mean()

tips.groupby("sex")["total_bill"].agg([numpy.mean, numpy.std, numpy.median, numpy.min, numpy.max])

billFemale = tips.total_bill[tips.sex == "Female"]
billMale = tips.total_bill[tips.sex == "Male"]
scipy.stats.ttest_ind(billFemale, billMale)

Ttest_indResult(statistic=-2.2777940289803134, pvalue=0.0236116668468594)

billGrouped = [tips.total_bill[tips.sex == s] for s in list(tips.sex.unique())]
scipy.stats.f_oneway(*billGrouped)

F_onewayResult(statistic=5.188345638458361, pvalue=0.023611666846859697)

tips.hist(column = "total_bill", by = "sex")

array([<matplotlib.axes._subplots.AxesSubplot object at 0x7fdb8ee31dd8>,
       <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb8ee64eb8>],
      dtype=object)

tips.boxplot(by = "sex")

array([[<matplotlib.axes._subplots.AxesSubplot object at 0x7fdb9402dc18>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb8eef8c18>],
       [<matplotlib.axes._subplots.AxesSubplot object at 0x7fdb8eeab9e8>,
        <matplotlib.axes._subplots.AxesSubplot object at 0x7fdb8edf0828>]],
      dtype=object)

tips.boxplot(column = "total_bill", by = "sex")

<matplotlib.axes._subplots.AxesSubplot at 0x7fdb8ef4c6a0>

Exercices¶

Worldwide Governance Indicators (WGI)¶

A partir du fichier WGI_Data.csv, qui donne certains indicateurs sur la gouvernance des pays (plus d'infos sur cette page), réaliser les étapes suivantes :

Reconstruire un tableau avec en ligne les pays (on souhaite avoir le nom et le code) et en colonnes les 6 variables (en simplifiant les noms).
Donner les informations de la France
Donner les informations de 5 pays européens
Trouver les 10 pays ayant les valeurs les plus hautes pour Control of Corruption
Donner les valeurs moyennes, minimales et maximales de chaque indicateurs
Donner les pays avec les valeurs minimales pour chaque indicateur (en plusieurs commandes)

Diamonds¶

A partir du fichier diamonds.csv (voir l'aide ici), analyser les données suivant le déroulement classique

Description de chaque variable
Recherche des liens entre le prix (price) et les autres variables

Pour cela, écrire un notebook propre, avec du texte clair, du code et des graphiques le plus propre possible.

	total_bill	tip	sex	smoker	day	time	size
0	16.99	1.01	Female	No	Sun	Dinner	2
1	10.34	1.66	Male	No	Sun	Dinner	3
2	21.01	3.50	Male	No	Sun	Dinner	3
3	23.68	3.31	Male	No	Sun	Dinner	2
4	24.59	3.61	Female	No	Sun	Dinner	4
...	...	...	...	...	...	...	...
238	35.83	4.67	Female	No	Sat	Dinner	3
239	29.03	5.92	Male	No	Sat	Dinner	3
240	27.18	2.00	Female	Yes	Sat	Dinner	2
241	22.67	2.00	Male	Yes	Sat	Dinner	2
242	17.82	1.75	Male	No	Sat	Dinner	2

	total_bill	tip	sex	smoker	day	time	size
141	34.30	6.7	Male	No	Thur	Lunch	6
142	41.19	5.0	Male	No	Thur	Lunch	5
156	48.17	5.0	Male	No	Sun	Dinner	6
185	20.69	5.0	Male	No	Sun	Dinner	5
187	30.46	2.0	Male	Yes	Sun	Dinner	5
216	28.15	3.0	Male	Yes	Sat	Dinner	5

	total_bill	tip	sex	smoker	day	time	size
67	3.07	1.00	Female	Yes	Sat	Dinner	1
92	5.75	1.00	Female	Yes	Fri	Dinner	2
111	7.25	1.00	Female	No	Sat	Dinner	1
172	7.25	5.15	Male	Yes	Sun	Dinner	2
149	7.51	2.00	Male	No	Thur	Lunch	2
...	...	...	...	...	...	...	...
182	45.35	3.50	Male	Yes	Sun	Dinner	3
156	48.17	5.00	Male	No	Sun	Dinner	6
59	48.27	6.73	Male	No	Sat	Dinner	4
212	48.33	9.00	Male	No	Sat	Dinner	4
170	50.81	10.00	Male	Yes	Sat	Dinner	3

	total_bill	tip	sex	smoker	day	time	size
170	50.81	10.00	Male	Yes	Sat	Dinner	3
212	48.33	9.00	Male	No	Sat	Dinner	4
59	48.27	6.73	Male	No	Sat	Dinner	4
156	48.17	5.00	Male	No	Sun	Dinner	6
182	45.35	3.50	Male	Yes	Sun	Dinner	3
...	...	...	...	...	...	...	...
149	7.51	2.00	Male	No	Thur	Lunch	2
111	7.25	1.00	Female	No	Sat	Dinner	1
172	7.25	5.15	Male	Yes	Sun	Dinner	2
92	5.75	1.00	Female	Yes	Fri	Dinner	2
67	3.07	1.00	Female	Yes	Sat	Dinner	1

	total_bill	tip	sex	smoker	day	time	size	n_row	nouv	per_person
0	16.99	1.01	Female	No	Sun	Dinner	2	0	nouvelle valeur	8.49
1	10.34	1.66	Male	No	Sun	Dinner	3	1	nouvelle valeur	3.45
2	21.01	3.50	Male	No	Sun	Dinner	3	2	nouvelle valeur	7.00
3	23.68	3.31	Male	No	Sun	Dinner	2	3	nouvelle valeur	11.84
4	24.59	3.61	Female	No	Sun	Dinner	4	4	nouvelle valeur	6.15
...	...	...	...	...	...	...	...	...	...	...
239	29.03	5.92	Male	No	Sat	Dinner	3	239	nouvelle valeur	9.68
240	27.18	2.00	Female	Yes	Sat	Dinner	2	240	nouvelle valeur	13.59
241	22.67	2.00	Male	Yes	Sat	Dinner	2	241	nouvelle valeur	11.34
242	17.82	1.75	Male	No	Sat	Dinner	2	242	nouvelle valeur	8.91
243	18.78	3.00	Female	No	Thur	Dinner	2	243	nouvelle valeur	9.39

	total_bill	tip	size
count	244.000000	244.000000	244.000000
mean	19.785943	2.998279	2.569672

	total_bill	tip	size
sex
Female	18.056897	2.833448	2.459770
Male	20.744076	3.089618	2.630573

		total_bill	tip	size
sex	smoker
Female	No	18.105185	2.773519	2.592593
Female	Yes	17.977879	2.931515	2.242424
Male	No	19.791237	3.113402	2.711340
Male	Yes	22.284500	3.051167	2.500000

	total_bill	tip	size	n_row
count	244.00	244.00	244.00	244.00
mean	19.79	3.00	2.57	121.50
std	8.90	1.38	0.95	70.58
min	3.07	1.00	1.00	0.00
25%	13.35	2.00	2.00	60.75
50%	17.80	2.90	2.00	121.50
75%	24.13	3.56	3.00	182.25
max	50.81	10.00	6.00	243.00

	total_bill	tip	size	n_row
total_bill	1.000000	0.675734	0.598315	0.044526
tip	0.675734	1.000000	0.489299	-0.026709
size	0.598315	0.489299	1.000000	0.008061
n_row	0.044526	-0.026709	0.008061	1.000000

smoker	No	Yes
sex
Female	0.620690	0.379310
Male	0.617834	0.382166
All	0.618852	0.381148

smoker	No	Yes	All
sex
Female	0.357616	0.354839	0.356557
Male	0.642384	0.645161	0.643443

	mean	std	median	amin	amax
sex
Female	18.056897	8.009209	16.40	3.07	44.30
Male	20.744076	9.246469	18.35	7.25	50.81

Statistiques sous Python¶

Données¶

Manipulation de données¶

Restriction¶

Projection¶

Tri et limitation des résultats¶

Ajout de nouvelles variables¶

Agrégat¶

Modification du format d'un data frame (reshaping)¶

Statistiques descriptives univariés¶

Quantitative¶

Histogramme¶

Boîtes à moustaches¶

Qualitative¶

Diagramme en barres¶

Diagramme circulaire¶

Statistiques descriptives bivariées¶

Quantitative - quantitative¶

Nuage de points¶

Qualitative - qualitative¶

Diagramme en barres¶

Qualitative - quantitative¶

Exercices¶

Worldwide Governance Indicators (WGI)¶

Diamonds¶

Statistiques sous `Python`¶