Reprendre fichier tips.csv
:
1ère étape :
- Calculer moyenne et écart-type de total_bill (colonne
A:A
) dans les cellules M2
et M3
(par exemple)
- Calculer les bornes d’un intervalle basé sur la moyenne \(+\) ou \(-\) 2 \(\times\) l’écart-type, en écrivant dans les
cellules
M5
et M6
les formules suivantes :
=M2-2*M3
et =M2+2*M3
- Creér une colonne indiquant si la valeur de
total_bill
est dans cet intervalle (en indiquant OUI et NON par
exemple), en écrivant dans la cellule H2
la formule
=SI(A2>$M$5;SI(A2<$M$6;"OUI";"NON");"NON")
- Dupliquer la formule pour toutes les lignes
- Calculer la répartition des réponses de la colonne
H
- Avec un tableau croisé dynamique par exemple
On trouve qu’environ 95% des valeurs sont dans l’intervalle et donc
5% en dehors
2ème étape :
- Dans une nouvelle feuille, créer une liste de valeur allant de -5 à
5 par pas de \(0.25\) à partir de la
cellule
A2
(et en-dessous)
- Ecrire Densité et Répartition sur la première
ligne
- Ecrire dans
B2
la formule
=LOI.NORMALE(A2;0;1;0)
- Ceci calcule la densité de probabilité d’une loi normale \(N(0,1)\) pour la valeur dans
A2
- Ecrire dans
C2
la formule
=LOI.NORMALE(A2;0;1;1)
- Ici, nous avons la fonction de répartition de la même loi
normale
- Dupliquer les formules pour toutes les valeurs de la colonne
A
- Sélectionner les 3 colonnes et ajouter un graphique
- Choisir XY (dispersion) avec que les lignes
Nous retrouvons la forme de la loi normale vue en cours
3ème étape :
- Repérer la ligne 14, pour laquelle la valeur dans la colonne
A
est égale à -2
- La valeur de la colonne
C
est la valeur de la fonction
de répartition, i.e. \(P(X <
-2)\)
- C’est-à-dire la probabilité qu’une valeur issue d’une loi normale
\(N(0;1)\) soit inférieure à 2
- On a donc environ 2,2% de chance qu’une valeur soit inférieure à
-2
- Idem ligne 30 correspondant à 2
- On a donc environ 97,7% de chance qu’une valeur soit inféreure à
2
Je peux en conclure que j’ai 95,5% environ de chance d’avoir une
valeur comprise entre -2 et 2
4ème étape :
- Dans une nouvelle feuille, créer une liste de valeurs : \(0.025\), \(0.05\), \(0.10\), \(0.9\), \(0.95\) et \(0.975\)
- Ecrire Valeur
- Dans
B2
, écrire la formule
=LOI.NORMALE.INVERSE(A2;0;1)
- Ceci calcule la valeur x pour laquelle \(P(X < x) = 0.025\)
- Dupliquer les formules pour toutes les valeurs de la colonne
A
- Il est normal que cela ne fonctionne pas pour 0 et 1
- Repérer la ligne 3, pour laquelle on a \(0.025\)
- Ceci indique qu’il y a \(2.5\) % de
chance d’avoir une valeur inférieure à \(1.96\) pour une loi normale \(N(0,1)\)
- Idem ligne 7, pour laquelle on a \(0.975\)
- nous avons la même valeur, \(1.96\)
Ceci implique qu’il y a 95% de chances d’avoir une valeur entre -1,96
et 1,96 pour une loi normale \(N(0,1)\)
5ème étape
- Dans la feuille avec les données
tips
, écrire dans
I2
la formule suivante
=(A2-moyenne)/ecart-type
- Calculer le nombre de valeurs de cette colonne comprise entre \(-1.96\) et \(1.96\)
- oin retrouve la même répartition
Si \(X\) suit une loi normale \(N(m,\sigma)\), il est possible de passer à
une v.a. \(Y\) de loi normale \(N(0,1)\) en réalisant deux opérations :
enlever la moyenne et diviser par l’écart-type
\[
Y = \frac{X - m}{\sigma}
\]
A faire
- Calculer les bornes de l’intervalle comprenant 95% des valeurs de la
colonne
tip
(B
)
- Regarder la répartition des valeurs dans cet intervalle et
en-dehors
- Faire de même pour la variable
size
. Est-ce pertinent
?