Nous allons travailler sur les données contenu dans le fichier
tips
, dont vous devez télécharger une version selon votre
logiciel :
Nota Bene : les noms des fonctions dans ce document sont valables dans Libre Office. Il est possible que certains soient différents dans les autres tableurs (me demander si cela ne fonctionne pas dans votre outil).
montant
par exemple)A1
, écrivez Montant de la table (et
mettez le en gras)A3
et A4
, écrivez Moyenne
et Ecart-typeA6
et en dessous, écrivez Minimum,
Q1, Médiane, Q3 et MaximumA12
, vous écrivez % et à
droite (case B12
) Centile. En case
A13
et en dessous, écrivez 1, 10, 90, 99B3
, écrivez la formule suivante :
=MOYENNE(tips.a:a)
=MOYENNE(tips!a:a)
(le "."
est remplacé par un
"!"
)ECARTYPE.PEARSON()
qu’il faut utiliser (sur la même colonne)MIN()
, MAX()
et MEDIANE()
QUARTILE()
,
qui demande deux paramètres (séparés par un ";"
) :
tips.A:A
)CENTILE()
qui
prend 2 paramètres :
tips.A:A
)B13
, qu’il faudra
dupliquer sur les cellules en dessous donc=CENTILE(tips.A:A;A13/100)
Avec un peu de mise en page, nous avons un ensemble d’informations permettant déjà de mieux connaître la distribution du montant payé.
Il n’existe pas de fonction permettant de réaliser un histogramme directement dans les tableurs. Pour une variable quantitative, nous allons réaliser un diagramme en barres de la transformation en variable ordinale.
Pour réaliser cela, nous allons créer un tableau. Ecrivez en cellule
D3
à F3
les mots suivants : Seuil,
Occurences, Etiquette
Pour faire notre tableau, nous devons réaliser une première étape de
création des valeurs seuils. Nous allons choisir comme seuils, à placer
dans le tableau en D4
et en dessous, les valeurs 0, 10,
15, 20, 25, 30, 35 et “>35”.
Pour calculer le nombre de valeurs entre 2 seuils, nous allons
utiliser la fonction FREQUENCE()
. Elle prend en première
paramètre les données (toujours tips.A:A
) et en deuxième
paramètre, la liste des seuils. Ecrivez la formule suivante en cellule
E4
:
=FREQUENCE(tips.A:A;D4:D11)
=FREQUENCE(tips!A:A;D4:D11)
Une fois cela fait, vous remarquerez que des valeurs se sont ajoutées
sur les cellules en dessous. La valeur en E4
est 0 car
aucune valeur n’est inférieure à 0 dans les données. Ensuite, la valeur
dans la cellule E5
indique qu’il y a 17 valeurs entre 0 et
10. Et ainsi de suite. La somme des valeurs entre E4
et
E11
est bien égale à 244 (i.e. le nombre de lignes
du tableau).
Nous allons créer automatiquement des étiquettes pour chaque
modalité. Pour cela, écrivez en cellule F5
la formule
suivante :
=CONCAT("Entre ";D4;" et ";D5)
Une fois cela fait, dupliquez à l’aide de la souris cette formule aux cellules situées en dessous (clic droit maintenu sur le coin inférieur droit à la cellule et déplacer vers le bas). Vous pouvez éventuellement changez le texte de la dernière étiquette pour mettre seulement “>35” par exemple.
Sélectionner les occurences (cellules E5
à
E11
) et cliquer dans le menu Insertion ->
Diagramme (ou sur l’icône dédiée). On va garder comme type de
diagramme celui en colonne.
Nous avons la répartition des valeurs selon des intervalles dont nous avons choisi les seuils.
On peut améliorer ce graphique en modifiant les libellés des axes, en ajoutant un titre… N’hésitez pas à tester, en particulier ce qui est ci-dessous.
Dans la partie Séries de données, après avoir cliquer dans
la zone Catégories, cliquez sur l’icône à droite pour
sélectionner la plage F5:F11
(ou écrivez directement
F5:F11
). Puis cliquez sur Terminer.
Dans le menu Conception de la carte, cliquer sur
Sélectionner des données. Puis, dans la partie
Etiquettes, vous pouvez soit aller sélectionner les étiquettes
directement, soit écrire F5:F11
.
Dans l’éditeur graphique (à droite), cliquer sur Ajouter
Axe X, puis cliquer l’icône tableau à droite. Puis, vous pouvez
soit aller sélectionner les étiquettes directement, soit écrire
F5:F11
.
Reproduisez les mêmes opérations pour la variable
tip
(pourboire) dans une nouvelle feuille
On va faire ici une première version à la main. Nous verrons plus tard comment faire autrement.
jour
par
exemple)A1
, écrivez Jour de la semaine (et
mettez le en gras)A3
, écrivez Jour et en B3
Nombre de tablesA4
à A7
.B4
, nous allons écrire la formule
suivante qui calculer le nombre de fois qu’apparaît la valeur de la
cellule A4
dans la colonne E
de la feuille
tips
:=NB.SI(tips.E:E;A4)
C3
le terme
ProportionC4
, nous allons calculer la part de la
cellule B4
sur la somme des cellules B4
à
B7
, en utilisant la formule suivante :=B4/SOMME($B$4:$B$7)
- Les `$` vont permettre de conserver les valeurs `B4` et `B7` de la formule lorsqu'on va la dupliquer aux cellules du dessous.
De la même façon que précédemment, vous pouvez réaliser un diagramme en barres en sélectionnant soit la plage des occurences, soit celles de proportions.
Réaliser les deux types de graphiques
Reproduisez ces opérations pour les variables
sex
etsize
dans une nouvelle feuille à chaque fois
Compléter l’analyse à chaque variable non encore analysée.