cours-2024-2025 | Documents de mes cours pour 2024-2025 | FX Jollois
Nous allons continuer de travailler sur les données contenu dans le fichier tips
, dont voici les versions initiales si besoin :
Nota Bene : les noms des fonctions dans ce document sont valables dans Libre Office. Il est possible que certains soient différents dans les autres tableurs (me demander si cela ne fonctionne pas dans votre outil).
montant-tip
par exemple)A1
, écrivez Lien entre montant et pourboire (et mettez en gras)A3
, écrivez Corrélation et en case A4
la formule suivante :
=COEFFICIENT.CORRELATION(tips!A:A;tips!B:B)
=COEFFICIENT.CORRELATION(tips.A:A;tips.B:B)
tips!A:B
tips.A:B
et choisir Séries de données en colonnesOn obtient notre nuage de points
Réaliser le nuage de points avec le nombre de convives à la table (
size
) en X et le montant payé en Y dans une nouvelle feuille
Nous pourrions faire comme précédemment, mais cela prendrait du temps et ne serait pas automatique (en cas d’ajout d’une modalité - un jour de la semaine par exemple). Nous allons utiliser une fonctionnalité très utile des tableurs, à savoir le Tableau Croisé Dynamique ou la Table Dynamique (dénomination différente selon le talbeur utilisé).
tips
, sélectionnez les colonnes A
à G
day
dans l’espace Champs de ligne et sex
dans Champs de colonnestotal_bill
par exemple. Vous voyez que par défaut, l’opération associé est la Somme.Dans une nouvelle feuille, nous avons maintenant la table de contingence entre le jour de la semaine et le sexe de la personne qui paie la note.
Dans ce tableau, on a même un filtre automatique sur chaque variable (en ligne et en colonne).
Renommez cette feuille en lui donnant le titre jour-sexe
par exemple.
Si nous souhaitons avoir les profils lignes, nous pouvons changer le mode de calcul sur total_bill, en réalisant les opérations suivantes :
On remarque qu’ainsi, en général (ligne du bas), la répartition est 1/3 des notes payées par des femmes et 2/3 payées par des hommes. Par contre, on remarque de grosses différences entre les jours de la semaine : la semaine, c’est 50-50, alors que le week-end (particulièrement le dimanche) c’est 3 fois sur 4 un homme qui paie.
Vous avez un diagramme en barres empilées à 100% permettant de bien comparer les jours de la semaine entre eux.
Faire les profils colonnes
Analyser le lien entre le jour de la semaine et l’heure (
time
) d’une part, et entre le sexe et la présence de fumeurs à la table d’autre part.
Si vous avez fait attention, la table dynamique nous laisse la possibilité de calculer une moyenne dans chaque cellule.
day
dans Champs de ligne et total_bill
dans Champs de donnéesOn a les moyennes des montants payés par jour de la semaine.
Renommez la feuille en jour-montant
par exemple.
Nous ne pouvons malheureusement pas faire de boîtes à moustaches. Toutefois, nous pouvons réaliser un diagramme en barres (plutôt horizontales) permettant de voir la différence entre les jours de la semaine.
Ce graphique n’est pas correct statistiquement, mais permet tout de même de représenter la différence des moyennes entre les jours de la semaine
Analyser le lien entre le sex et le pourboire d’une part, et entre le jour de la semaine et le nombre de convives
Regarder tous les liens possibles avec le montant d’une part, et avec le pourboire d’autre part.