cours-2024-2025 | Documents de mes cours pour 2024-2025 | FX Jollois

Statistiques descriptives sur tableur - Bivarié

Nous allons continuer de travailler sur les données contenu dans le fichier tips, dont voici les versions initiales si besoin :

Nota Bene : les noms des fonctions dans ce document sont valables dans Libre Office. Il est possible que certains soient différents dans les autres tableurs (me demander si cela ne fonctionne pas dans votre outil).

Analyse du lien entre deux variables quantitatives

Partie numérique

Création du nuage de points

On obtient notre nuage de points

A FAIRE

Réaliser le nuage de points avec le nombre de convives à la table (size) en X et le montant payé en Y dans une nouvelle feuille

Analyse du lien entre deux variables qualitatives

Partie numérique

Nous pourrions faire comme précédemment, mais cela prendrait du temps et ne serait pas automatique (en cas d’ajout d’une modalité - un jour de la semaine par exemple). Nous allons utiliser une fonctionnalité très utile des tableurs, à savoir le Tableau Croisé Dynamique ou la Table Dynamique (dénomination différente selon le talbeur utilisé).

Dans une nouvelle feuille, nous avons maintenant la table de contingence entre le jour de la semaine et le sexe de la personne qui paie la note.

Dans ce tableau, on a même un filtre automatique sur chaque variable (en ligne et en colonne).

Renommez cette feuille en lui donnant le titre jour-sexe par exemple.

Création des profils lignes

Si nous souhaitons avoir les profils lignes, nous pouvons changer le mode de calcul sur total_bill, en réalisant les opérations suivantes :

On remarque qu’ainsi, en général (ligne du bas), la répartition est 1/3 des notes payées par des femmes et 2/3 payées par des hommes. Par contre, on remarque de grosses différences entre les jours de la semaine : la semaine, c’est 50-50, alors que le week-end (particulièrement le dimanche) c’est 3 fois sur 4 un homme qui paie.

Création du diagramme en barres empilées

Vous avez un diagramme en barres empilées à 100% permettant de bien comparer les jours de la semaine entre eux.

A FAIRE

Faire les profils colonnes

Analyser le lien entre le jour de la semaine et l’heure (time) d’une part, et entre le sexe et la présence de fumeurs à la table d’autre part.

Analyse du lien entre une variable qualitative et une variable quantitative

Partie numérique

Si vous avez fait attention, la table dynamique nous laisse la possibilité de calculer une moyenne dans chaque cellule.

On a les moyennes des montants payés par jour de la semaine.

Renommez la feuille en jour-montant par exemple.

Partie graphique

Nous ne pouvons malheureusement pas faire de boîtes à moustaches. Toutefois, nous pouvons réaliser un diagramme en barres (plutôt horizontales) permettant de voir la différence entre les jours de la semaine.

Ce graphique n’est pas correct statistiquement, mais permet tout de même de représenter la différence des moyennes entre les jours de la semaine

A FAIRE

Analyser le lien entre le sex et le pourboire d’une part, et entre le jour de la semaine et le nombre de convives

Compléments

Regarder tous les liens possibles avec le montant d’une part, et avec le pourboire d’autre part.