cours-2025-2026 | Supports de mes cours pour l'année 2025-2026 | FX Jollois

Statistiques descriptives sur tableur - Univarié

Nous allons travailler sur les données contenues dans le fichier tips, au format Excel (à télécharger donc).

Nota Bene : les noms des fonctions dans ce document sont valables dans Excel. Il est possible que certains soient différents dans les autres tableurs (me demander si cela ne fonctionne pas dans votre outil).

Analyse d’une variable quantitative

Préparation de la feuille

Ajout des calculs

Avec un peu de mise en page, nous avons un ensemble d’informations permettant déjà de mieux connaître la distribution du montant payé.

Graphique

Il n’existe pas de fonction permettant de réaliser un histogramme directement dans les tableurs. Pour une variable quantitative, nous allons réaliser un diagramme en barres de la transformation en variable ordinale.

Pour réaliser cela, nous allons créer un tableau. Ecrivez en cellule D3 à F3 les mots suivants : Seuil, Occurences, Etiquette

Première étape

Pour faire notre tableau, nous devons réaliser une première étape de création des valeurs seuils. Nous allons choisir comme seuils, à placer dans le tableau en D4 et en dessous, les valeurs 0, 10, 15, 20, 25, 30, 35 et “>35”.

Deuxième étape

Pour calculer le nombre de valeurs entre 2 seuils, nous allons utiliser la fonction FREQUENCE(). Elle prend en première paramètre les données (toujours tips.A:A) et en deuxième paramètre, la liste des seuils. Ecrivez la formule suivante en cellule E4 : =FREQUENCE(tips!A:A;D4:D11)

Une fois cela fait, vous remarquerez que des valeurs se sont ajoutées sur les cellules en dessous. La valeur en E4 est 0 car aucune valeur n’est inférieure à 0 dans les données. Ensuite, la valeur dans la cellule E5 indique qu’il y a 17 valeurs entre 0 et 10. Et ainsi de suite. La somme des valeurs entre E4 et E11 est bien égale à 244 (i.e. le nombre de lignes du tableau).

Troisième étape

Nous allons créer automatiquement des étiquettes pour chaque modalité. Pour cela, écrivez en cellule F5 la formule suivante :

=CONCAT("Entre ";D4;" et ";D5)

Une fois cela fait, dupliquez à l’aide de la souris cette formule aux cellules situées en dessous (clic droit maintenu sur le coin inférieur droit à la cellule et déplacer vers le bas). Vous pouvez éventuellement changez le texte de la dernière étiquette pour mettre seulement “>35” par exemple.

Quatrième étape

Sélectionner les occurences (cellules E5 à E11) et cliquer dans le menu Insertion -> Graphiques recommandés (ou sur l’icône dédiée). On va choisir Histogramme, même si c’est un diagramme en barres.

Nous avons la répartition des valeurs selon des intervalles dont nous avons choisi les seuils.

On peut améliorer ce graphique en modifiant les libellés des axes, en ajoutant un titre… N’hésitez pas à tester, en particulier ce qui est ci-dessous.

avec Excel

Dans le menu Conception de la carte, cliquer sur Sélectionner des données. Puis, dans la partie Etiquettes, vous pouvez soit aller sélectionner les étiquettes directement, soit écrire F5:F11.

avec Google Sheets

Dans l’éditeur graphique (à droite), cliquer sur Ajouter Axe X, puis cliquer l’icône tableau à droite. Puis, vous pouvez soit aller sélectionner les étiquettes directement, soit écrire F5:F11.

avec LibreOffice

Dans la partie Séries de données, après avoir cliquer dans la zone Catégories, cliquez sur l’icône à droite pour sélectionner la plage F5:F11 (ou écrivez directement F5:F11). Puis cliquez sur Terminer.

Analyse d’une variable qualitative

On va faire ici une première version à la main. Nous verrons plus tard comment faire autrement.

Partie numérique

Réalisation d’un diagramme en barres ou circulaire

De la même façon que précédemment, vous pouvez réaliser un diagramme en barres en sélectionnant soit la plage des occurences, soit celles de proportions.

Réaliser les deux types de graphiques

A FAIRE

Reproduisez les mêmes opérations pour la variable quantitative tip (pourboire) dans une nouvelle feuille

Reproduisez ces opérations pour les variables qualitatives sex et size dans une nouvelle feuille à chaque fois

Compléments

Compléter l’analyse à chaque variable non encore analysée.