Fichier Excel de base à télécharger : base
Dans la première feuille Calculette intervalles, nous allons réaliser une petite calculatrice permettant d’obtenir les bornes de l’intervalle de confiance d’une moyenne. Pour cela, nous permettrons la saisie des valeurs de base (moyenne, variance et nombre d’individus). Réalisez les étapes suivantes (nous reprenons les valeurs de l’exercice 1 du TD5):
A1
, écrire “Moyenne”. Puis dans B1
, écrire la valeur \(35\)A2
, écrire “Variance”. Puis dans B2
, écrire la valeur \(15.08\)A3
, écrire “Nombre”. Puis dans B3
, écrire la valeur \(120\)Nous avons maintenant toutes les valeurs nécessaires pour le calcul de l’intervalle (i.e \(\hat{\mu}\), \(s\) et \(n\)), exceptée le coefficient \(u_{\alpha/2}\). Pour cela, nous allons écrire ensemble de commande permettant de calculer automatiquement sa valeur en fonction du risque indiqué dans une cellule.
A5
, écrire “Risque choisi”. Puis dans B5
, écrire “5” (on pourra par la suite changer cette valeur si on veut un autre risque - 1%, 10%, )A6
, écrire “alpha/2”. Puis dans B6
, écrire B5/2/100
A7
, écrire “U_alpha/2”. Puis dans B7
, écrire LOI.NORMALE.INVERSE.N(1-B6;0;1)
Nous pouvons maintenant passer au calcul de l’intervalle directement.
A9
, écrire “Borne inférieure”. Puis dans B9
, écrire la formule B1-B7*RACINE(B2/B3)
A10
, écrire “Borne supérieure”. Puis dans B10
, écrire la formule B1+B7*RACINE(B2/B3)
Nous avons donc maintenant l’intervalle. Nous pouvons améliorer la lisibilité de notre calculette en sélectionnant les 2 cellules contenant les bornes, et en choisissant le format “Nombre” (pour avoir 2 chiffres après la virgule).
Dans la feuille Données du fichier, nous avons des données provenant d’une étude sur une enquête aux USA sur le salaire (inférieur ou supérieur à 50K$), dont nous avons gardé uniquement certaines variables (âge, niveau d’études, sexe, nombre d’heures par semaine, salaire).
Nous allons déjà calculer les intervalles de confiance pour l’âge et le nombre d’heures au global. Pour cela, réalisez les étapes suivante :
G3
et en dessous, écrire : “Moyenne”, “Variance”, “Nombre”, cellule vide, “Risque”, “U_alpha/2”, cellule vide, “Borne inférieure” et “Borne supérieur”H2
, écrire Age et en I2
, écrire HeuresH3
, écrire MOYENNE(A:A)
H4
, écrire PUISSANCE(ECARTYPE.STANDARD(A:A); 2)
H5
, écrire NB(A:A)
A
H7
, écrire la valeur \(5\)H8
, écrire LOI.NORMALE.INVERSE.N(1-H7/2/100; 0; 1)
H10
, écrire la formule H3-H8*RACINE(H4/H5)
H11
, écrire la formule H3+H8*RACINE(H4/H5)
Faire de même pour le nombre d’heures de travail par semaine
Nous allons maintenant chercher à faire les intervalles de confiance de la proportion de femmes et des personnes ayant un salaire supérieur à 50K$. Réalisez les étapes suivantes :
H14
, écrire Sexe: Female et en I14
, écrire Salaire: >50KG15
et en dessous, écrire “Nombre”, “Proportion”, cellule vide, “Risque”, “U_alpha/2”, cellule vide, “Borne inf” et borne sup”H15
, écrire NBVAL(C:C)-1
NBVAL()
compte le nombre de cellules non vides, en incluant celle de titre doncH16
, écrire NB.SI(C:C; " Female")/H15
NB.SI()
permet donc de compte le nombre de cellules respectant une condition d’égalitéH18
, écrire la valeur \(5\)H19
, écrire LOI.NORMALE.INVERSE.N(1-H18/2/100; 0; 1)
H21
, écrire la formule H16-H19*RACINE(H16*(1-H16)/H15)
H22
, écrire la formule H16+H19*RACINE(H16*(1-H16)/H15)
Faire de même pour la proportion de personnes ayant un salaire supérieur à 50K$ (modalité " >50K"
, sans oublier l’espace devant la aussi)
Nous cherchons maintenant à savoir s’il y a une différence entre ceux gagnant plus de 50K$ et ceux gagnant moins. Pour cela, nous allons calculer d’abord pour l’âge. Réalisez les étapes suivantes :
K1
et L1
, et écrire dedans ÂgeK2
et L2
les modalités <=50K et >50KK3
, écrire MOYENNE.SI(E:E;"<=50K";A:A)
et en L3
, écrire MOYENNE.SI(E:E;" >50K";A:A)
NB.SI()
, MOYENNE.SI()
réalise une moyenne de certaines cellules (ici, celles de la colonne D
dont la ligne a la valeur “<=50K” dans la colonne A
)K4
et en L4
, écrire H4
K5
et en L5
, écrire NB(A:A)
K7
et L7
, on écrit la valeur \(5\)K8
et L8
, on écrire LOI.NORMALE.INVERSE.N(1-H18/2/100; 0; 1)
K10
, on écrit K3-K8*RACINE(K4/K5)
(idem pour L10
avec des L
au lieu des K
)K11
, on écrit K3+K8*RACINE(K4/K5)
(idem pour L10
avec des L
au lieu des K
)On voit donc que l’âge n’est pas le même selon le salaire.