Fichier Excel de base à télécharger : base
Dans la feuille Données du fichier, nous avons des données provenant d’une étude sur une enquête aux USA sur le salaire (inférieur ou supérieur à 50K$), dont nous avons gardé uniquement certaines variables (âge, niveau d’études, sexe, nombre d’heures par semaine, salaire).
Nous allons déjà calculer les intervalles de confiance pour l’âge et le nombre d’heures au global. Pour cela, réalisez les étapes suivante :
G3
et en dessous, écrire : “Moyenne”, “Variance”,
“Nombre”, cellule vide, “Risque”, “U_alpha/2”, cellule vide, “Borne
inférieure” et “Borne supérieur”H2
, écrire Age et en
I2
, écrire HeuresH3
, écrire MOYENNE(A:A)
H4
, écrire VAR(A:A)
H5
, écrire NB(A:A)
A
H7
, écrire la valeur \(5\)H8
, écrire
LOI.NORMALE.INVERSE.N(1-H7/2/100; 0; 1)
.N
pour les logiciels suivants : Libre
Office, Google Spreadsheet, Apple NumbersH10
, écrire la formule
H3-H8*RACINE(H4/(H5-1))
H11
, écrire la formule
H3+H8*RACINE(H4/(H5-1))
Faire de même pour le nombre d’heures de travail par semaine
Nous allons maintenant chercher à faire les intervalles de confiance de la proportion de femmes et des personnes ayant un salaire supérieur à 50K$. Réalisez les étapes suivantes :
H14
, écrire Sexe: Femme et en
I14
, écrire Salaire: >50KG15
et en dessous, écrire “Nombre”, “Proportion”,
cellule vide, “Risque”, “U_alpha/2”, cellule vide, “Borne inf” et borne
sup”H15
, écrire NBVAL(C:C)-1
NBVAL()
compte le nombre de cellules
non vides, en incluant celle de titre doncH16
, écrire NB.SI(C:C; "Female")/H15
NB.SI()
permet donc de compte le nombre de cellules
respectant une condition d’égalitéH18
, écrire la valeur \(5\)H19
, écrire
LOI.NORMALE.INVERSE.N(1-H18/2/100; 0; 1)
.N
pour les logiciels suivants : Libre
Office, Google Spreadsheet, Apple NumbersH21
, écrire la formule
H16-H19*RACINE(H16*(1-H16)/H15)
H22
, écrire la formule
H16+H19*RACINE(H16*(1-H16)/H15)
Faire de même pour la proportion de personnes ayant un salaire
supérieur à 50K$ (modalité "More than 50K"
)
Nous cherchons maintenant à savoir s’il y a une différence entre ceux gagnant plus de 50K$ et ceux gagnant moins. Pour cela, nous allons calculer d’abord pour l’âge. Réalisez les étapes suivantes :
K1
et L1
, et écrire
dedans ÂgeK2
et L2
les modalités
<=50K et >50KK3
, écrire
MOYENNE.SI(E:E;"Less than 50K";A:A)
et en L3
,
écrire MOYENNE.SI(E:E;"More than 50K";A:A)
NB.SI()
, MOYENNE.SI()
réalise une
moyenne de certaines cellules (ici, celles de la colonne D
dont la ligne a la valeur “Less than 50K” dans la colonne
A
)K4
et en L4
, écrire H4
K5
et en L5
, écrire
NB.SI(E:E;"Less than 50K)
et
NB.SI(E:E;"More than 50K")
K7
et L7
, on écrit la valeur \(5\)K8
, on écrit
LOI.NORMALE.INVERSE.N(1-K7/2/100; 0; 1)
(idem pour
L8
avec L7
au lieu de K7
)K10
, on écrit K3-K8*RACINE(K4/K5)
(idem pour L10
avec des L
au lieu des
K
)K11
, on écrit K3+K8*RACINE(K4/K5)
(idem pour L10
avec des L
au lieu des
K
)On voit donc que l’âge n’est pas le même selon le salaire.