Soit \(X\) une v.a. mesurant un indicateur sur \(n\) individus d’un échantillon, on peut estimer la moyenne \(\mu\) de la population grâce avec \(\hat{\mu}\) moyenne de l’échantillon : \[ \hat{\mu} = \bar{x} = \frac{1}{n} \sum_{i=1}^n x_i \] où les \(x_i\) sont les valeurs prises pour les \(n\) individus de l’échantillon.
De même, nous pouvons estimer sa variance avec : \[ \hat{\sigma}^2 = s^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2 \]
Lorsque la variance \(\sigma^2\) est inconnue, on définit un intervalle de confiance de la moyenne avec une probabilité \(\alpha\), avec la formule suivante : \[ \left[ \bar{x} - t_{\alpha/2} \sqrt{\frac{s^2}{n - 1}} ; \bar{x} + t_{\alpha/2} \sqrt{\frac{s^2}{n - 1}} \right] \] où \(t_{\alpha/2}\) représente la valeur dans la table de la loi Student, à \(n-1\) degrés de liberté (ddl), telle que \(P(X > t_{\alpha/2}) = \frac{\alpha}{2}\).
Valeurs importantes de la table de la loi de Student (selon les degrés de liberté)
P(X < u) | dd = 49 | ddl = 119 | ddl = 199 | ddl = 299 |
---|---|---|---|---|
0.999 | 3.265 | 3.160 | 3.132 | 3.118 |
0.995 | 2.680 | 2.618 | 2.601 | 2.592 |
0.990 | 2.405 | 2.358 | 2.345 | 2.339 |
0.975 | 2.010 | 1.980 | 1.972 | 1.968 |
0.950 | 1.677 | 1.658 | 1.653 | 1.650 |
0.900 | 1.299 | 1.289 | 1.286 | 1.284 |
Soit \(X\) la v.a. estimant la moyenne des étudiants. Dans un échantillon de 50 étudiants, nous obtenons une moyenne de 11.4 avec une variance de 2.7. Nous pouvons déterminer l’intervalle de confiance de la note comme suit : \[ \left[ \bar{x} - t_{\alpha/2} \sqrt{\frac{s^2}{n - 1}} ; \bar{x} + t_{\alpha/2} \sqrt{\frac{s^2}{n - 1}} \right] \]
On sait donc que :
On a donc
\[ \left[ 11.4 - 2.010 \sqrt{\frac{2.7}{49}} ; 11.4 + 2.010 \sqrt{\frac{2.7}{49}} \right] \]
Après calcul, on obtient donc \([ 10.93 ; 11.87 ]\).
On pourra ainsi dire qu’il y a 95% de chances que la moyenne des étudiants soient comprises entre 0.93 et 11.87.
Si la question était de savoir si la moyenne serait au-dessus de 10, on pourra affirmer qu’il y a 95% de chances que la moyenne des étudiants soit supérieure à 10.
Une entreprise souhaite connaître l’âge de ces clients. Pour cela, elle réalise un sondage sur 120 personnes. Sur cet échantillon, on obtient un âge moyen de 35.0 et une variance de 15.08.
Un hôpital fait une étude sur le poids des bébés à la naissance. Lors du mois écoulé, le poids moyen des 50 enfants nés a été de 3.55 kg et une variance de 0.32.
On compare deux circuits électroniques, dont on veut savoir si le gain est identique entre les deux. Nous réalisons 300 mesures pour chacun des circuits, et obtenons les moyennes (\(m_i\)) et écarts-type (\(s_i\)) suivants :
Peut-on dire qu’il y a une différence entre les deux avec un seuil de confiance à 90 % ? et à 95 % ?
On désire comparer la qualité de deux doseuses pour boîtes de haricots verts de quantité nominale égale à 800g. On prélève un échantillon de 200 éléments sur chacune des deux machines, ce qui donne les deux valeurs moyennes suivantes :
Les dosages moyens de ces deux machines sont-ils différents au risque de \(5\%\) ? Sont-elles fiables par rapport au dosage de 800g à obtenir ?