class: center, middle, inverse, title-slide .title[ # Estimation par intervalle ] .author[ ### FX Jollois ] .date[ ### BUT TC - 2ème année ] --- ## Problème à résoudre - exemple Comment puis-je connaître un indicateur sur la population française ? - Quelle est la taille moyenne de TOUS les français ? -- > Impossible à réaliser (trop coûteux, trop compliqué à mettre en oeuvre, ...) -- Sélection d'un sous-ensemble de la population, appelé **échantillon** - Notion de *représentativité* de l'échantillon - Calcul d'un indicateur sur l'échantillon - Extrapolation à la population (avec une incertitude quantifiée) -- `\(\rightarrow\)` **Inférence statistique** --- ## Estimation **Problème statistique** : - Estimation d'un paramètre inconnu de la population via un échantillon -- 2 types d'estimation, basées sur l'hypothèse de la loi de la variable : - **Ponctuelle** : unique valeur mesurée dans l'échantillon - La moyenne est un bon estimateur de l'espérance d’une v.a. par exemple -- - **Par intervalle** : intervalle (dit de confiance) basée sur l'échantillon - Il y a x % de chance que la vraie valeur (de la population) appartiennent à cet échantillon - Intervalle très souvent symétrique - Risque de se tromper dépendant du problème, mais très souvent 5% --- ## Cas de la loi Normale - Pour une v.a. `\(N(0, 1)\)`, on cherche un intervalle de confiance `\([a;b]\)` tel que `$$p(a<X<b)=1-\alpha$$` - Si `\(\alpha\)` est égal à 5% `\(\rightarrow\)` a = -1,96 et b = 1,96 > Pour une variable `\(X\)` suivant une loi Normale `\(N(0, 1)\)`, on a donc **95%** de chances que la valeur soit comprise dans l'intervalle `\(\mathbf{[−1.96 ; 1.96]}\)` <img src="seance6--estimation-intervalle_files/figure-html/normal-1.png" style="display: block; margin: auto;" /> --- ## Intervalle de confiance d'une moyenne - Si `\(n\)` est grand (supérieur à 30), on calcule l'intervalle avec la formule ci-dessous `$$\left[m-u_{\alpha/2}\frac{s}{\sqrt{n}}\mbox{ ; }m + u_{\alpha/2}\frac{s}{\sqrt{n}}\right]$$` - `\(m\)` : moyenne sur l'échantillon - `\(s\)` : écart-type sur l'échantillon - `\(n\)` : taille de l'échantillon - `\(u_{\alpha/2}\)` : valeur de la table de la loi Normale tel que `\(p(X > u_{\alpha/2}) = \alpha/2\)` - Si `\(\alpha = 0,05\)` (i.e. 5% donc), on aura `\(u_{\alpha/2} = 1,96\)` - Autres valeurs parfois utilisées : 10% (avec `\(u_{\alpha/2} = 1,64\)`), 1%... --- ## Exemple ### Mesure du niveau de pluie pendant 9 ans - Moyenne de **610,22** - Écart-type de **111,53** On considère que le niveau de pluie suit une loi Normale donc, avec un risque de 5%, on aura `$$IC_{95\%} = [ 537,35 ; 683,09 ]$$` -- On dira la phrase suivante : > **Il y a donc 95% de chance que le niveau de pluie soit compris entre 537,35 et 683,09.** --- ## Intervalle de confiance d'une proportion - Si `\(n\)` est grand (supérieur à 30), on calcule l'intervalle avec la formule ci-dessous `$$\left[p-u_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\mbox{ ; }p+u_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\right]$$` - `\(p\)` : proportion sur l'échantillon - `\(n\)` : taille de l'échantillon - `\(u_{\alpha/2}\)` : valeur de la table de la loi Normale tel que `\(p(X > u_{\alpha/2}) = \alpha/2\)` - Si `\(\alpha = 0,05\)` (i.e. 5% donc), on aura `\(u_{\alpha/2}=1,96\)` - Autres valeurs parfois utilisées : 10% (avec `\(u_{\alpha/2}=1,64\)`), 1%... --- ## Exemple ### Mesure du niveau d'insatisfaction des habitants sur l'avancement des travaux - 500 personnes interrogées - 30% si disent mécontents On a n (largement) supérieur à 30 donc, avec un risque de 5%, on aura `$$IC_{95\%}=[26.0;34.0]$$` -- On dira la phrase suivante : > **Il y a donc 95% de chance que le niveau d’insatisfaction soit compris entre 26% et 34%.**