class: center, middle, inverse, title-slide .title[ # Lois de probabilité et estimation ] .author[ ### FX Jollois ] .date[ ### BUT TC - 2ème année ] --- ## Rappels de probabilités : Définitions - **Expérience aléatoire** : expérience dont le résultat ne peut pas être déterminé *a priori* -- - **Univers de l'expérience** : ensemble des résultats possibles (noté `\(\Omega\)`) -- - **Résultat élémentaire** : résultat possible de l'expérience (noté `\(\omega\)`) -- - **Ensemble des parties** : ensemble constitué de tous les sous-ensembles possibles de `\(\Omega\)` (noté `\(\mathcal{P}(\Omega)\)`) -- - **Evènement** (aléatoire) : partie (sous-ensemble) de `\(\Omega\)` (noté `\(A\)`) - On parle de *réalisation* lorsque l'évènement se produit (*i.e* le résultat `\(\omega\)` appartient au sous-ensemble `\(A\)`) - `\(A=\Omega\)` se réalise toujours - `\(A=\emptyset\)` ne se réalise jamais - `\(A=\{\omega\}\)` s'appelle donc un évènement élémentaire --- ## Exemple simple Lancer d'un dé à 6 faces (non pipé), avec un jeu où on doit faire un nombre pair - `\(\Omega = \{1, 2, 3, 4, 5, 6\}\)` -- - `\(\mathcal{P}(\Omega)\)` : ensemble des 64 sous-ensembles possibles - `\(\emptyset\)` et `\(\Omega\)` - `\(\{1\}, \{2\}, \ldots\)` - `\(\{1, 2\}, \{1, 3\}, \ldots\)` - `\(\{1, 2, 3\}, \{1, 2, 4\}, \ldots\)` - `\(\ldots\)` -- - `\(A=\{2, 4, 6\}\)` --- ## Rappels de probabilités : Evènements - **Complémentaire** de `\(A\)` : évènement constitué des éléments de `\(\Omega\)` non inclus dans `\(A\)` - `\(\bar{A} = \{\omega \in \Omega, \omega \notin A \}\)` -- .pull-left[] -- .pull-right[] --- ## Rappels de probabilités : Evènements - **Union** de `\(A\)` et `\(B\)` : évènement constitué des éléments de `\(A\)` et des éléments de `\(B\)` (ou aux deux donc) - `\(A \cup B = \{ w \in \Omega, \omega \in A \mbox{ ou } \omega \in B \}\)` -- .center[] --- ## Rappels de probabilités : Evènements - **Intersection** de `\(A\)` et `\(B\)` : événement constitué des éléments de `\(\Omega\)` étant à la fois dans `\(A\)` et dans `\(B\)` - `\(A \cap B = \{ w \in \Omega, \omega \in A \mbox{ et } \omega \in B \}\)` -- .center[] --- ## Rappels de probabilités : Evènements - **Différence** entre `\(A\)` et `\(B\)` (non symétrique) : ensemble constitué des éléments de `\(A\)` n'étant pas dans `\(B\)` - `\(A \setminus B = \{ w \in \Omega, \omega \in A \mbox{ et } \omega \notin B \}\)` -- .center[] --- ## Rappels de probabilités : Evènements - **Inclusion** : `\(A\)` est inclus dans `\(B\)` si tous les éléments de `\(A\)` sont dans `\(B\)` - `\(A \subset B \Leftrightarrow \left( \omega \in A \implies \omega \in B \right)\)` -- .center[] --- ## Rappels de probabilités : Evènements - **Disjonction** (ou incompatibilité) : `\(A\)` et `\(B\)` sont disjoints s'il n'y aucun élément commun entre les deux - `\(A\)` et `\(B\)` disjoints `\(\Leftrightarrow A \cap B = \emptyset\)` -- - **Système complet** d'évènements : `\((A_1, A_2, \ldots, A_n)\)` constitue un système complet s'ils forment une **partition** de `\(\Omega\)` - Ils sont 2 à 2 incompatibles : `\(\forall p \ne q, A_p \cap A_q = \emptyset\)` - Leur réunion est égale à `\(\Omega\)` : `\(\bigcup_{p=1}^n A_p = \Omega\)` --- ## Rappels de probabilités **Probabilité** : fonction permettant de mesurer la chance (ou le risque) de réalisation d'un évènement Quelques opérations : - `\(P(\emptyset) = 0\)` et `\(P(\Omega)=1\)` -- - `\(0 \le P(A) \le 1\)` -- - `\(P(A) = \sum_{\omega_i \in A} P(\omega_i)\)` -- - `\(P(\bar{A}) = 1 - P(A)\)` -- - `\(P(A) \le P(B)\)` si `\(A \subset B\)` -- - `\(P(A \cup B) = P(A) + P(B) - P(A \cap B)\)` -- - `\(P(\bigcup_i A_i) \le \sum_i P(A_i)\)` --- ## Rappels de probabilités - Probabilité conditionnelle de `\(A\)` sachant `\(B\)` $$ P(A / B) = \frac{P(A \cap B)}{P(B)} $$ -- - Indépendance de 2 évènements `\(A\)` et `\(B\)` - 2 évènements disjoints ne sont pas considérés comme indépendant $$ P(A \cap B) = P(A) P(B) $$ $$ P(A / B) = P(A) $$ $$ P(B / A) = P(B) $$ -- - Théorème de Bayes $$ P(A / B) = \frac{P(B / A) P(A)}{P(B)} $$ --- ## Variable aléatoire ### Variable aléatoire Mesure d'un phénomène (*variable*) dont le résultat est déterminé par une expérience *aléatoire* (*i.e*. dépendant du hasard) -- - Exemples classiques : Pile/Face, Lancer de dé, Température, ... -- - Chaque résultat d'une expérience : **issue** -- - Ensemble de toutes les issues possibles : **univers des possibles** `\(\Omega\)` -- - Sous-ensemble de `\(\Omega\)` : **évènement** - Si ensemble à une seule issue *évènement élémentaire* -- - Possibilité d'associer une valeur réelle à chaque issue - Notion de gain par exemple --- ## Variable aléatoire et loi de probabilité ### Définition Une **variable aléatoire** (ou *v.a.*) `\(\mathbf{X}\)` est une fonction définie sur `\(\Omega\)` et à valeur dans `\(\mathbb{R}\)`, à laquelle on associe une **loi de probabilité** (ou *distribution de probabilité*) dont la masse totale est égale à 1 -- - V.a. *continue* si les valeurs de `\(X\)` sont quantitatives continues - V.a. *discrète* si le nombre de résultats est faible (ou si c'est qualitatif) -- ### Fonction de répartition Soit `\(\mathbf{X}\)` une *v.a.* prenant des valeurs `\(x\)` réelles ou discrètes. La *fonction de répartition* `\(F_X\)` de la v.a. est la fonction qui associe une probabilité `\(P(X \le x)\)` à tout `\(x\)`. --- ## Variable aléatoire ### Fonction de masse Soit `\(\mathbf{X}\)` une *v.a.* prenant des valeurs `\(x_i\)` discrètes. La *fonction de masse* de la v.a. associe une probabilité `\(P(X = x_i)\)` à chaque résultat élémentaire `\(x_i\)` -- ### Densité de probabilité Soit `\(\mathbf{X}\)` une *v.a.* prenant des valeurs `\(x\)` réelles. La *fonction de densité* permet de calculer la probabilité d'appartenance à un domaine `\(P(a \le X \le b)\)` (c'est la dérivée de la fonction de répartition). --- ## Exemple de cas discret On lance un dé (à 6 faces), et on calcule notre gain avec .pull-left[- `\(+1\)` si c'est pair - `\(-2\)` si c'est `\(\le 3\)` - `\(+5\)` si c'est 2 ] .pull-right[ <table class="table" style="margin-left: auto; margin-right: auto;"> <tbody> <tr> <td style="text-align:left;"> x </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 6 </td> </tr> <tr> <td style="text-align:left;"> gain </td> <td style="text-align:right;"> -2 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> -2 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> </tbody> </table> ] -- .pull-left[ ### A noter - V.a. `\(\mathbf{X}\)` *discrète* : gain d'un lancer - `\(\Omega\)` : `\(1, \ldots, 6\)` - **Issues** : `\(-2, 0, 1, 4\)` - Loi de probabilité : <table class="table" style="margin-left: auto; margin-right: auto;"> <tbody> <tr> <td style="text-align:left;"> gain </td> <td style="text-align:left;"> -2 </td> <td style="text-align:left;"> 0 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> 4 </td> </tr> <tr> <td style="text-align:left;"> p </td> <td style="text-align:left;"> 0.3333 </td> <td style="text-align:left;"> 0.1667 </td> <td style="text-align:left;"> 0.3333 </td> <td style="text-align:left;"> 0.1667 </td> </tr> </tbody> </table> ] .pull-right[ <img src="StatsProbas_TC2A_TD2_files/figure-html/ex1-plot-1.png" width="90%" style="display: block; margin: auto;" /> ] --- ## Cas discret - **Loi uniforme discrète** (résultats équi-probables) - **Loi de Bernouilli** - **Loi Binomiale** - **Loi de Poisson** --- ## Loi uniforme discrète ### Définition Soit `\(\mathbf{X}\)` une *v.a.* prenant des valeurs `\(k\)` discrètes (avec `\(k=1,\ldots,n)\)`. `\(\mathbf{X}\)` suit une **loi uniforme discrète** si pour chaque `\(k\)`, `\(P(X = k) = \frac{1}{n}\)`. -- ### Exemple Dé à 6 faces (non pipé) `\(\rightarrow P(X = k) = \frac{1}{6}\)` (avec `\(k=1,\ldots,6\)`). -- ### Espérance et variance $$ E(X) = \frac{n+1}{2} \mbox{ et } V(X) = \frac{n^2 - 1}{12} $$ --- ## Loi uniforme discrète `\(\rightarrow\)` Simulation avec 6 valeurs possibles, et 10^{4} tirages. .pull-left[ <!-- --> ] .pull-right[ <!-- --> ] --- ## Loi uniforme discrète - *exercice* ### Questions On dispose de 10 boules numérotées de 1 à 10 dans une urne. 1. Quelle est la probabilité de tirer la boule 5 ? 1. Quelle est la probabilité de tirer 2 fois de suite la boule 5 ? trois fois ? 1. Si je tire 100 fois une boule (avec remise donc à chaque fois), quelle est valeur moyenne puis-je espérer avoir ? -- ### Réponses Soit `\(\mathbf{X}\)` une v.a. de loi uniforme discrète, à valeur entre 1 et 10. 1. `\(P(X = 5) = \frac{1}{10}\)` 1. `\(P(X_1 = 5 \mbox{ et } X_2 = 5) = P(X_1 = 5) P(X_2 = 5) = \frac{1}{100}\)` (car idépendance entre les 2 évènements) - Il y a donc 1 chance sur mille d'avoir 3 cinq d'affilés 1. `\(E(X) = \frac{n+1}{2} = 50.5\)` --- ## Loi de Bernouilli ### Définition Soit `\(\mathbf{X}\)` une *v.a.* prenant deux valeurs `\(0\)` ou `\(1\)` `\(\mathbf{X}\)` suit une **loi de Bernouilli** si `\(P(X = 1)=p\)` et `\(P(X = 0) = q = 1-p\)`. -- ### Exemple Pile ou face avec une pièce équilibrée -- ### Espérance et Variance $$ E(X) = p \mbox{ et } V(X) = pq $$ --- ## Loi de Bernouilli `\(\rightarrow\)` Simulation avec une urne avec 100 boules oranges et 50 boules vertes. On considère qu'on veut des boules oranges, donc `\(P(X = 1) = \frac{100}{150}\)`. On fait toujours 10^{4} tirages, avec remise ici. .pull-left[ <!-- --> ] .pull-right[ <!-- --> ] --- ## Loi de Bernouilli - *exercice* ### Questions On est en présence d'une assemblée de 250 personnes, dont 40 gauchers. 1. Quelle est la probabilité qu'une personne soit gauchère ? 1. A l'inverse, quelle est la probabilité qu'une personne soit droitière ? -- ### Réponses Soit `\(\mathbf{X}\)` une v.a. de loi de Bernouilli, valant 1 si la personne est gauchère, 0 sinon. 1. `\(P(X = 1) = \frac{40}{250} = .16\)` 1. `\(P(X = 0) = 1 - P(X = 1) = 1 - .16 = .84\)` (complémentaire) --- ## Loi Binomiale ### Définition Soit `\(\mathbf{X}\)` une *v.a.* prenant les valeurs `\(0\)` (avec une probabilité `\(p\)`) ou `\(1\)` (avec une probabilité `\(1-p\)`), et `\(n\)` le nombre de tirages réalisés. `\(\mathbf{X}\)` suit une **loi Binomiale** lorsque `\(P(X = k) = C_k^n p^k (1-p)^{n-k}\)`, somme de `\(n\)` v.a. indépendants de loi de Bernouilli. `\(C_k^n = \frac{n!}{k!(n-k)!}\)` se nomme le coefficient binomial, et représente le nombre d'ensembles à `\(k\)` éléments qu'on peut obtenir dans l'ensemble des `\(n\)` éléments. -- ### Exemple Avec 100 tirages à pile ou face, combien de fois on aura pile ? -- ### Espérance et Variance $$ E(X) = np \mbox{ et } V(X) = np(1-p) $$ --- ## Loi Binomiale .pull-left[ ### Fonction de masse $$ P(X = k) = f(k) = C_k^n p^k (1-p)^{n-k} $$ Exemple avec `\(n=10\)` et `\(p=.6\)` <!-- --> ] .pull-right[ ### Fonction de répartition `$$F(x) = \left\{ \begin{array}{ll} 0 & \mbox{ pour } x \le 0\\ \sum_{k=0}^{\lfloor x \rfloor} f(k) & \mbox{ pour } 0 \le x \le n \\ 1 & \mbox{ sinon} \\ \end{array} \right.$$` <!-- --> ] --- ## Loi Binomiale `\(\rightarrow\)` Simulation avec notre urne avec 100 boules oranges et 50 boules vertes. Chaque essai comportera 100 tirages avec remise. On fait toujours 10^{4} essais. On cherche à savoir combien on aura de boules oranges dans ces 100 tirages. .pull-left[ <!-- --> ] .pull-right[ <!-- --> ] --- ## Loi Binomiale - *exercice* ### Questions Supposons que nous avons formé 100 groupes de 2000 personnes, avec la même proportion de gaucher (16%) que précédemment. 1. Si je choisis une personne de chaque groupe, combien puis-je espérer avoir de gauchers au final ? 1. Quelle est la probabilité de n'avoir aucun gaucher ? Et 100 gauchers ? 1. Quelle est la probabilité d'avoir 20 gauchers ? -- ### Réponses Soit `\(\mathbf{X}\)` une v.a. de loi Binomiale, avec `\(p = .16\)` et `\(n = 100\)` 1. `\(E(X) = np = 100 * .16 = 16\)` 1. `\(P(X = 0) = C_0^{100} .16^0 .84^{100} = .84^{100} < 0.0001\)` (très très faible) et `\(P(X = 100) = .16^{100} < 0.0001\)` (aussi très très faible) 1. `\(P(X = 20) = C_20^{100} .16^20 .84^{80} = 0.0567\)` --- ## Loi de Poisson ### Définition Soit `\(\mathbf{X}\)` une *v.a.* prenant des valeurs `\(k\)` discrètes (avec `\(k=1,2,\ldots\)`). `\(\mathbf{X}\)` suit une **loi de Poisson** `\(Pois(\lambda)\)` si pour chaque `\(k\)`, `\(P(X = k) = \frac{\lambda^k}{k!}e^{-\lambda}\)` où - `\(e\)` est la base de l'exponentielle - `\(\lambda\)` représente le nombre moyen d'occurences dans un intervalle de temps fixé -- ### Exemple Nombre de personnes à l'arrêt d'un bus après une certaine durée -- ### Espérance et Variance $$ E(X) = \lambda \mbox{ et } V(X) = \lambda $$ --- ## Loi de Poisson .pull-left[ ### Fonction de masse $$ P(X = k) = f(k) = \frac{\lambda^k}{k!}e^{-\lambda} $$ Exemple avec `\(\lambda=5\)` <!-- --> ] .pull-right[ ### Fonction de répartition `$$F(x) = \left\{ \begin{array}{ll} 0 & \mbox{ pour } x \le 0\\ \frac{\Gamma(\lfloor k+1 \rfloor, \lambda)}{\lfloor k \rfloor !} & \mbox{ sinon} \\ \end{array} \right.$$` <!-- --> ] --- ## Loi de Poisson `\(\rightarrow\)` Simulation en considérant un arrêt de bus. On considère que 2 personnes viennent toutes les minutes. On étudie le nombre de personnes sur une durée de 5 minutes. On choisit donc `\(\lambda = 10\)`. .pull-left[ <!-- --> ] .pull-right[ <!-- --> ] --- ## Cas continu - Loi uniforme - Loi Normale --- ## Loi uniforme continue ### Définition Soit `\(\mathbf{X}\)` une *v.a.* prenant des valeurs `\(x\)` réelles dans `\([a;b]\)`. `\(\mathbf{X}\)` suit une **loi uniforme continue** `\(U(a,b)\)` si tous les intervalles de même longueur ont la même probabilité -- ### Exemple Pas réellement de cas dans la vie de tous les jours -- ### Espérance, Variance $$ E(X) = \frac{a+b}{2} \mbox{ et } V(X) = \frac{(b-a)^2}{12} $$ --- ## Loi uniforme continue .pull-left[ ### Densité de probabilité `$$f(x) = \left\{ \begin{array}{rl} \frac{1}{b-a} & \mbox{ pour } x \in [a;b] \\ 0 & \mbox{ sinon} \\ \end{array} \right.$$` <!-- --> ] .pull-right[ ### Fonction de répartition `$$F(x) = \left\{ \begin{array}{rl} 0 & \mbox{pour } x < a \\ \frac{x - a}{b - a} & \mbox{pour } x \in [a;b] \\ 1 & \mbox{pour } x > b \\ \end{array} \right.$$` <!-- --> ] --- ## Loi uniforme continue `\(\rightarrow\)` Simulation sur l'intervalle `\([1;5]\)` .pull-lefft[ <!-- --> ] .pull-right[ <!-- --> ] --- ## Loi Normale ### Définition Soit `\(\mathbf{X}\)` une *v.a.* prenant des valeurs `\(x\)` réelles. `\(\mathbf{X}\)` suit une **loi Normale** `\(N(\mu, \sigma^2)\)` de moyenne `\(\mu\)` et de variance `\(\sigma^2\)`. -- ### Exemple Mesure de la taille d'une population -- ### Espérance et Variance $$ E(X) = \mu \mbox{ et } V(X) = \sigma^2 $$ --- ## Loi Normale .pull-left[ ### Densité de probabilité $$ f(x) = \frac{1}{\sigma \sqrt{2\pi}} \exp \left( -\frac{(x - \mu)^2}{2\sigma^2} \right) $$ <!-- --> ] .pull-right[ ### Fonction de répartition $$ F(x) = \frac{1}{2} \left( 1 + \mbox{erf} \frac{x - \mu}{\sigma\sqrt{2}} \right) $$ <!-- --> ] --- ## Loi Normale `\(\rightarrow\)` Simulation d'une loi Normale de moyenne `\(\mu = 170\)` et d'écart-type `\(10\)` .pull-left[ <!-- --> ] .pull-right[ <!-- --> ] --- ## Exercice ### Plus grand nombre tiré On joue à un jeu avec deux dés (non pipés), pendant lequel on note le plus grand chiffre obtenu. Quelle est la loi de la variable aléatoire ? --- ## Solution ### Plus grand nombre tiré On définit `\(\Omega\)` avec : `$$\Omega=\left\{\{1, 1\}, \{1, 2\}, \{1, 3\}, \ldots\right\}$$` On peut donc faire le tableau suivant, avec en ligne les résultats du dé `\(A\)` et en colonnes ceux du dé `\(B\)`. Chaque cellule représente donc le plus grand des 2 chiffres obtenus. <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> </th> <th style="text-align:right;"> b=1 </th> <th style="text-align:right;"> b=2 </th> <th style="text-align:right;"> b=3 </th> <th style="text-align:right;"> b=4 </th> <th style="text-align:right;"> b=5 </th> <th style="text-align:right;"> b=6 </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> a=1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 6 </td> </tr> <tr> <td style="text-align:left;"> a=2 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 6 </td> </tr> <tr> <td style="text-align:left;"> a=3 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 6 </td> </tr> <tr> <td style="text-align:left;"> a=4 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 6 </td> </tr> <tr> <td style="text-align:left;"> a=5 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 6 </td> </tr> <tr> <td style="text-align:left;"> a=6 </td> <td style="text-align:right;"> 6 </td> <td style="text-align:right;"> 6 </td> <td style="text-align:right;"> 6 </td> <td style="text-align:right;"> 6 </td> <td style="text-align:right;"> 6 </td> <td style="text-align:right;"> 6 </td> </tr> </tbody> </table> --- ## Solution ### Plus grand nombre tiré On obtient ainsi la loi de probabilité suivante : <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:right;"> Plus grand </th> <th style="text-align:right;"> Nb </th> <th style="text-align:left;"> Px </th> <th style="text-align:right;"> P </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> 1/36 </td> <td style="text-align:right;"> 0.03 </td> </tr> <tr> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:left;"> 3/36 </td> <td style="text-align:right;"> 0.08 </td> </tr> <tr> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:left;"> 5/36 </td> <td style="text-align:right;"> 0.14 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 7 </td> <td style="text-align:left;"> 7/36 </td> <td style="text-align:right;"> 0.19 </td> </tr> <tr> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 9 </td> <td style="text-align:left;"> 9/36 </td> <td style="text-align:right;"> 0.25 </td> </tr> <tr> <td style="text-align:right;"> 6 </td> <td style="text-align:right;"> 11 </td> <td style="text-align:left;"> 11/36 </td> <td style="text-align:right;"> 0.31 </td> </tr> </tbody> </table>