... | @@ -9,10 +9,12 @@ La taille est la **variable** à étudier : on cherche à estimer la distributio |
... | @@ -9,10 +9,12 @@ La taille est la **variable** à étudier : on cherche à estimer la distributio |
|
**Variable aléatoire discrète**
|
|
**Variable aléatoire discrète**
|
|
La courbe a été établie à partir des tailles annoncées par les personnes elle-mêmes. Les gens interrogés ont indiqué une taille au centimètre près, ce qui rend ces données **discrètes**, c'est-à-dire prenant un nombre fini de valeurs, ici des entiers.
|
|
La courbe a été établie à partir des tailles annoncées par les personnes elle-mêmes. Les gens interrogés ont indiqué une taille au centimètre près, ce qui rend ces données **discrètes**, c'est-à-dire prenant un nombre fini de valeurs, ici des entiers.
|
|
Les auteurs ont donc pu calculer un effectif pour chaque valeur donnée, et en divisant par le nombre total de personnes ils en ont déduit des **fréquences**. Par exemple, 13% des personnes interrogées ont déclaré mesurer 1,70m. La somme des fréquences de toutes les variables données doit être égale à 1.
|
|
Les auteurs ont donc pu calculer un effectif pour chaque valeur donnée, et en divisant par le nombre total de personnes ils en ont déduit des **fréquences**. Par exemple, 13% des personnes interrogées ont déclaré mesurer 1,70m. La somme des fréquences de toutes les variables données doit être égale à 1.
|
|
|
|
:warning: relier des points est un peu trompeur sur la nature des informations représentées : un graphique en barres serait sans doute plus approprié.
|
|
|
|
|
|
D'après le graphique en fréquence, il est compliqué de trouver la médiane de la valeur étudiée, il faudrait tracer le graphique en fréquence cumulée.
|
|
D'après le graphique en fréquence, il est compliqué de trouver la médiane de la valeur étudiée, il faudrait tracer le graphique en fréquence cumulée.
|
|
|
|
|
|
**Variable aléatoire continue**
|
|
**Variable aléatoire continue**
|
|
Cette courbe discrète a peu de chances de refléter la distribution réelle. D'une part, la taille est en fait une variable **continue**, et mesurer **exactement** 1,70 m est peu probable. D'autre part, on remarque que la courbe est "en dents de scie" : les valeurs multiples de 5 et 10 cm sont plus citées que leurs voisines. Pour proposer une distribution plus réaliste, les auteurs ont lissé la courbe des effectifs pour approcher la **fonction de densité** .
|
|
Cette courbe discrète a peu de chances de refléter la distribution réelle. D'une part, la taille est en fait une variable **continue**, et mesurer **exactement** 1,70 m est peu probable. D'autre part, on remarque que la courbe est "en dents de scie" : les valeurs multiples de 5 et 10 cm sont plus citées que leurs voisines. Pour proposer une distribution plus réaliste, les auteurs ont lissé la courbe des effectifs pour approcher la **fonction de densité** . Cette fois, la représentation par une courbe est justifiée.
|
|
Par définition de la fonction de densité, l'aire totale sous la courbe est égale à 1, et la probabilité d'avoir une valeur inférieure ou égale à x est égale à l'aire sous la courbe de moins l'infini à x - ici, comme il s'agit d'une taille de personnes adultes, le graphique est restreint à l'intervalle 1,40 - 1,90m.
|
|
Par définition de la fonction de densité, l'aire totale sous la courbe est égale à 1, et la probabilité d'avoir une valeur inférieure ou égale à x est égale à l'aire sous la courbe de moins l'infini à x - ici, comme il s'agit d'une taille de personnes adultes, le graphique est restreint à l'intervalle 1,40 - 1,90m.
|
|
Il est plus facile de trouver la médiane graphiquement : avançons que la moitié des français **environ** étaient plus grands que 1,70m et l'autre moitié en-dessous
|
|
Il est plus facile de trouver la médiane graphiquement : avançons que la moitié des français **environ** étaient plus grands que 1,70m et l'autre moitié en-dessous
|
|
|
|
|
... | | ... | |