Introduction | Structures planétaires | Observables | Techniques et méthodes | Lieux de vie | Auteurs | Boite à outils |
Représentativité d'un échantillon |
En statistique, le premier souci est la représentativité d'un échantillon. Pour bien comprendre la notion de représentativité, les sondages politiques sont pédagogiques. Durant une élection, un sondage doit donner approximativement le pourcentage de votes qu'obtiendra chaque candidat. Pour ce faire, un échantillon, de 1000 français par exemple, est sondé sur leurs futurs votes. Les sondeurs peuvent alors tirer des conclusions sur l'issue probable du résultat en faisant l'hypothèse que les 60 millions de français vont se comporter comme ces 1000 personnes. Dans ce cas, l'échantillon de 1000 personnes est dit représentatif de la totalité des français. L'échantillon peut cependants être biaisé si le sondeur ne sélectionne que des personnes ayant la carte du premier parti de droite ou bien des personnes lisant uniquement la presse dite de gauche. Il faut donc veiller à corriger le biais s'il est bien connu.
L'obtention d'un échantillon représentatif, sans biais, est une chose facile en théorie mais difficile en pratique. En théorie, il suffit de sélectionner un échantillon de manière aléatoire. Pour les élections, il suffit de tirer un certain nombre de français au hasard. Pour les exoplanètes, cette méthode est impossible pour la simple raison que toutes les exoplanètes de notre galaxie ne sont pas encore connues. Il existe en effet plusieurs biais qui font que certaines exoplanètes peuvent être surreprésentées par rapport à d'autres. Par exemple, les planètes très massives avec un grand rayon et très proches de leurs étoiles auront tendance à être plus facilement détectables et donc à être surreprésentées par rapport aux planètes de type terrestre qui sont petites, peu massives et loin de leurs étoiles hôtes. Toute étude statistique doit alors bien identifier ses biais afin de ne pas tirer de fausses conclusions. Un échantillon d'exoplanètes peut être complet jusqu'à une certaine limite de masse, de taille, de distance au soleil mais pas au-delà. Le travail du statisticien est de trouver cette limite pour tirer des conclusions non biaisées.