Techniques et méthodes


Techniques et méthodes

Ces chapitres décrivent les techniques et méthodes de détection et d'étude des planètes et des exoplanètes.

La recheche d'exoplanètes se fait avec des méthodes diverses et complémentaires, en particulier :

L'étude des (exo)planètes s'appuie aussi sur une grande diversité de techniques et d'outils, en particulier numériques ou mathématiques, par exemple ;

Les CubeSats sont un technique plus rapide à mettre en oeuvre que les missions spatiales classiques pour observer un phénomène.


Les CubeSats

Auteur: Gary Quinsac

Les CubeSats

Ce cours est une introduction aux problématiques liées à la réalisation d'une mission spatiale. Pour ce-faire, nous vous proposons d'aborder un format bien particulier de petits satellites : les CubeSats. D'une manière générale, le bon fonctionnement d'un satellite est garanti par de nombreux domaines qui seront introduits dans ce cours. Dans un second temps, nous nous focaliserons sur un aspect en particulier, la nécessité de fournir un contrôle d'attitude et d'orbite pour mener à bien une mission spatiale. Des exercices vous permettront de vous exercer sur de nombreux points du cours. Enfin, vous pourrez utiliser les connaissances acquises pour pré-dimensionner quatre missions spatiales qui vous sont proposées sous la forme de mini-projets.

prerequisPrérequis

La partie Découvrir s'adresse à toute personne, pas nécessairement scientifique, qui souhaiterait découvrir brièvement les aspects et enjeux d'une mission spatiale. Pour aborder la partie Comprendre, un bagage scientifique de niveau licence est requis, à savoir :

Tout au long de ce cours le lecteur doit garder à l'esprit que de nombreuses notions abordées pourraient faire l'objet d'un cours à part entière. Des liens vers d'autres cours issus de ce site ou de Fenêtre sur l'univers seront proposés autant que possible. Voici également des références qui pourront lui permettre d'approfondir les sujets souhaités :

bibliographieLivres conseillés

[Début du cours]


Découvrir

Auteur: Gary Quinsac

Projet spatial

Auteur: Gary Quinsac

Intérêt des satellites

Besoin scientifique

L'astronomie est science d'observation. Dans l'Antiquité, l'observation des objets célestes visibles à l’œil nu permet d'abord la mesure du temps. Ensuite, elle s'attache à prédire les mouvements des objets observés. Les observations étaient menées par des astrologues (qui parlent des astres) qui, au fil du temps, ont évolué pour travailler comme astronomes (qui étudient le mouvement des astres) et, aujourd'hui, astrophysiciens (qui utilisent la physique pour comprendre les astres). Au cours des siècles les instruments utilisés s'améliorent, permettant des observations toujours plus fines. Le XXème siècle marque un tournant, les astronomes se retrouvant confrontés à des limitations difficilement surmontables ainsi qu'à des besoins nouveaux :

Pour certains objectifs, il apparaît alors nécessaire de satelliser les instruments d'observation.

Différentes applications actuelles

Dès le début de l'ère spatiale, les industriels emboîtent le pas des scientifiques et imaginent des applications commerciales. On retrouve ainsi, de nos jours, de nombreux types de satellites différents :

complementAller plus loin

Opacité atmosphérique
images/opacite-atmospherique.png
Pourcentage d'absorption du spectre électromagnétique par l'atmosphère terrestre. Si l'atmosphère est opaque à une grande partie du spectre électromagnétique, parmi les exceptions se trouve le domaine du visible.
Crédit : NASA
Turbulence atmosphérique et optique adaptative
images/Star_HIC59206_VLT_AO.jpg
Effets liés à turbulence atmosphérique. L'image de gauche est l'étoile HIC 59206 capturée par le VLT, tandis que celle de droite est la même image corrigée par optique adaptative.
Crédit : European Southern Observatory
Météorologie
images/ouragan-matthew-eumetsat.jpg
L'ouragan Matthew vu dans l'infrarouge par le satellite Metop-A, le 7 octobre 2016. Les observations dans plusieurs bandes spectrales conduisent, une fois compilées, à une carte de température.
Crédit : Eumetsat

Classes de satellites

Les satellites sont généralement classés en fonction de leur masse au lancement. Alors que dans les années 60, lorsque l'affrontement politique entre les États-Unis et l'Union soviétique s'exprimait sur le terrain de la course à la Lune, les engins spatiaux n'étaient limités que par les progrès techniques de l'époque, ce sont actuellement des critères économiques qui prévalent lors du développement des satellites. Une relation à peu près linéaire existe entre la masse d'un satellite et son coût. Une classification typique des satellites est présentée dans le tableau suivant.

Classification des satellites
DénominationMasseCoûtExamples
Gros satellites> 1 t> 150 M€Station Spatiale Internationale (500 t)
Sondes spatiales : Cassini Huygens autour de Saturne (NASA, 5,7 t) / Rosetta autour d'une comète (ESA ,3 t)
Satellites GEO de 3 à plusieurs dizaines de tonnes
Satellites LEO, MEO et GEO de 1 à 3 tonnes
Satellites moyens<1 t< 150 M€Constellation de télécommunication Iridium en LEO (66 satellites, 700 kg)
Télescope spatial CoRoT pour l'étude des étoiles (CNES, 668 kg)
Constellation Galileo, système de positionnement par satellites (ESA, 700 kg)
Minisatellites< 500 kg< 50 M€Sondes spatiales : New Horizons vers Pluton (NASA, 478 kg, ~600 M€) / SMART-1 vers la Lune (ESA, 366 kg, ~110 M€)
Plateforme PROTEUS (Thalès)
Microsatellites< 100-150 kg< 8 M€Plateforme Myriade (CNES, 100-150 kg) : PARASOL pour l'étude de l'atmosphère terrestre / MICROSCOPE pour le test du principe d'équivalence
PROBA-1 : démonstrateur technologique (ESA, 94 kg)
Nanosatellites< 10 kg< 3 M€Constellation Planet Labs (60 CubeSats 3U de 5 kg début 2017), observation de la Terre
GOMX-1 : CubeSat 2U (GomSpace 2,66 kg), démonstrateur technologique
ROBUSTA-1A (CNES / Université de Montpellier 2) : CubeSAT 1U (1 kg) développé par des étudiants
Picosatellites, femtosatellites...< 1 kg< 300 k€WREN (STADIKO) : femtosatellite de démonstration technologique financé participativement

complementSource d'information

Masse et coûts de quelques satellites
images/comparaison_mass_cout_satellites.png
Comparaison de la masse et du coût de certains satellites. Les deux paramètres sont reliés par une relation presque linéaire, les satellites scientifiques apparaissant plus coûteux.
Crédit : Gary Quinsac
Hubble
images/hubble-in-orbit.jpg
Télescope spatial Hubble. Sa masse est de 11 tonnes, il fait la taille d'un bus (13 x 4 x 4 m3) et consomme 2,8 kW. Son orbite relativement basse (550 km d'altitude) a permis aux navettes spatiales américaines de venir effectuer des réparations et des remplacements d'équipements.
Crédit : ESA
Station Spatiale Internationale
images/ISS.jpg
Plus grand objet artificiel placé dans l'espace (110 m de longueur, 74 m de largeur et 30 m de hauteur), la Station Spatiale Internationale fait environ 400 tonnes. Chacune de ses 16 ailes de panneaux solaires mesure 35 m de long pour 12 m de large, produisant un maximum de 120 kW. Son altitude varie entre 330 et 420 km et a été choisie pour faciliter son assemblage/ravitaillement en orbite par les différents pays impliqués dans son exploitation.
Crédit : CNES
Satellite GPS
images/GPS-satellite.jpg
Un satellite GPS de 1,5 tonne pour 2.5 x 2 x 2 m3. Il consomme 1,9 kW et orbite à 20000 km d'altitude. De nombreux satellites de ce type composent ce qu'on appelle une constellation GPS, l'objectif étant d'avoir toujours au moins 4 satellites en visibilité depuis une zone donnée à la surface de la Terre.
Crédit : GPS.gov
Satellite de télécommunication
images/KA-sat.jpg
Satellite de télécommunication KA-SAT d'une masse de 6 tonnes (dont 3 pour le carburant) et mesurant 5 x 2 x 2 m3. Comme de nombreux satellites de télécommunication il se trouve sur l'orbite géostationnaire (GEO), c'est à dire à 36000 km d'altitude. Ses panneaux solaires de 40 m d'envergure lui permettent de produire 14,4 kW.
Crédit : J. Huart/ ESA

Système spatial

Un système spatial se décompose en trois éléments :

Segment spatial

Le segment spatial est décomposé en deux sous-ensembles principaux : la charge utile et la plateforme. La charge utile regroupe les instruments nécessaires à la réussite de la mission. Cela va du montage optique pour un satellite d'observation tel que Hubble aux antennes et amplificateurs associés pour un satellite de télécommunication. Il est important de remarquer que c'est la charge utile d'un satellite qui définit sa mission. La plate-forme assure les servitudes, c'est-à-dire l'ensemble des fonctions génériques nécessaires à l'activité en orbite. Ses différentes fonctions sont :

Ces aspects sont developpés plus en détail dans la partie consacrée aux sous-systèmes.

Segment sol

Le segment sol se compose des stations de poursuite, des moyens d'opération et de commande/contrôle et des moyens de programmation de la charge utile, de réception, pré-traitement, archivage et diffusion des informations de cette même charge utile (centre de mission).

Lancement

Le lancement est l'étape permettant la mise en orbite d'un objet. C'est une étape dimensionnante en termes d'orbite atteinte, de masse et de volume disponibles sous coiffe. Le lanceur le plus lourd jamais créé a permis à un homme de marcher sur la Lune pour la première fois en 1969 et se nomme Saturn V. Depuis, de très nombreux types de lanceurs ont été développés pour permettre à des charges utiles plus ou moins importantes d'atteindre différentes orbites.

Les différentes orbites terrestres sont classées en fonction de leurs altitude, inclinaison et excentricité. En voici quelques unes :

complementCeintures de Van Allen

Les ceintures de Van Allen, ainsi nommées en l'honneur du physicien les ayant découvertes, sont des zones de la magnétosphère terrestre contenant une grande densité de particules énergétiques, pour la plupart d'origine solaire. Leurs deux principaux effets sont la création d'aurores polaires lorsque les particules énergétiques rencontrent l'atmosphère terrestre et la mise en danger des satellites les traversant (des blindages sont nécessaires pour protéger les équipements sensibles de satellites passant une longue période dans les ceintures). On a pour habitude de considérer qu'elles sont au nombre de deux, la première s'étendant entre 700 km et 10 000 km d'altitude et la seconde entre 13 000 km et 65 000 km. D'autres ceintures sont susceptibles d'apparaître mais ne semblent pas permanentes.

Station sol de PicSat
images/station-sol-picsat.jpg
Station sol UHF/VHF installée à l'Observatoire de Meudon pour communiquer avec le CubeSat PicSat.
Crédit : PicSat
Comparaison de lanceurs
images/taille-comparative-fusees.jpg
Comparaison de lanceurs utilisés depuis le début de l'ère spatiale. La masse de carburant embarqué par un lanceur pour satelliser un objet représente la majeure partie de sa masse au lancement. Par exemple, l'Ariane 5 GS est capable d'emporter plus de 6 tonnes en orbite GTO, elle mesure à peu près 50 m de hauteur pour une masse au décollage de 750 tonnes composée à 90% de carburant.
Crédit : NASA
Orbites terrestres
images/orbites_terrestres.png
Orbites terrestres les plus utilisées.
Crédit : Gary Quinsac
Aurore boréale
images/aurore-boreale.jpg
Photo d'une aurore boréale en Alaska. Ces phénomènes lumineux sont provoqués par la rencontre entre des particules énergétiques provenant du Soleil ou du rayonnement cosmique et de l'atmosphère. Ces particules ont été préalablement piégées par le champ magnétique terrestre dans une zone que l'on nomme ceinture de Van Allen.

Conception, exigences et contraintes

Tout projet spatial répond à un enjeu : objectif scientifique, démonstration technologique... Il doit donc faire face à son lot d'exigences et de contraintes. Les exigences définissent les fonctions qu'un système ou un composant doit remplir. Elles répondent à la question "que fait ce système/composant ?". Les contraintes spécifient, quant à elles, ce que le système doit être. Elles sont généralement des limitations du système.

Cette situation est encore plus vraie pour les projets spatiaux. Les erreurs commises sont le plus souvent irréversibles et irratrapables une fois que le système est lancé. Il faut ainsi :

Les exigences mission dépendent du type de satellite considéré, mais le principe est toujours le même : un besoin est exprimé auquel le satellite va essayer de répondre. Se faisant, un type d'orbite va être identifié :

De ce choix découle un système de lancement, ou lanceur. La charge utile embarquée doit ensuite répondre aux exigences mission tout en prenant en compte les contraintes imposées par le système de lancement (volume et masse disponibles, interfaces) et l'environnement orbital. Toutes ces questions se posent bien entendues également pour la plate-forme, qui devra s'adapter à la charge utile choisie (ou inversement, si le choix est fait d'utiliser une plate-forme standardisée).

L'environnement spatial présente de nombreuses spécificités qui doivent être prises en compte dès le début du développement :

Outre ces aspects négatifs, l'environnement peut également être mis à profit pour certaines fonctions :

Que le programme soit public ou privé, la question du coût reste centrale. Ce coût doit prendre en compte le lancement, le segment spatial (durée de fabrication, des essais…), le système sol et des opérations. Il est ensuite amorti sur la durée de vie du système.

Des règlements nationaux et internationaux imposent des restrictions, notamment en termes de fréquences de télécommunication. La bande de fréquence utilisée doit avoir été définie en amont. Dans certains cas (satellite GEO) la notion de compatibilité électromagnétique implique de ne pas perturber les satellites voisins. La gestion d'un satellite en fin de vie est de plus en plus importante du fait de la prolifération des débris en orbite terrestre. Ainsi en France, la Loi sur les Opérations Spatiales (LOS) réglemente ces aspects.

exempleExemple : pollution orbitale

En orbite autour de la Terre, les objets sont animés de vitesses relatives qui peuvent atteindre 15 à 20 km/s. À de telles vitesses, les énergies cinétiques qui sont en jeu peuvent engendrer de très importants dégâts. Chaque collision, au même titre que le délitement des vieux satellites, crée de nouveaux débris qui viennent augmenter le nombre d'objets orbitant la Terre. Cette pollution orbitale croît très fortement et impose aux États et aux entreprises de mettre en place des stratégies de réduction du nombre de débris.

Classification des débris orbitaux et risques associés
Taille de l'objetNombre d'objetsRépertoriés ?Risques associés à l'objet
> 10 cm20 000OuiCollisions catastrophiques, production de débris
1 cm < objet < 10 cm500 000NonPerte de la mission, aucun blindage ne résiste à des objets > 2 cm
< 1 cm> 10 000 000NonPerforations, risque de perte d'équipement critique
Arbre fonctionnel
images/arbre-fonctionnel.jpg
Exemple d'arbre fonctionnel. A partir des fonctions principales sont dérivées des fonctions secondaires, jusqu'à pouvoir identifier des solutions exécutant ces fonctions.
Crédit : Gary Quinsac
Nombre mensuel d'objets en orbite terrestre par type d'objets
images/nombre-debrits.jpg
Résumé de tous les objets en orbite terrestre officiellement répertoriés par l'U.S. Space Surveillance Network. Les "débris issuent de la fragmentation" regroupent les débris produits par des anomalies (explosions, casses...), tandis que les "débris fonctionnels" regroupent l'ensemble des objets libérés, distribués ou séparés dans le cadre d'une mission. Les "morceaux de fusée" quant à eux sont des pièces ou des ensembles de pièces appartenant à la fusée (tels que les différents étages de poussée). Le pic observé en 2007 correspond à la destruction par la Chine de l'un de leurs satellites météorologiques (Fengyun-1C) dans le cadre d'un test de missile anti-satellite. Le second, en 2009, est dû à la collision entre un satellite militaire russe hors de service (Cosmos 2251) et un satellite de télécommunication américain (Iridium 33).
Crédit : NASA - Orbital Debris Quarterly News, February 2017

Déroulement d'un projet spatial

Cycle de vie d'un système

Au cours d'un projet, un système va être amené à évoluer, d'un premier état conceptuel à un état physique. Des tests doivent alors êtres effectués pour s'assurer que le système répond aux exigences identifiées précédemment, ce sont les étapes de validation. Les états successifs du système et les activités le concernant constituent ce que l'on appelle le cycle de vie. S'il existe différentes façons de représenter ce-dernier, le cycle en V reste le modèle le plus suivi. Ce cycle est parcouru de gauche à droite, d'abord du haut vers le bas puis du bas vers le haut. Aux phases de conception succèdent les phases d'assemblage, d'intégration et de test. Le cycle en V permet d'identifier facilement l'étape de validation correspondant à chaque étape de conception.

Dans certains projets, tels que des projets étudiants, on utilise des méthodes agiles. Elles ont pour origine le manifeste Agile et reposent sur un cycle de développement itératif, incrémental et adaptatif. Ces méthodes autorisent une plus grande flexibilité et réactivité, nécessaires à ces projets.

Phases d'un projet spatial

Dans le cas d'un projet spatial, on divise le déroulement du projet en 7 phases successives. Chacune d'entre-elles correspond à un état du système et se conclut par une revue de projet. On peut remarquer que les premières phases correspondent aux étapes de conception (0-A-B), avant de passer à la réalisation (C-D), à l'utilisation et au retrait.

Cycle en V
images/Cycle_en_V.png
Cycle en V d'un produit. Chaque étape de conception correspond à une étape de validation, de la même couleur.
Crédit : Gary Quinsac
Phases d'un projet spatial
images/Phases_projet.png
Phases d'un projet spatial. Chaque phase correspond à un état d'avancement du système et se conclut par une revue de projet.
Crédit : Gary Quinsac

Nanosatellites

Auteur: Gary Quinsac

Standard CubeSat

Le standard CubeSat a été défini en 1999 par l'Université polytechnique de Californie (Cal Poly) et l'Université de Stanford comme un format de nanosatellites. Ce standard définit une unité de base, appelée "U", qui est un cube de 10 cm d’arête pour une masse d'environ 1,3 kg. Ces unités peuvent être assemblées de manière à obtenir des satellites plus volumineux, appelés "2U", "3U", "6U", "12U" ou même "27U" en fonction du nombre d'unités utilisé. Outre son format réduit, ce standard permet une importante réduction des coûts financiers et opérationnels :

Illustration du standard CubeSat
images/standard-cubesats.jpg
Chaque unité ("U) est un cube de 10 cm d’arête pour une masse d'environ 1,3 kg. Il est possible d'assembler plusieurs unités.
Crédit : C²ERES, Campus et Centre spatial de PSL

Applications pour les CubeSats

Adopté dans différents secteurs

Il est possible de classer les CubeSats en différents secteurs et par extension tous les satellites de moins de 50 kg (échelles "nano" et en partie "micro"), dont les CubeSats forment la majeure partie :

De nombreuses applications

Le même classement peut être fait concernant les familles d'applications :

Une tendance à l'embonpoint

Depuis la création de ce standard, le nombre de lancements a fortement augmenté au fil des ans. Cette tendance ne fait que se confirmer avec les nombreux nouveaux acteurs du marché, qu'ils se placent du côté de la conception de CubeSats ou de leur lancement. Il est intéressant de noter que si les CubeSats de petit format (1U, 2U et 3U) ont été privilégiés jusqu'à présent, des formats 12U et 27U sont maintenant envisagés afin d'offrir des profils de mission plus flexibles (missions interplanétaires, plus grosse charge utile) tout en préservant les avantages offerts par la standardisation, faisant varier le profil des CubeSats envoyés.

Nano/microsatellites par secteur (1 - 50 kg)
images/cubesats-tendance-par-secteur.png
Le secteur commercial est en très forte augmentation, devenant bientôt le secteur dominant les satellites de 1 à 50 kg.
Crédit : Gary Quinsac / Données de SpaceWorks - Nano/Microsatellite Market Forecast, 2018
Nano/microsatellites par application (1 - 50 kg)
images/cubesats-tendance-par-application.png
Le format de ces satellites est particulèrement intéressant pour la réalisation de constellations d'observation de la Terre. Les progrès réalisés sur la miniaturisation et les retours d'expérience des premières missions poussent les acteurs à considérer sérieusement leur utilisation dans un but scientifique.
Crédit : Gary Quinsac / Données de SpaceWorks - Nano/Microsatellite Market Forecast, 2018
Lancements des nano/microsatellites
images/cubesats-historique-lancements.png
Après deux années de stagnation majoritairement due à des retards de lancement, l'année 2017 a vu une forte augmentation du nombre de lancements. Cela correspond à la croissance attendue pour ce marché, avec près de 2600 lancements attendus d'ici 5 ans.
Crédit : Gary Quinsac / Données de SpaceWorks - Nano/Microsatellite Market Forecast, 2018
Evolution de la taille des nanosatellites
images/cubesats-tendance-par-taille.png
On constate une augmentation de la taille des nanosatellites afin de répondre aux demandes de charges utiles plus complexes. Néanmoins, le format 3U devrait rester le plus populaire dans les 5 années à venir.
Crédit : Gary Quinsac / Données de SpaceWorks - Nano/Microsatellite Market Forecast, 2018

Sous-systèmes

Comme nous l'avons vu précédemment, un satellite se décompose en différents sous-systèmes essentiels à son bon fonctionnement :

Charge utile

La charge utile est le sous-système qui réalise les fonctions correspondant à l'objectif de la mission. Si celle-ci varie fortement d'une mission à l'autre, les éléments suivants qui forment la plate-forme sont généralement présents sur tous les satellites.

Structure porteuse

La structure porteuse a pour but d'assurer l'interface avec le lanceur, la cohésion mécanique du satellite et le support des équipements. Elle est aussi appelée "architecture mécanique". L'intégrité du satellite doit être assurée dans les différents environnements qu'il rencontrera au cours de sa vie, c'est-à-dire le sol, le lancement et l'orbite.

Contrôle thermique

Le contrôle thermique a pour fonction de maintenir les équipements dans leur plage de température de fonctionnement, quelle que soit la phase de la mission, et ce durant toute la durée de vie du satellite. Dans le cas de missions nécessitant une grande précision astrométrique, le contrôle thermique permet également d'uniformiser les températures afin d'assurer une stabilité dimensionnelle (et ainsi éviter des phénomènes de dilatation/contraction par exemple). Pour ce faire, on peut faciliter ou interdire certains échanges thermiques de façon passive, ou utiliser des actionneurs (des réchauffeurs pour réchauffer ou des radiateurs pour refroidir) pour réguler la température. Ce contrôle thermique s'effectue dans des conditions très particulières, celles du milieu spatial, qui limitent le nombre d'acteurs. Nous pouvons classer les acteurs en deux catégories : les sources froides et les sources chaudes.

complementComplément : modes de transfert d'énergie

Il existe trois modes de transfert d'énergie :

  • Le transfert par conduction est l'échange d'énergie, sous l'effet d'une différence de température, entre deux corps en contact physique ou au sein d'un même corps solide.
  • La convection thermique désigne l'échange d'énergie à l'interface d'un fluide en mouvement sous l'effet d'une différence de température. L'absence de fluide conducteur (air) dans l'espace empêche ce type de transfert thermique vers l'extérieur du satellite.
  • Le transfert radiatif (ou transfert par rayonnement) représente l'unique transfert possible avec l'espace. Il représente le transfert d'énergie par radiation et implique l'interaction du rayonnement avec la matière.

Génération d'énergie

La génération d'énergie permet le fonctionnement de l'engin spatial en lui fournissant l'énergie électrique dont il a besoin. En effet, ce dernier étant mobile et autonome, il a besoin de produire son électricité. Le système d'alimentation électrique est découpé en quatre éléments qui sont la production (ou source primaire), le stockage (ou source secondaire), la régulation et la distribution.

Ce sous-système occupe usuellement entre 20 % et 30 % de la masse sèche (réservoirs vides d'ergols) d'un satellite classique.

Télécommunication

Le sous-système de télécommunication utilise des émetteurs, des récepteurs ou des transpondeurs afin de gérer l'ensemble des fonctions de communication. S'il s'agit d'un satellite de communication, ce sous-système peut alors devenir la charge utile du satellite.

Télémesure, télécommande et localisation

Les équipements de télémesure, télécommande et localisation constituent un ensemble de télécommunications de servitude transmettant au sol les télémesures de différents paramètres soumis à contrôle (température d'un équipement, charge d'une batterie) et recevant les télécommandes pour les équipements à opérer (plate-forme et charge utile).

Chaîne de traitement, de stockage et de gestion bord

Les informations transitant dans le satellite sont prises en charge par la chaîne de traitement, de stockage et de gestion bord. Ce sous-système s'assure de la bonne distribution des données vers les équipements. Il est également en charge du stockage des données avant que celles-ci soient transmises, généralement à une station sol.

Système de contrôle d'attitude et d'orbite

Le système de contrôle d'attitude et d'orbite (SCAO) assure deux types de mouvement : celui autour de son centre de gravité (attitude) et celui de son centre de gravité (orbite). En d'autres termes, il est responsable de l'orientation et de la position du satellite dans l'espace. En fonction de l'attitude recherchée, les commandes d'attitude impriment les corrections d'orientation autour du centre de gravité. Le maintien du satellite sur l'orbite prévue est indispensable à la plupart des missions. Le sous-système de propulsion crée les incréments de vitesse nécessités par les manœuvres d'orbite. Celles-ci sont commandées depuis le sol, ou déterminées à bord, la détermination d'orbite à bord étant aujourd'hui rendue possible par les navigateurs embarqués qui permettent d'accroître l'autonomie des satellites.

Propulsion

La propulsion, enfin, fonctionne de pair avec le SCAO. Elle est un actionneur du SCAO, assez complexe pour être traité séparément, qui a pour fonction de créer les variations de vitesse nécessaires aux manœuvres du satellite.

complementAller plus loin

Schéma éclaté du CubeSat ArduSat3
ArduSat3.png
On retrouve une partie des sous-systèmes classiques d'un satellite sur ce CubeSat 1U. On remarque également qu'ils se présentent généralement sous la forme de cartes disposées les unes après les autres dans la structure du CubeSat.
Crédit : Wikipedia

Exemples de missions CubeSats

GOMX-3 un satellite de démonstration téchnologique

GOMX-3 est une collaboration entre l'ESA et GOMspace (Danemark) embarquant différentes charges utiles de démonstration technologique :

complementFocus sur l'émetteur bande-X

De nombreux types de missions sont maintenant rendus possibles par la miniaturisation des charges utiles, qu'elles soient scientifiques ou technologiques. L'une des principales limitations de ces missions en orbite basse est le volume de données pouvant être téléchargées par orbite. Actuellement, les CubeSats embarquent des sous-systèmes de télémétrie UHF et bande-S qui permettent de télécharger jusqu'à quelques centaines de mégaoctets (Mo) par jour. Ce volume de données est limité par la durée de visibilité entre la station sol et l'antenne du satellite ainsi que le débit (~100 ko/s en UHF et ~1Mo/s en bande-S). Afin d'augmenter les taux de transmission tout en restant compatible avec les stations sol existantes, le CNES et l'ESA ont voulu tester un émetteur-récepteur en bande-S et un émetteur en bande-X, tous deux miniaturisés pour le format CubeSat. L'émetteur en bande-X permet des débits de l'ordre de plusieurs Go par survol d'une station sol compatible bande-X (entre 3,4 et 5 m dans ce cas), tout en étant adapté aux dimensions d'un CubeSat-3U (< 10 W et 300 g pour le sous-système).

Après une année d'opération, le satellite a effectué sa ré-entrée atmosphérique. Tous les objectifs ont été atteints et la mission nominale a même été dépassée, permettant de démontrer d'autres capacités.

QB50 une flotte de CubeSats scientifiques universitaires

L'objectif de la mission QB50 est de démontrer la possibilité de lancer un réseau de satellites construits par des équipes universitaires à travers le monde pour effectuer une étude scientifique de la basse thermosphère. De nombreux enjeux du standard CubeSat se retrouvent à travers les différents objectifs de cette mission :

complementFocus sur l'étude scientifique de la thermosphère

La majeure partie des CubeSats de QB50 a comme objectif scientifique d'effectuer des mesures in-situ en de nombreux points de la thermosphère. Par le passé, cette région a été étudiée par des satellites aux orbites très elliptiques (périgée à 200 km et apogée à 3000 km), ne permettant de passer que quelques dizaines de minutes dans la zone d'étude. Les différentes techniques actuelles sont limitées. Les fusée-sondes ("sounding rockets") permettent d'obtenir des mesures durant quelques minutes et le long d'une unique colonne. Des mesures à distance sont faites depuis le sol et des orbites plus élevées, typiquement entre 600 et 800 km. L'environnement est sondé grâce à la diffusion d'un signal de référence. De telles mesures sont rendues difficiles par la raréfaction de l'atmosphère dans la basse thermosphère qui empêche d'obtenir des signaux de retour de qualité. Le moindre coût des CubeSats permet d'accepter la très courte durée de vie inhérente à une orbite très basse, offrant une étude in-situ d'une période de plusieurs mois. Trois types d'instruments sont répartis parmi les satellites (un type par CubeSat), offrant ainsi une étude poussée des différents paramètres régissant le comportement de cette région de l'espace.

Autres missions

De nombreux projets de CubeSats sont développés dans le cadre de C2ERES (Campus et Centre de Recherche pour l’Exploration Spatiale), le pôle spatial de l'Université de Recherche PSL conjointement piloté par le LabEx ESEP et le Master OSAE. En août 2017, on en dénombre pas moins de 8, à des stades de développement différents :

complementAller plus loin

GomX-3
images/GomX3.png
Illustration du CubeSat GomX-3 (3U) développé par GOMspace.
Crédit : GomSpace
Lancements des CubeSats du programme QB50
images/QB50_launchs.png
En août 2017, 36 CubeSats du programme QB50 ont été lancés : 28 depuis la station spatiale internationale et 8 par le lanceur indien PSLV.
Crédit : QB50

Système de Contrôle d'Attitude et d'Orbite

Auteur: Gary Quinsac

Introduction au Système de Contrôle d'Attitude et d'Orbite

Le contrôle d'attitude et d'orbite concerne tous les aspects nécessaires à la maîtrise de l'orientation et de la trajectoire du satellite. Il comprend :

L'ensemble s'appelle le système de contrôle d'attitude et d'orbite (SCAO). Il se compose de différents éléments :

Le SCAO est l'un des sous-systèmes essentiels de la plupart des satellites. L'une de ses raisons d'être est l'existence de perturbations agissant sur un satellite via des couples ou forces extrêmement faibles qu'il faut utiliser ou compenser. Si rien n'entrave ces phénomènes, les conséquences de ces effets deviennent rapidement significatives. Ces perturbations peuvent être externes (c'est-à-dire causées par des phénomènes extérieurs au satellite) ou internes (c'est-à-dire liées à des mécanismes ou déplacements propres au satellite).

Au sein du SCAO, on a pour habitude de distinguer le contrôle d'attitude du contrôle d'orbite de la manière suivante :

Dans la suite de ce cours nous insisterons sur le SCA, même si nous reviendrons par moments sur le système GNC. Il faut bien comprendre que les deux sont généralement développés de manière indépendante et gérés de façon autonome. Le SCAO dans son ensemble est en interaction avec les autres éléments du satellite. Ces interactions sont à l'origine de nombreuses contraintes essentielles lors du développement du SCAO.

definitionDéfinitions

Quelques définitions sont importantes à ce stade.

Digramme en bloc d'un SCAO
images/diagramme-block-scao.png
Diagramme en bloc d'un système de contrôle d'attitude et d'orbite.
Crédit : Gary Quinsac
Relations fonctionnelles du SCAO
images/scao_relations-fonctionnelles.png
Schéma des relations fonctionnelles entre le système de contrôle d'attitude et d'orbite et les autres sous-systèmes du satellite.
Crédit : Gary Quinsac

Système de Contrôle d'Attitude

Le sous-système en charge de l'attitude du satellite se nomme le système de détermination et de contrôle d'attitude (SCA). Il a différents rôles en fonction des modes du satellite. Il doit :

La détermination et le contrôle d'attitude nécessitent plusieurs outils qui seront développés dans la suite du cours.

Représentation d'attitude

L'attitude du satellite est exprimée par l'orientation de son repère par rapport à un référentiel standard (inertiel, orbital, fixé par rapport à un objet...), comme détaillé dans le chapitre sur la représentation d'attitude. Plusieurs outils existent, de la matrice du cosinus directeur aux quaternions, en passant par les angles d'Euler.

Détermination d'attitude

La détermination ou estimation d'attitude fait le liant entre les mesures fournies par les différents capteurs présents à bord du satellite et la connaissance de l'attitude. La détermination d'attitude nécessite au moins deux mesures de directions bien séparées. Il faut ici différencier les techniques de détermination directe d'attitude des techniques d'estimation :

Contrôle d'attitude

Le contrôle d'attitude rentre dans le domaine de la théorie du contrôle. Des lois de contrôle doivent être implémentées afin d'amener le système d'un état initial donné à un état final souhaité, tout en respectant certains temps de réponse. Les asservissements mis en oeuvre doivent être les moins sensibles possible vis-à-vis des perturbations, qu'elles soient internes ou externes. Des actionneurs sont enfin chargés d'appliquer les corrections d'attitude ainsi déterminées.

Une distinction importante doit être effectuée entre les contrôles d'attitude passif et actif.

Boucle SCA
images/boucle-SCA.png
Boucle de contrôle d'attitude.
Crédit : Gary Quinsac

Système de Guidage, Navigation et Contrôle

Lorsque l'on s'intéresse à l'orbite du satellite, on parle alors de guidage, navigation et contrôle (GNC). C'est une branche de l'ingénierie consacrée à la conception des systèmes de contrôle des véhicules (automobiles, bateaux, avions et satellites). La navigation répond à la question "où sommes-nous ?", le guidage à la question "comment aller à notre destination ?" et le contrôle "quelle commande donner au véhicule ?". En somme, cela concerne la détermination d'orbite et la majeure partie du contrôle, à l'exception de la réalisation du contrôle qui est prise en charge par le sous-système de propulsion. Ce sous-système joue un rôle essentiel dans le succès des missions qui impliquent un rendez-vous, de l'arrimage ("docking") et des opérations de proximité. Le logiciel de GNC se compose d'un filtre de navigation, d'un algorithme de guidage et d'un algorithme de contrôle. Ce sous-système doit ainsi :

Il ne faut pas confondre le système GNC embarqué avec le système de dynamique de vol qui fait partie du segment sol. Le GNC doit faire face à des contraintes temporelles et de calcul beaucoup plus fortes, ce qui conduit généralement à des performances des logiciels en vol insuffisantes. Un suivi depuis le sol peut se faire a posteriori et ainsi fournir une mise à jour de paramètres tels que la trajectoire de référence. Les exigences du système GNC dépendent fortement du niveau d'autonomie attendu. L'autonomie à bord permet au segment spatial de continuer les opérations de mission et de survivre à des situations critiques sans avoir recours au segment sol. Plus l'autonomie est importante plus les coûts de développement sont importants, mais les coûts d'opération diminuent. De même, dans le cas de missions interplanétaires, la rareté des canaux de communication peut être une motivation pour limiter les interactions avec le segment sol. Rares ont été les satellites autonomes sur ce plan, même si nous pouvons citer SMART-1 de l'ESA et Deep Space 1 de la NASA. Dans la plupart des cas, une majeure partie des étapes nécessaires au contrôle d'orbite sont effectuées par le segment sol avant que des télécommandes soient transmises au satellite.

Navigation

À la manière de l'estimation d'attitude, l'objectif est d'obtenir une estimation de la position orbitale satisfaisant les exigences de la mission. La navigation est généralement implémentée sous la forme d'un filtre numérique joué par l'ordinateur de bord.

Guidage

Le guidage se sert de l'estimation fournie par la navigation et de la consigne mission pour calculer certains des points suivants :

La trajectoire de référence est calculée par le segment sol et peut être mise à jour durant la mission. Les écarts à cette référence doivent rester suffisamment faibles afin que le guidage puisse les compenser au moyen de faibles variations du profil de poussée. Ces écarts peuvent être dus à des perturbations extérieures, des erreurs d'exécution de manœuvre, des incertitudes de navigation ou des délais opérationnels.

Contrôle

En s'appuyant sur l'estimation de l'état du véhicule (position, vitesse) fournie par le filtre de navigation et sur la trajectoire de référence calculée par la fonction de guidage, la fonction de contrôle s'assure de la bonne exécution de la manœuvre et corrige les erreurs résiduelles. La fonction de contrôle traduit donc les manœuvres reçues en entrée dans le format exigé par la fonction qui s'occupe de la gestion des actionneurs.

Dans le cas de propulseurs, le contrôle établit des forces dans le référentiel du satellite qui seront obtenues en contrôlant le niveau de poussée durant une durée déterminée ou en contrôlant la durée d'une poussée de puissance constante. Une fonction de gestion de la propulsion se chargera de sélectionner le propulseur optimal pour fournir la force ainsi que de fournir les couples réclamés par la fonction de contrôle de l'attitude du satellite.

Digramme en bloc d'un SCAO
images/diagramme-block-gnc.png
Boucle de contrôle d'un système GNC.
Crédit : Gary Quinsac
Sonde SMART-1
images/SMART-1_ESA.jpg
Vue d'artiste de la sonde spatiale SMART-1 sur le chemin de la Lune. Elle était équipée d'un système de propulsion ionique et d'un système de GNC autonome.
Crédit : ESA

Modes SCAO

Une fois séparé du lanceur, le satellite va parcourir une série de modes jusqu’à la fin de la mission. Des modes nominaux vont lui permettre de maintenir son attitude, atteindre son poste, déployer ses panneaux solaires et son antenne, le tout afin de se mettre en ordre de marche pour sa mission. Si nécessaire, ces modes d’opération peuvent être interrompus afin de réaliser son maintien à poste, la décharge du moment cinétique des roues à inertie ou répondre à un incident. Différents équipements sont utilisés en fonction de ces modes et certains sont cités en exemple dans la figure 1. On associe aux modes des exigences qui découlent des exigences mission, par exemple :

Modes SCAO
images/modes_SCAO.png
Modes SCAO typiques avec des exemples associés. Après une phase d'initialisation débutée par la séparation et le déploiement et conclue par le transfert d'orbite, le satellite entre dans un mode d'opérations nominales.
Crédit : Gary Quinsac

Comprendre

Auteur: Gary Quinsac

Réferentiels et transformations

Auteur: Gary Quinsac

Systèmes de coordonnées

Auteur: Gary Quinsac

Généralités

Afin de déterminer la position et l'orientation d'un objet dans l'espace, on fait appel aux systèmes de coordonnées. Dans cette partie, il ne faudra pas confondre les notions de référentiel et système de coordonnées. Un système de coordonnées est notamment défini par son centre (on parle de référentiels géocentrique ou héliocentrique), son plan de référence (équatorial, écliptique) et ses axes. En ce qui concerne les systèmes de coordonnées, on a pour habitude d'utiliser les suivants :

Système de coordonnées inertiel

Un référentiel inertiel (ou galiléen) est un référentiel dans lequel le principe d'inertie est vérifié. Tout corps libre est en mouvement de translation rectiligne uniforme ou au repos. Tout référentiel en mouvement de translation rectiligne et uniforme par rapport à un référentiel inertiel est lui-même inertiel. Les lois de la mécanique sont invariantes par changement de référentiel inertiel. On a l'habitude de distinguer un référentiel considéré comme fixe par rapport à un objet en rotation, comme le repère terrestre, avec un repère dont les axes sont fixés par rapport à une position absolue.

remarqueTermes d'inertie

Dans un référentiel non inertiel, par exemple animé d’un mouvement accéléré par rapport à un référentiel galiléen, il faut faire intervenir les termes d’inertie (comme détaillé par la suite). Ces termes se traduisent par des pseudo-forces, qui se distinguent des forces prises en compte dans un référentiel galiléen car elles ne sont pas associées à une interaction entre le corps dont on étudie le mouvement et un autre corps.


Systèmes de coordonnées célestes

En astronomie, on utilise habituellement les repères cylindriques et sphériques amputés de leur coordonnée de distance. Pour des raisons pratiques, on suppose souvent que les objets observés se situent à des positions fixes à l'intérieur de la sphère céleste, à condition que leur distance soit suffisante.

Un système de coordonnées céleste a pour fonction de déterminer une position dans le ciel. Il existe plusieurs systèmes, utilisant une grille de coordonnées projetée sur la sphère céleste, de manière analogue aux systèmes de coordonnées géographiques utilisés à la surface de la Terre. Les systèmes de coordonnées célestes diffèrent seulement dans le choix du plan de référence, qui divise le ciel en deux hémisphères le long d'un grand cercle (le plan de référence du système de coordonnées géographiques est l'équateur terrestre). Chaque système est nommé d'après son plan de référence.

Système de coordonnées horizontales

Coordonnées horizontales
images/coordonnees-horizontales.jpg
Les coordonnées horizontales locales sont la hauteur (h) et l'azimut (A). La hauteur varie de 0° (horizon) jusqu'à 90° (zénith) et l'azimut est mesuré sur le plan horizontal à partir du Nord (N). Un objet de hauteur négative n'est pas visible depuis le lieu d'observation.
Crédit : Wikipedia

Le système de cordonnées horizontales, également appelé système local ou système de coordonnées alt-azimutales, est un système de coordonnées célestes utilisé en astronomie par un observateur au sol. Le système, centré sur l'observateur, sépare le ciel en deux hémisphères : l'un situé au-dessus de l'observateur et l'autre situé au-dessous, caché par le sol. Le cercle séparant les deux hémisphères, appelé horizon céleste, situe le plan horizontal. L'altitude (ou élévation, "h") et l'azimut (A), qui constituent les deux principales coordonnées de ce système, sont définis à partir de ce plan.

Ce système de coordonnées présente l'avantage d'être simple et local. Il est facile à établir à un endroit donné à partir du moment où l'observateur sait où se trouve l'un des points cardinaux. C'est la raison pour laquelle il est particulièrement utilisé par les télescopes au sol à monture azimutale, c'est à dire l'essentiel des télescopes les plus récents.

Système de coordonnées équatoriales

Coordonnées équatoriales projetées sur la sphère céleste
images/coordonnees-equatoriales-sphere-celeste.PNG
Un système équatorial est projeté sur la sphère céleste. Les longitude (α) et latitude (δ) d'un objet sont indiquées.
Crédit : Gary Quinsac

Le système de coordonnées équatoriales est un système de coordonnées célestes dont les valeurs sont indépendantes de la position de l'observateur. Ceci est également vrai pour les systèmes de coordoonées écliptiques et galactiques. Ce système utilise comme plan de référence la projection de l'équateur de la Terre sur la sphère céleste. Cette projection s'appelle l'équateur céleste. Elle divise le ciel en deux hémisphères, chacun ayant comme axe de référence la projection d'un pôle terrestre, perpendiculaire à l'équateur céleste. À partir de ces divisions, le système permet d'établir deux coordonnées angulaires : l'ascension droite et la déclinaison.

Système de coordonnées écliptiques

Coordonnées écliptiques projetées sur la sphère céleste-
images/coordonnees-ecliptiques-sphere-celeste.PNG
Un système écliptique est projeté sur la sphère céleste. Les longitude (λ) et latitude (β) d'un objet sont indiquées.
Crédit : Gary Quinsac

Le système de coordonnées écliptiques est un système de coordonnées adapté aux objets célestes : il utilise le plan de l'écliptique (plan de l'orbite de la Terre autour du Soleil) comme plan de référence. Ce plan fait un angle d'approximativement 23° avec le plan équatorial terrestre, du fait de l'inclinaison de l'axe de rotation de la Terre. Ce repère est un système sphérique à deux dimensions.

Ce système peut être centré sur la Terre, le Soleil ou tout autre corps. Il est particulièrement utile pour les objets situés dans le système solaire.

Système de coordonnées galactiques

Coordonnées galactiques projetées sur la sphère céleste
images/coordonnees-galactiques-sphere-celeste.PNG
Un système galactique est projeté sur la sphère céleste. Les longitude (l) et latitude (b) d'un objet sont indiquées.

Les coordonnées galactiques sont adaptées aux objets situés dans notre galaxie et non situés dans le voisinage proche du Soleil. Les coordonnées galactiques sont un repérage effectué à l'aide d'une latitude et d'une longitude définies de telle sorte que le plan galactique correspond à l'équateur, et l'origine des longitudes corresponde au centre galactique. Le système de coordonnées galactiques est un système de coordonnées célestes qui prend en compte la rotation de la Galaxie sur elle-même. On parle ici aussi de longitude et de latitude galactiques. Le plan de référence de ce système est le plan de la Galaxie centré sur le centre galactique. Le pôle nord galactique a été défini par convention dans le repère équatorial par une ascension droite de 12 h 51 min 26,282 s et une déclinaison de 27°07′42.01″. Dans ce plan, la direction de référence de la mesure est la direction du centre de la Galaxie.

activiteAppliquette interactive

Une appliquette interactive est disponible ici. Elle permet d'afficher les trois principaux systèmes de coordonnées célestes en 3D.

Résumé des propriétés des systèmes de coordonnées usuels
Système de coordonnéesOriginePlan fondamentalPôlesCoordonnéesDirection principale
LatitudeLongitude
HorizontalObservateurHorizonZénith / NadirÉlévationAzimuth (A)Point nord
ÉquatorialCentre de la Terre (géocentrique) / du Soleil (héliocentrique)Équateur célestePôles célestesDéclinaison (δ)Ascension droite (α)Point vernal
ÉcliptiqueÉcliptiquePôles écliptiquesLatitude écliptique (β)Longitude écliptique (λ)
GalactiqueCentre du SoleilPlan galactiquePôles galactiquesLatitude galactique (b)Longitude galactique (l)Centre galactique

Systèmes de coordonnées spatiaux

Dans le cadre de l'analyse de l'attitude et de l'orbite d'un satellite, certains référentiels sont particulièrement utilisés. Les plus importants d'entre eux sont présentés dans cette partie.

activiteAppliquette interactive

Une appliquette interactive est disponible ici. Elle permet de visualiser dans l'espace une partie des repères spatiaux qui vous sont présentés dans cette partie.

Référentiel héliocentrique

Le référentiel de Kepler (ou référentiel héliocentrique) est le référentiel centré sur le centre de masse du Soleil et dont les axes pointent vers des étoiles fixes. Ce référentiel inertiel est utilisé pour les missions interplanétaires. Ces étoiles sont suffisamment lointaines pour qu'elles apparaissent fixes aux échelles de temps considérées.

Référentiel géocentrique (ECI)

Le référentiel géocentrique ("Earth Centered Inertial"ou ECI en anglais) est un référentiel dont l'origine est le centre de la Terre et dont les trois axes pointent également vers des étoiles fixes. L'origine du système se situe au centre géométrique de la Terre, l'axe Z est aligné avec le pôle nord, l'axe X pointe vers le point vernal et l'axe Y complète le trièdre. D'autres systèmes de ce type existent, définis par rapport à d'autres directions. La bonne connaissance de la position des étoiles permet de déterminer l'orientation du satellite dans ce référentiel par observation de ces étoiles.

complementPoint vernal "vrai"

Le point vernal "vrai" se déplace chaque année en raison de la précession des équinoxes (mouvement de l'axe de rotation de la Terre) et du lent déplacement des étoiles. De ce fait on définit un point vernal fixe conventionnel (celui du 1er janvier 2000 pour le repère J2000).

Référentiel terrestre (ECEF)

Le référentiel terrestre ("Earth-Centered, Earth-Fixed" ou ECEF en anglais) est un référentiel centré sur le centre de masse de la Terre et dont les trois axes sont liés au globe terrestre. Ce référentiel est en mouvement de rotation pure dans le référentiel géocentrique. L'axe vecteur(Z) coïncide avec l'axe de rotation de la Terre et les axes vecteur(X) et vecteur(Y) sont fixés par rapport à la Terre.

remarqueRemarque

Le référentiel géocentrique se distingue du référentiel terrestre, dont l'origine est prise au centre de la Terre, mais dont les axes sont attachés au globe terrestre. Il est également différent du référentiel héliocentrique, dont les axes pointent vers des étoiles lointaines mais dont l'origine est prise au centre du Soleil. Ainsi, le référentiel terrestre est en rotation dans le référentiel géocentrique, lui-même en translation circulaire dans le référentiel héliocentrique. La position et l'orientation d'un satellite par rapport à un tel système doivent être connues afin de maintenir une communication avec le sol ou de réaliser de la détection terrestre.

Repère orbital

Les repères orbitaux sont liés à l'orbite du satellite et à sa position sur cette orbite. Ils tournent à mesure que le satellite orbite autour de la Terre afin qu'un axe pointe dans une direction particulière, tandis que les deux autres sont normaux. On peut citer différents repères orbitaux. Généralement, l'axe vecteur(Z) pointe vers le nadir et l'axe vecteur(Y) est normal au plan orbital.

Pour les satellites pointant la terre, l'orientation/vitesse angulaire du corps du satellite est définie par rapport à un repère fixé sur l'orbite.

Référentiel satellite

Le référentiel du satellite est défini par le corps du satellite. On a l'habitude de définir le repère satellite avec l'orientation d'un élément de navigation essentiel comprenant les capteurs d'attitude les plus critiques et les instruments de la charge utile. Le SCA utilise une combinaison de capteurs et d'actionneurs pour maintenir l'orientation et la vitesse angulaire du référentiel du satellite par rapport à un repère extérieur de référence. Celui-ci dépend généralement du type de pointage requis par la mission (inertiel, solaire, nadir etc).

Repère instruments

Un repère instrument est aligné suivant les directions caractéristiques de l'instrument. Ces repères sont définis par rapport au repère satellite ou par rapport à un repère secondaire, lui-même défini par rapport au repère satellite. L'alignement entre les différents référentiels est mesuré sur le sol mais peut évoluer pendant le lancement, mais également à cause du changement de gravité et des distorsions thermiques. Un instrument peut d'ailleurs être positionné sur un bras articulé (cela se rencontre surtout sur les sondes planétaires). La connaissance précise de l'attitude nécessite un étalonnage en vol de ces changements d'alignement et distorsions. Les données et les commandes de la charge utile et des capteurs sont paramétrées par rapport aux systèmes de coordonnées locaux.


Représentation d'attitude

Auteur: Gary Quinsac

Introduction

L'orientation d'un satellite dans l'espace correspond à l'orientation du repère fixé sur son corps par rapport à un autre repère, tel que ceux vus précédemment. Ainsi, la détermination d'attitude d'un satellite en particulier requiert des méthodes d'estimation de la matrice orthogonale transformant des vecteurs d'un référentiel de référence fixé dans l'espace à un référentiel fixé par rapport au corps du satellite. De plus, une mission spatiale ne peut être définie par un unique référentiel. En fonction des besoins, de l'échelle à laquelle on se place, il est nécessaire d'utiliser tel ou tel référentiel. Dès lors, le passage d'un référentiel à un autre devient un aspect crucial du SCAO. L'une des plus importantes propriétés des matrices d'attitude est énoncée par le théorème d'Euler.

definitionThéorème d'Euler

L'orientation instantanée d'un objet peut toujours être décrite par une unique rotation autour d'un axe fixe.

On peut parler de pôle eulérien pour nommer le centre de rotation. Il doit son nom au mathématicien et physicien suisse Leonhard Euler. Dès lors qu'un point d'un solide reste fixe lors d'un déplacement, ce déplacement est équivalent à une rotation autour d'un axe passant par le point fixe (pôle eulérien). En algèbre linéaire, ce théorème implique que deux référentiels cartésiens partageant la même origine sont reliés par une rotation autour d'un axe fixe.

Leonhard Euler
images/Leonhar-Euler.jpg
Portrait par Johann Georg Brucker (1756).
Crédit : Domaine public

Les relations permettant de jongler entre les systèmes de coordonnées peuvent être charactérisées de différentes manières, comportant chacune leurs lots d'avantages et inconvénients. Certaines d'entre elles sont présentées dans la partie suivante :

Les démonstrations des principales relations sont proposées en exercices.


Matrice du cosinus directeur

La façon la plus évidente de donner l'orientation d'un référentiel par rapport à un autre est d'exprimer leurs vecteurs de base dans l'autre repère.

Changement de repère en 2D

Une introduction simple à ce changement de repère peut être faite en 2D. Prenons un référentiel R, avec les axes X_R et Y_R, incliné par rapport à un référentiel B, d'axes X_B et Y_B, d'un angle \theta. Le vecteur \bold {OP} peut être exprimé dans ces deux systèmes sous forme matricielle :{\bold {OP}}_R = \binom{x_R}{y_R} et {\bold {OP}}_B = \binom{x_B}{y_B}.

La relation entre les deux systèmes de coordonnées peut être décrite par une matrice de cosinus directeur (MCD), ou matrice de rotation, variant avec \theta. Cette matrice transforme le vecteur \bold{OP} du premier référentiel R vers le second B.

\binom{x_B}{y_B} = \begin{pmatrix} cos \theta & sin \theta \\ 0 & 0 \end{pmatrix} \binom{x_R}{y_R}

Les éléments de la MCD correspondent aux produits scalaires des vecteurs de base. Le produit scalaire entre deux vecteurs unitaires correspond au cosinus de l'angle formé par ces vecteurs.

activiteAppliquette interactive

Une appliquette interactive est disponible ici. Elle revient sur le changement de repère en 2D en permettant de projeter les coordonnées d'un point dans un référentiel en rotation par rapport à un autre.

Généralisation à l'espace à 3 dimensions

En 3 dimensions la MCD est une matrice de passage 3x3. L'expression d'un vecteur \bold v_B dans B à partir de son expression \bold v_R dans R s'écrit :

\bold v_B = [T]_{B|R} \bold v_R avec [T]_{B|R} = \begin{pmatrix} \bold B_x \cdot \bold R_x & \bold B_x \cdot \bold R_y & \bold B_x \cdot \bold R_z \\ \bold B_y \cdot \bold R_x & \bold B_y \cdot \bold R_y & \bold B_y \cdot \bold R_z \\ \bold B_z \cdot \bold R_x & \bold B_z \cdot \bold R_y & \bold B_z \cdot \bold R_z \end{pmatrix}

On dit que la MCD décrit l'orientation de B par rapport à R. On l'appelle également matrice de rotation ou matrice de transformation des coordonnées de R vers B.

Rotations élémentaires

Trois rotations élémentaires de R autour de chacun de ses trois axes se retrouvent décrites par les matrices de rotation suivantes :

[T(\theta_1)]_1 = \begin{pmatrix} 1 & 0 & 0 \\ 0 & c_{\theta_1} & s_{\theta_1} \\ 0 & -s_{\theta_1} & c_{\theta_1} \end{pmatrix}, [T(\theta_2)]_2 = \begin{pmatrix} c_{\theta_2} & 0 & -s_{\theta_2} \\ 0 & 1 & 0 \\ s_{\theta_2} & 0 & c_{\theta_2} \end{pmatrix} et [T(\theta_3)]_3 = \begin{pmatrix} c_{\theta_3} & s_{\theta_3} & 0 \\ -s_{\theta_3} & c_{\theta_3} & 0 \\ 0 & 0 & 1 \end{pmatrix}

[T(\theta_i)]_i indique une rotation d'angle \theta_i autour du i-ème axe du référentiel fixé sur le corps.

Propriétés de la MCD

La MCD est une matrice orthogonale, ce qui signifie que son inverse est égal à sa transposée :

[T]^{-1} = [T]^T et [T][T]^T = [I] = [T]^T[T]

\bold v_R = [T]_{R|B}^T \bold v_B = \begin{pmatrix} \bold B_x \cdot \bold R_x & \bold B_y \cdot \bold R_x & \bold B_z \cdot \bold R_x \\ \bold B_x \cdot \bold R_y & \bold B_y \cdot \bold R_y & \bold B_z \cdot \bold R_y \\ \bold B_x \cdot \bold R_z & \bold B_y \cdot \bold R_z & \bold B_z \cdot \bold R_z \end{pmatrix}

Les transformations successives entre référentiels peuvent être déterminées par une série de multiplications matricielles. Par exemple, la transformation du référentiel inertiel au référentiel du satellite peut être décomposée de la manière suivante : transformation du référentiel inertiel au référentiel fixé sur la Terre multipliée par la transformation du référentiel fixé sur la Terre au référentiel orbital, le tout multiplié par la transformation du repère orbital au repère du satellite.

[T]_{sat|inertiel} = [T]_{sat|orbite} [T]_{orbite|Terre} [T]_{Terre|inertiel}

Limitations de cette représentation

Malgré certains avantages, la MCD n'est pas toujours la représentation la plus adaptée. Elle utilise 9 paramètres pour décrire une orientation, parmi lesquels seulement 3 sont indépendants.


Angles d'Euler

Présentation des angles d'Euler

Les angles d'Euler sont les angles introduits par Leonhard Euler pour décrire l'orientation d'un solide. Ils peuvent être utilisés pour définir l'orientation d'un référentiel par rapport à un autre. On obtient une rotation en faisant varier l'un des trois angles d'Euler et une séquence de 3 rotations est suffisante pour décrire n'importe quelle transformation. La première rotation est effectuée selon n'importe quel axe, tandis que les deux suivantes ne peuvent jamais être effectuées autour d'un axe utilisé par la rotation précédente. Au total, 12 jeux d'angles d'Euler existent : (1,2,1), (1,2,3), (1,3,1), (1,3,2), (2,1,2), (2,1,3), (2,3,1), (2,3,2), (3,1,2), (3,1,3), (3,2,1), (3,2,3). L'ordre des rotations et la valeur des angles ne sont pas uniques et sont sujets à des singularités mathématiques.

Exemples

activiteAppliquette interactive

Une appliquette interactive est disponible ici. Elle permet de visualiser dans l'espace les séquences d'Euler qui sont introduites dans cette section à titre d'exemple.

Les angles d'Euler décrivent une rotation unique, ce qui est généralement un avantage par rapport à la MCD. Cependant, à une orientation donnée correspondent plusieurs jeux d'angles d'Euler.

De la séquence d'Euler à la MCD

Quelle que soit la séquence d'Euler, la MCD peut facilement être obtenue en multipliant les matrices de rotation élémentaires. Soit la séquence particulière suivante, décrivant l'orientation du référentiel B par rapport au référentiel A :

[T(\theta_1)]_1 \leftarrow [T(\theta_2)]_2 \leftarrow [T(\theta_3)]_3

[T]_{B|A} = [T(\theta_1)]_1 [T(\theta_2)]_2 [T(\theta_3)]_3, donc : [T]_{B|A} = \begin{pmatrix} c_{\theta_2} c_{\theta_3} & c_{\theta_2} s_{\theta_3} & -s_{\theta_2} \\ s_{\theta_1} s_{\theta_2} c_{\theta_3} - c_{\theta_1} s_{\theta_3} & s_{\theta_1} s_{\theta_2} s_{\theta_3} + c_{\theta_1} c_{\theta_3} & s_{\theta_1} c_{\theta_2} \\ c_{\theta_1} s_{\theta_2} c_{\theta_3} +s_{\theta_1} s_{\theta_3} & c_{\theta_1} s_{\theta_2} s_{\theta_3} - s_{\theta_1} c_{\theta_3} & c_{\theta_1} c_{\theta_2} \end{pmatrix}

Nous avons utilisé les notations c_{\theta} = cos \ \theta et s_{\theta} = sin \ \theta.

Limites de cette représentation

D'une manière générale, les angles d'Euler déterminent une orientation unique, ce qui est un avantage sur la MCD. Des singularités apparaissent lorsque le deuxième angle d'Euler aligne les premier et troisième axes de rotation. Dans ce cas, cette description d'attitude à 3 degrés dégénère en une description à seulement 2 degrés de liberté. Cette condition est réalisée lorsque l'angle vaut 90 et 270 degrés pour les 6 rotations où les premier et troisième axes sont différents, et lorsque l'angle vaut 0 et 190 degrés pour les 6 rotations où les premier et troisième axes sont identiques.

Séquence d'Euler pour les paramètre orbitaux
images/euler-313.png
La séquence d'Euler (3-1-3) correspond aux paramètres orbitaux habituellement utilisés pour un satellite en orbite terrestre : le nœud ascendant (\Omega), l'inclinaison (i) et l'anomalie vraie (\nu).
Crédit : Gary Quinsac
Séquence d'Euler pour les roulis, tangage et lacet
images/Satellite-roulis-tangage-lacet.png
La séquence d'Euler (3-1-2) correspond aux angles de roulis, tangage et lacet. Ils sont illustrés avec le satellite d'observation de la Terre SPOT 3.
Crédit : Gary Quinsac

Quaternions

Auteur: Gary Quinsac

Représentation 3D

Afin de s'affranchir du problème de singularité rencontré avec les angles d'Euler, une représentation de l'attitude composée de 4 éléments est introduite sous le nom de quaternion (dont les éléments sont appelés paramètres d'Euler). Cette construction mathématique est présentée plus en détail dans la partie suivante.

Présentation des quaternions

Considérons l'axe fixe de la rotation présentée dans le théorème d'Euler, ou vecteur propre \bold e. C'est un vecteur unité possédant les mêmes composantes dans les référentiels de départ et d'arrivée : \bold e_r = \bold e_b. Ainsi, 4 grandeurs sont requises pour décrire de façon non-ambigüe l'orientation par rapport à un référenciel : les 3 composantes de \bold e et l'angle de la rotation, \theta.

Les quaternions sont une combinaison de ces éléments disposés dans un vecteur de 4 éléments \bold q. Le quaternion contient la même information qu'une MCD à 9 éléments, tout en s'affranchissant des problèmes de singularité rencontrés avec les angles d'Euler. Ils sont à la fois compacts et une représentation efficace de l'orientation pour la détermination d'attitude. Une même rotation est représentée par les quaternions \bold q et - \bold q. On note également que les quatre paramètres d'Euler ne sont pas indépendants, mais contraints par la relation suivante :

\bold q^T \bold q = q_0^2 + q_1^2 + q_2^2 + q_3^2

Pour le vecteur propre \bold e_R = \bold e_B = \begin{pmatrix} e_1 \\ e_2 \\ e_3 \end{pmatrix}, les paramètres d'Euler sont : \bold q = \begin{pmatrix} q_0 \\ q_1 \\ q_2 \\ q_3 \end{pmatrix}, avec q_0 = cos({\theta \over 2}), q_1 = e_1 sin({\theta \over 2}), q_2 = e_2 sin({\theta \over 2}) et q_3 = e_3 sin({\theta \over 2}).

Des quaternions à la MCD

De la même façon que l'on peut exprimer la MCD en fonction des angles d'Euler, elle peut être paramétrée en fonction d'un quaternion de la manière suivante :

[T]_{B|R} = [T(\bold q)] = \begin{pmatrix} 1-2(q_2^2+q_3^2) & 2(q_1q_2+q_3q_0) & 2(q_1 q_3 - q_2 q_0) \\ 2(q_2q_1-q_3q_0) & 1-2(q_1^2+q_3^2) & 2(q_2q_3+q_1q_0) \\ 2(q_3q_1+q_2q_0) & 2(q_3q_2-q_1q_0) & 1-2(q_1^2+q_2^2) \end{pmatrix}

Propriétés des quaternions

Avantage des quaternions

Un avantage inhérent à cette représentation est que les équations de la cinématique deviennent purement algébriques et ne contiennent plus de fonctions trigonométriques.


Présentation mathématique

Les quaternions sont un système de nombres premièrement décrits par William Rowan Hamilton en 1843 appliqué à la mécanique et à l'espace à 3 dimensions.

complementWilliam Rowan Hamilton

Sir William Rowan Hamilton (04/08/1805 - 02/09/1865) est un mathématicien, physicien et astronome irlandais (né et mort à Dublin). Outre sa découverte des quaternions, il contribua également au développement de l'optique, de la dynamique et de l'algèbre. Ses recherches se révélèrent importantes pour le développement de la mécanique quantique.

William Rowan Hamilton
images/Hamilton_painting.jpg
Peinture de Sir William Rowan Hamilton.
Crédit : Domaine public

Définition mathématique

Autre représentation

Une autre façon de présenter un quaternion consiste à dire que q_0 est la partie scalaire de vecteur(q) et q_1 i + q_2 j + q_3 k est la partie vectorielle. Ainsi, la partie scalaire est toujours réelle et la partie vectorielle toujours purement imaginaire. Bien que l'on ait dit qu'un quaternion est un vecteur dans un espace à 4 dimensions, il est courant de définir un vecteur pour la partie imaginaire d'un quaternion : \bold q_{1:3} = q_1 i + q_2 j + q_3 k et \bold q = q_0+\bold q_{1:3}


Equations du mouvement

Auteur: Gary Quinsac

Introduction à la cinématique et la dynamique

Maintenant que nous avons étudié les différentes façons de décrire l'orientation d'un repère à l'instant t, nous pouvons introduire la notion de mouvement. Les équations du mouvement sont un aspect essentiel de la conception et de la réalisation d'un système de contrôle d'attitude car elles régissent la position au cours du temps des objets considérés. Ces équations peuvent être séparées en deux catégories :

Afin de clarifier les choses, prenons une particule ponctuelle de la physique newtonienne. Si \bold{r} représente sa position, \bold v sa vitesse et que les dérivées temporelles sont indiquées par un point, alors l'équation cinématique du mouvement s'écrit \dot{\bold{r}} = \bold{v}. L'équation dynamique du mouvement quant à elle s'écrit dans un repère galiléen m \dot{\bold{v}} = \bold{F} ou \dot{\bold{p}} = \bold F, avec \dot{\bold{p}} = m \dot{\bold{v}} la quantité de mouvement, \bold F la résultante des forces appliquées et m la masse de la particule. Comme vous le verrez par la suite, dès lors que l'on s'intéresse aux mouvement d'attitude (autour du centre d'inertie), les vecteur de position et de vitesse sont respectivement remplacés par la matrice d'attitude et le vecteur de vitesse angulaire \boldsymbol\omega. Les forces et quantités de mouvement sont quant à elles remplacées par le couple \bold C et le moment angulaire \bold H. La cinématique et la dynamique du mouvement rotationnel, ou d'attitude, sont plus compliquées que celles du mouvement de translation. Elles sont détaillées dans la section suivante.

complementAller plus loin


Cinématique du satellite

Auteur: Gary Quinsac

Cinématique du point

La cinématique est l'étude du mouvement en fonction du temps indépendammant des causes produisant ce mouvement. Elle est utilisée pour décrire la trajectoire du centre de masse d'un satellite dans l'espace.

Bases de la cinématique

Des cours sur ce sujet existent un peu partout, nous rappellerons simplement quelques notions de base ici :

Dans le cas d'un mouvement circulaire, chaque point du corps tourne dans un cercle.

Cinématique et changement de référentiels

Dans notre domaine, nous sommes constamment contraints de passer d'un repère à un autre pour décrire la trajectoire d'un objet. En cas de référentiels en rotation, tels qu'un référentiel fixé par rapport à la Terre et un référentiel inertiel, passer de l'un à l'autre nécessite d'introduire des termes supplémentaires. Par exemple, si l'on veut décrire la position, la vitesse et l'accélération d'une particule dans un référentiel inertiel noté I à partir de sa position dans un référentiel terrestre (fixé par rapport à la Terre) noté F, on peut écrire :


Cinématique d'attitude

La simulation et l'estimation d'attitude nécessitent généralement des représentations simples de l'attitude, telles que celles présentées dans le chapitre du même nom. Les équations différentielles de la cinématique peuvent ainsi être obtenues pour ces différentes représentations. Les démonstrations de ces équations sont proposées en exercices.

La cinématique d'attitude relie des vitesses angulaires à des orientations dans l'espace. Si cela peut sembler simple dans le cas d'une rotation autour d'un axe fixe, cela devient beaucoup moins intuitif dans le cas d'un mouvement plus général, où l'axe de rotation varie au cours du temps. Pour un corps en rotation autour d'un axe fixe, l'orientation par rapport à cet axe peut être déterminée en intégrant la vitesse angulaire ω, puisque \omega = \frac{d}{dt}(\theta).

MCD

Dans le cas général, la matrice exprimant le taux de variation de l'attitude est plus complexe. Considérons un référentiel B en rotation par rapport à un référentiel A avec une vitesse angulaire \boldsymbol\omega_{B|A}. Si la matrice d'attitude s'exprime [T]_{B|A}, alors :

\frac{d}{dt} \left( [T]_{B|A} \right) = -[\Omega] \ [T]_{B|A} avec [\Omega] = \begin{pmatrix} 0 & -\omega_z & \omega_y \\ \omega_z & 0 & -\omega_x \\ -\omega_y & \omega_x & 0 \end{pmatrix}

La matrice d'attitude se retrouve multipliée par une matrice anti-symétrique qui est définie à partir du vecteur \boldsymbol\omega_{B|A} représentant la vitesse angulaire du référentiel B par rapport au référentiel A, avec \boldsymbol\omega_{B|A} = \begin{pmatrix} \omega_x \\ \omega_y \\ \omega_z \end{pmatrix}.

Dans ce cas, nous avons utilisé une MCD.

Angles d'Euler

Il est également possible d'exprimer cette équation différentielle en utilisant les angles d'Euler. En reprenant la séquence de rotations [T(\theta_1)]_1 \leftarrow [T(\theta_2)]_2 \leftarrow [T(\theta_3)]_3 conduisant du référentiel A au référentiel B l'équation de la cinématique est réécrite :

\begin{pmatrix} \dot{\theta_1} \\ \dot{\theta_2} \\ \dot{\theta_3} \end{pmatrix} = \frac{1}{\textup{cos}(\theta_2)} \begin{pmatrix} \textup{cos}(\theta_2) & \textup{sin}(\theta_1) \ \textup{sin}(\theta_2) & \textup{cos}(\theta_1) \ \textup{sin}(\theta_2) \\ 0 & \textup{cos}(\theta_1) \ \textup{cos}(\theta_2) & -\textup{sin}(\theta_1) \ \textup{cos}(\theta_2) \\ 0 & \textup{sin}(\theta_1) & \textup{cos}(\theta_1) \end{pmatrix} \begin{pmatrix} \omega_1 \\ \omega_2 \\ \omega_3 \end{pmatrix}

En connaissant la vitesse angulaire d'un référentiel par rapport à l'autre en fonction du temps il est possible de déterminer la position au cours du temps d'un référentiel par rapport à l'autre. Néanmoins, l'intégration nécessite le calcul de fonctions trigonométriques ainsi que des singularités (ici \theta_2 = \pm \frac{\pi}{2}).

Quaternions

Dans le cas des quaternions, l'expression de l'équation de la cinématique se retrouve simplifiée :

\dot{\bold q} = \begin{pmatrix} \dot{q_0} \\ \dot{q_1} \\ \dot{q_2} \\ \dot{q_3} \end{pmatrix} = \frac{1}{2} \begin{pmatrix} 0 & -\omega_1 & -\omega_2 & -\omega_3 \\ \omega_1 & 0 & \omega_3 & -\omega_2 \\ \omega_2 & -\omega_3 & 0 & \omega_1 \\ \omega_3 & \omega_2 & -\omega_1 & 0 \end{pmatrix} \begin{pmatrix} q_0 \\ q_1 \\ q_2 \\ q_3 \end{pmatrix}

Une écriture plus compacte est possible :

\begin{cases} \dot{\bold q}_{1:3} = \frac{1}{2} \left(q_0 \ \boldsymbol\omega - \boldsymbol\omega \wedge \bold q_{1:3} \right) \\ \dot{q}_0 = -\frac{1}{2} \ \boldsymbol\omega^T \bold{q}_{1:3} \end{cases}

Contrairement aux angles d'Euler, les quaternions ne présentent pas de singularité géométrique. L'équation cinématique exprimée avec les quaternions ne possède pas de fonctions trigonométriques, ce qui rend les quaternions parfaitement adaptés aux calculs à bord réalisés en temps réel. Ainsi, les algorithmes de détermination d'attitude modernes sont généralement décrits en termes de quaternions.


Dynamique du satellite

Auteur: Gary Quinsac

Bases de la dynamique

Maintenant que nous nous tournons vers la dynamique d'attitude, il est important de bien différencier le mouvement de rotation d'un système du mouvement de son centre d'inertie. Nous allons nous concentrer sur le cas d'un corps rigide.

Force / Moment / Couple

Une force représente l'action d'un corps sur un autre. En revanche le moment d'une force par rapport à un point décrit l'aptitude de cette force à faire tourner un système autour de ce point. Le moment \bold \Gamma_O de la force \bold F par rapport à au point O est défini par :

\bold \Gamma_O = \bold{OM} \wedge \bold F

On parle de couple lorsqu'un ensemble de forces a une résultante nulle sur un système (leur somme vaut 0) alors que le moment résultant par rapport à un point O est non nul. Dans ce cas, il est possible de montrer que le moment global d'un tel couple par rapport à n'importe quel point est égal au produit vectoriel caractéristique du couple :

\bold C= \bold{r} \wedge \bold F

\bold r est le vecteur allant du centre de gravité du système au point d'application de la force \bold F. Si, pour un corps solide sans contraine, une force va accélérer son centre de masse, un couple aura lui pour effet d'induire un mouvement de rotation autour du centre de masse.

remarqueRemarque

On parle de couple pur lorsqu'une paire de forces d'intensité égale mais de directions opposées agissent à distance.

Propriétés d'inertie

Lorsque l'on parle du mouvement d'un solide autour de son centre d'inertie, il nous faut définir le tenseur d'inertie. Il s'exprime ainsi :

[I] = \begin{pmatrix} I_{xx} & -I_{xy} & -I_{xz} \\ -I_{xy} & I_{yy} & -I_{yz} \\ -I_{xz} & -I_{yz} & I_{zz} \end{pmatrix} = \begin{pmatrix} \sum_{i=1}^{n}{m_i \left(y_i^2+z_i^2 \right)} & -\sum_{i=1}^{n}{m_i \ x_i \ y_i} & -\sum_{i=1}^{n}{m_i \ x_i \ z_i} \\ -\sum_{i=1}^{n}{m_i \ x_i \ y_i} & \sum_{i=1}^{n}{m_i \left(x_i^2+z_i^2 \right)} & -\sum_{i=1}^{n}{m_i \ y_i \ z_i} \\ -\sum_{i=1}^{n}{m_i \ x_i \ z_i} & -\sum_{i=1}^{n}{m_i \ y_i \ z_i} & \sum_{i=1}^{n}{m_i \left(x_i^2+y_i^2 \right)} \end{pmatrix},

Les éléments diagonaux de ces expressions sont les moments d'inertie du solide par rapport aux divers axes, et les autres éléments sont les produits d'inertie. Les propriétés inertielles d'un solide sont donc totalement décrites par sa masse, la localisation de son centre d'inertie (ou centre de masse), et par les moments et produits d'inertie définis par rapport à des axes de références en un point particulier. Tous les solides ont un jeu d'axes principaux d'inertie dont l'origine se trouvent en son centre de masse et qui annule les produits d'inertie, rendant diagonale la matrice d'inertie.

activiteAppliquette interactive

Une appliquette interactive est disponible ici. Elle illustre l'importance du choix des axes d'inertie dans le calcul de la matrice d'inertie.

Moment cinétique

L'analogie avec l'étude du centre de masse est une nouvelle fois possible. Le moment linéaire d'un corps solide, produit de la masse de ce corps par la vitesse de son centre de masse, est appelé quantité de mouvement, m \ \bold v. Considérons un système matériel qui est la somme de n masses ponctuelles. Le moment angulaire, ou moment cinétique, par rapport à un point O est le moment de la quantité de mouvement \bold p par rapport à ce point O :

\bold L_O = \sum_{i=1}^{n}{\bold r_i \wedge \left( m_i \ \bold v_i \right)} = \sum_{i=1}^{n}{\bold r_i \wedge \bold p_i}

On a également pour habitude d'exprimer le moment angulaire à partir de la matrice de moment d'inertie [I] et de la vitesse angulaire \boldsymbol\omega :

\bold L = [I] \ \boldsymbol\omega

Le passage de l'une à l'autre des expressions se fait en considérant que :

rappelRappel


Dynamique du solide

Considérons un satellite solide avec un référentiel fixé sur son corps B dont l'origine se trouve au centre de masse du satellite. Notons \boldsymbol\omega_{B|I} le vecteur vitesse angulaire du référentiel B par rapport au référentiel inertiel I.

Equation d'Euler

D'après la 2ème loi de Newton, dans un référentiel galiléen, la dérivée de la quantité de mouvement est égale à la somme des forces extérieures qui s'exercent sur le solide. Dans le cas du moment angulaire, son principe de conservation stipule que sa dérivée est égale à la somme des couples extérieurs qui s'exercent sur le corps :

\dot{\bold L} = \sum_{i=1}^{n}{\bold r_i \wedge \bold F_i^{ext}} = \sum_{i=1}^{n}{\bold C_i^{ext}}

\bold L est le moment angulaire du corps solide par rapport à son centre de masse et \bold C_i^{ext} sont les couples extérieurs agissant sur ce corps. On appelle parfois cette équation l'équation d'Euler. Elle montre que seuls les couples extérieurs peuvent modifier le moment cinétique dans un système.

Facteurs impactant l'attitude d'un satellite

Il est maintenant possible de réécrire cette équation en reprenant l'expression du moment cinétique présentée précédemment complétée par le moment angulaire stocké par n'importe quel objet en rotation dans le satellite \bold L = [I] \boldsymbol\omega+ \bold h :

[I] \dot{\boldsymbol\omega} = \sum_{i=1}^{n}{\bold C_i^{ext} - \dot{\bold h} - \dot{[I]} \boldsymbol\omega}

Cette dernière équation permet de comprendre comment l'attitude d'un satellite peut être modifiée. En prenant les termes de cette équation de la gauche vers la droite, on retrouve d'abord les couples extérieurs, les objets embarqués en rotation (tels que les roues à inertie) et les modifications des moments d'inertie du satellite (qui peuvent notamment être dues à la perte de carburant au cours d'une mission).

En conclusion, les couples peuvent perturber l'attitude d'un satellite mais peuvent également être utilisés pour la contrôler. Les actionneurs doivent donc avoir une capacité suffisante pour contrer les couples perturbateurs tout au long de la mission si l'on veut un contrôle permanent de l'attitude du satellite.


Perturbations

Auteur: Gary Quinsac

Perturbations : introduction

Les faibles forces agissant sur un satellite sont connues pour dégrader la précision de pointage et engendrer des déformations mécaniques.

Des perturbations de différentes origines...

On peut distinguer les perturbations externes des perturbations internes au satellite. Dans la première catégorie on retrouve la pression de radiation solaire, la trainée atmosphérique ou pression dynamique, le couple magnétique dû au dipôle résiduel et le gradient de gravité. Les perturbations internes sont liées aux équipements présents dans le satellite. Si certains sont utilisés pour contrôler le satellite, comme les roues à inertie, la plupart sont à l'origine de couples perturbateurs. Parmi ces phénomènes, on retrouve les mécanismes tels que ceux utilisés pour les panneaux solaires ou les instruments mobiles, le désalignement et la quantification des actionneurs, le déplacement du carburant, l'incertitude sur le positionnement du centre de gravité, le frottement des roues à inertie ou encore le dégazage des polymères.

Les forces extérieures sont les plus importantes pour la majorité des CubeSats car ceux-ci sont généralement dépourvus de mécanismes ou de parties mobiles. On dénombre 4 sources environmentales de couples perturbateurs dont l'intensité varie grandement en fonction de la position du satellite dans l'espace :

Ayant différents effets

On remarque que les perturbations citées précédemment peuvent avoir deux types d'effets : séculaire ou cyclique. Les perturbations ayant un effet cyclique sont en moyenne nulles sur une orbite circulaire. Les perturbations séculaires s'accumulent durant une orbite et sont analogues à une force non-conservative. Or, on se souvient que les couples extérieurs sont proportionnels à la variation du moment cinétique du satellite. La gestion du moment cinétique va donc dépendre du type de perturbation auquel le satellite aura affaire. Suivant le pointage, certaines perturbations extérieures peuvent être cycliques ou séculaires. Dans le cas d'un pointage inertiel, on parle d'effets cycliques pour la traînée atmosphérique, le gradient de gravité et les couples magnétiques, alors qu'on parle d'effets séculaires pour les couples de pression de radiation solaire. Dans le cas d'un autre pointage classique, le pointage nadir, les couples magnétiques et de pression solaire ont des effets cycliques, à l'inverse de la trainée atmosphérique. Pour ce qui est des gradients de gravité, ils peuvent avoir les deux types d'effets.

Perturbations environmentales
images/perturbations-environmentales-fr1.png
Couples perturbateurs dus à l'environement du satellite.
Crédit : Gary Quinsac
Couples subis par un CubeSat de 3U
images/couples-perturbateurs.png
Les couples maximums subis par un CubeSat de 3U autour de la Terre et Mars sont représentés (respectivement en traits pleins et pointillés). Mars n'ayant pas ou peu de champ magnétique et une atmosphère très ténue, les couples associés ne sont pas représentés car trop faibles.
Crédit : Gary Quinsac
Couple cyclique ou séculaire : fonction du pointage
images/couples-seculaires-et-cycliques.png
Le couple de pression de radiation solaire est plus ou moins constant dans le cas d'un pointage inertiel, à l'origine d'une accumulation du moment cinétique : c'est un couple séculaire. Au contraire, ce couple est moyennement nul sur une orbite pour un satellite effectuant un pointage nadir : on dit alors que le couple est cyclique.
Crédit : Gary Quinsac
Gestion du moment cinétique
images/gestion-moment-cinetique.png
On peut voir l'accumulation du moment cinétique au cours d'une orbite dans le cas d'un couple séculaire, nécessitant de décharger celui-ci avec des actionneurs appropriés. En revanche le couple cyclique peut être stocké par un actionneur qui va se contenter de fournir un couple en opposition de phase tout au long de l'orbite.
Crédit : Gary Quinsac

Perturbations externes

Auteur: Gary Quinsac

Champ magnétique

Certains corps célestes, dont la Terre, ont des champs magnétiques assez puissants pour induire d'importants effets dans l'espace environnant. Ce champ interagit avec tout autre champ magnétique qu'il rencontre. En général, les satellites ont eux-mêmes un certain niveau de moment magnétique résiduel qui se traduit par un champ magnétique propre relativement faible. Ils se comportent comme des dipôles magnétiques car ils sont parcourus par des boucles de courant. Ainsi, un courant de I ampères circulant dans une boucle plane d'aire A produit le moment dipolaire (en A.m) :

\bold D = I \ A \ \bold n_A

Des méthodes de compensation sont généralement mises en œuvre à bord. Si le moment magnétique résiduel d'un satellite n'est pas aligné avec le champ magnétique local un couple magnétique apparaît et modifie l'attitude du satellite. Le couple magnétique \bold C_m est donné par :

\bold C_m = \bold D \wedge \bold B

\bold B (en T) représente le champ magnétique.

remarqueChamp magnétique terrestre

Bien que le champ magnétique de la Terre soit complexe, il est souvent suffisant de le modéliser tel un dipôle (30% d'erreur sont souvent considérés) et de déterminer la valeur maximum possible. Le couple maximum peut donc être estimé à partir du champ magnétique B = \frac{M}{r^3} \ \lambda, où M (en T.m3) est le moment magnétique terrestre multiplié par la constante magnétique, r la distance entre le satellite et le centre du corps , et enfin \lambda une fonction sans unité de la latitude magnétique qui prend des valeurs allant de 1 au niveau de l'équateur magnétique à 2 aux pôles magnétiques. Des modèles utilisant des harmoniques sphériques existent, à la manière du champ gravitationnel terrestre, mais la précision qu'ils permettent d'atteindre n'est pas nécessaire lors des premières phases de développement du projet spatial. L'un de ces modèles, le "12th generation of the International Geomagnetic Reference Field (IGRF)", est utilisé pour calculer le champ magnétique obtenu sur une trajectoire circulaire de 500 km d'altitude inclinée de 50°. Celui-ci est représenté par rapport au plan local tangent ou repère NED ("North East Down"). On remarque qu'il varie grandement au cours de l'orbite.

Dipôle magnétique terrestre
images/champ-magnetique.png
La Terre peut être assimilée à un dipôle magnétique dont l'axe est incliné d'à peu près 11° par rapport à l'axe nord-sud géographique. Attention, le pôle sud magnétique se trouve du coté du pôle nord géographique.
Crédit : Gary Quinsac
Champ magnétique terrestre sur une orbite
images/champ-magnetique-ned.png
Champ magnétique sur une orbite terrestre circulaire de 500 km d'altitude et 50° d'inclinaison dans le référentiel NED.
Crédit : Gary Quinsac

En dehors de quelques corps du système solaire, tels que la Terre et Jupiter, la plupart des régions de l'espace ne possèdent pas un champ magnétique suffisamment puissant et bien connu pour qu'un contrôle d'attitude magnétique puisse être utilisé par un satellite s'y trouvant.

complementAller plus loin


Gradient de gravité

Le gradient de gravité résulte de l'interaction du champ gravitationnel, lui-même proportionnel à l'inverse du carré de la distance, avec un satellite de masse non ponctuelle. L'accélération gravitationnelle est la plus forte sur la partie du satellite la plus proche du corps attracteur. Le gradient est à l'origine d'un couple qui peut être utilisé pour contrôler passivement l'attitude du satellite. Les couples de gradient de gravité apparaissent lorsque le centre de gravité d'un satellite en orbite n'est pas aligné avec le centre de masse par rapport à la verticale locale.

remarqueCentres de masse et de gravité

Le centre de masse, également appelé centre d'inertie, est le barycentre des masses d'un objet. Le centre de gravité, quant à lui, est le point d'application de la résultante des forces de gravité. Si ceux-ci sont souvent confondus, ce n'est plus le cas lorsque le champ de gravitation n'est plus uniforme dans le corps en question.

On exprime le gradient de gravité \bold C_{GG} de la manière suivante :

\bold C_{GG} = \int_{b}{\bold r_b \wedge d \bold F_{GG}}

\bold r_b est le vecteur position allant du centre de gravité du satellite à l'élément de masse et d \bold F_{GG} est la force de gravité s'appliquant sur ce même élément de masse :

d \bold F_{GG} = \frac{-G \ M}{|{\bold r_i}^3|} \ \bold r_i \ dm

G est la constante gravitationnelle, elle vaut 6,67259 \times 10^{-11} \ \textup{m}^{3}.\textup{kg}^{-1}.\textup{s}^{-2}, M est la masse du corps attracteur et \bold r_i est le vecteur position de l'élément de masse dm dans le référentiel inertiel (\bold r_i = \bold r_{CG} + \bold r_b). On peut finalement réécrire l'équation donnant le couple de gradient de gravité de la manière suivante :

\bold C_{GG} = \frac{3 \ G \ M}{|\bold r_{CG}|^5} \ \bold r_{CG} \wedge \left([I] \ \bold r_{CG} \right)

Ce couple dépend de la matrice d'inertie [I] du satellite. Différentes propriétés sont visibles dans cette équation : la magnitude est inversement proportionnelle au cube de la distance au centre du corps attracteur, sa direction est perpendiculaire au rayon vecteur et il disparaît lorsque l'un des axes principaux du satellite est aligné avec ce rayon vecteur.

complementStabilisation par gradient de gravité

Cette technique de contrôle d'attitude passive est assez utilisée pour des satellites en orbite terrestre devant pointer au nadir. Elle consiste à faire intéragir un satellite de forme particulière avec le champ gravitationnel afin de contraindre son orientation. Une masse peut être montée au bout d'un mât perpandiculaire à l'orbite afin de créer un moment d'inertie minimum selon cet axe. Cette masse étant plus proche, elle est plus attirée. Le satellite aura alors tendance à aligner cet axe d'inertie vers la verticale à l'orbite (qui est la direction d'attraction gravitationnelle).

complementAller plus loin

Gradient de gravité
images/gradient-gravite.png
Géométrie du couple de gradient de gravité.
Crédit : Gary Quinsac
Satellite stabilisé par gradient de gravité
images/stabilisation-gradient-gravite.png
Crédit : National Air and Space Museum, Smithsonian Institution.

Pression de radiation solaire

La pression de radiation solaire est la source dominante de couples perturbateurs dans l'espace interplanétaire (absence de traînée atmosphérique, faibles champs de gravité et magnétique). Même en orbite basse, on a pour habitude de considérer qu'il est dominant à des altitudes supérieures à 800 km. Il est important de noter que si le Soleil n'est pas l'unique source de radiation (il y a notamment l'albédo de la Terre et de la Lune, les rayons cosmiques...), il est de loin la plus importante. Le Soleil émet des photons, mais également des protons et des électrons (vent solaire). L'interaction entre la lumière du Soleil et la surface du satellite est habituellement modélisée comme une force de pression exercée sur un objet.

On modélise la surface du satellite comme une collection de N surfaces d'aire S_i, dont la normale orientée vers l'extérieur est notée \bold n_B^i dans le référentiel du satellite et de coefficient de réflexion C_R^i (on lui attribue généralement une valeur de 0,6 pour un petit satellite).

Le vecteur allant du satellite au Soleil dans le référentiel du satellite s'écrit vecteur(s). L'angle entre ce vecteur et et la normale à la ième surface s'écrit alors :

\textup{cos} \left(\theta_{PRS}^i \right) =  \bold n_B^i \cdot \bold s

La force de pression de radiation solaire exercée sur une surface peut alors s'exprimer de la manière suivante :

\bold F_{PRS}^i = - \bold P_S \ S_i \ C_R \ \textup{max} \left( \textup{cos} \left( \theta_{PRS}^i \right) \ ; \ 0 \right) avec P_S = \frac{\phi_S}{c}

\phi_S (en W.m) est l'irradiance solaire moyenne (fonction de la distance au Soleil) et c (en m/s) est la vitesse de la lumière.

La différence entre les positions des centres de pression solaire et de masse aboutit à un couple de radiation solaire. Une telle différence dépend des surfaces éclairées, de l'incidence des rayons lumineux et de la répartition de la masse à l'intérieur du satellite. On note \bold r_i le vecteur allant du centre de masse du satellite au centre de pression de radiation solaire de la ième surface. Le couple de radiation solaire s'écrit alors :

\bold C_{PRS} = \sum_{i=1}^{N}{\bold r_i \wedge \bold F_{PRS}^i}

complementComplément : coefficients de réflexion

Afin de gagner en précision, il est possible de détailler le coefficient de réflexion en une somme de trois coefficients dont le résultat vaut 1 :

La force de pression de radiation sur la ième surface s'exprime alors :

\bold F_{PRS}^i = -P_S \ S_i \left[ 2 \left( \frac{R_{diff}^i}{3} + R_{spec}^i \ \textup{cos} \left(\theta_{PRS}^i \right) \right) \bold n_B^i + \left( 1-R_{spec}^i \right) \bold s \right] \textup{max} \left( \textup{cos} \left( \theta_{PRS}^i \right) \ ; \ 0 \right)

complementComplément : irradiance solaire

L'irradiance solaire représente la quantité d'énergie solaire reçue par une surface de 1 m2 située à une certaine distance r du Soleil et exposée perpendiculairement. Afin de la calculer, il faut considérer la conservation de l'énergie rayonnée dans l'espace et écrire :

\phi_s = \phi_{\odot} \ \left( \frac{R_{\odot}}{r} \right)^2

avec \phi_{\odot} le flux émis à la surface du Soleil et R_{\odot} le rayon du Soleil. \phi_{\odot} est estimé en appliquant la loi de Stefan-Boltzmann au Soleil considéré comme un corps noir :

\phi_{\odot} = \sigma \ {T_{\odot}}^4

avec \sigma la constante de Stefan-Boltzmann et T_{\odot} la température thermodynamique du corps noir. À la distance moyenne Terre-Soleil (1 UA) l'irradiance solaire (ou constante solaire) vaut 1362 W.m-2.

remarqueZone d'ombre

Afin de simuler la pression de radiation solaire, il ne faut pas oublier les zones d'ombres dans lesquelles le satellite peut se retrouver. Par exemple, en orbite basse autour de la Terre, un satellite peut passer une partie importante de son orbite caché des rayons du Soleil. L'approche la plus simple est de considérer que l'ombre de la Terre est une projection cylindrique du diamètre de la Terre le long de l'axe Soleil-Terre. Sur cette figure on remarque qu'en faisant le produit scalaire de vecteur unitaire \bold e_{\odot \oplus} (Terre-Soleil) on obtient l'inégalité suivante lorsque le satellite se trouve dans la zone d'ombre :

\bold r \cdot \bold e_{\odot \oplus} < - \sqrt{r^2 - R_{\oplus}^2}

Géométrie du couple de pression de radiation solaire
images/geometrie-pression-radiation-solaire.png
Géométrie du couple de pression de radiation solaire. Chaque face du satellite exposée au Soleil subit une force qui, si elle est désaxée par rapport au centre de masse, engendre un couple.
Crédit : Gary Quinsac
Zones d'ombre
images/pression-radiation-solaire-zone-ombre.png
Géométrie simplifiée du problème de zone d'ombre en orbite terrestre.
Crédit : Gary Quinsac

Traînée atmosphérique

L'atmosphère ténue des corps célestes peut exercer une force de pression sur un satellite. Cela inclut toutes les interactions avec des particules non-chargées, comme les queues de comète, les poussières ou les éjectas. Dans le cas de la Terre, à quelques centaines de kilomètres d'altitude, ce couple peut être le plus important. De la même manière qu'avec le couple dû à la pression de radiation solaire, on calcule la force exercée par la traînée atmosphérique en considérant que le satellite est une collection de N surfaces d'aire Si. On définit de nouveau la normale orientée vers l'extérieur, notée \bold n_B^i, pour chacune des surfaces. La force s'exerçant sur chaque surface dépend de la vitesse relative du satellite par rapport à l'atmosphère. En première approximation, on considère que cette vitesse relative est égale à celle du satellite, mais en réalité ce n'est pas immédiatement la vitesse du satellite dans le référentiel inertiel, car l'atmosphère n'est pas stationnaire dans celui-ci. L'inclinaison de la ième surface par rapport à la vitesse relative du satellite s'exprime :

\textup{cos} \left( \theta_{aero}^i \right) = \frac{\bold n_B^i \cdot \bold v_{rel}}{||\bold v_{rel}||}

La force aérodynamique s'exerçant sur la ième surface est :

\bold F_{aero}^i = -\frac{1}{2} \ \rho \ C_x \ S_i \ ||\bold V_{rel}|| \ \bold V_{rel} \ \textup{max} \left( \textup{cos} \left( \theta_{aero}^i \right) ; 0 \right)

Dans cette équation, ρ est la densité atmosphérique et C_x est le coefficient de trainée. Ce coefficient est déterminé de manière empirique et se situe généralement entre 1.5 et 2.5. Un couple apparaît lorsque la force agissant sur le centre de la pression atmosphérique ne passe pas par le centre de masse. Une estimation de ce couple est donnée par l'équation suivante :

\bold C_{aero} = \sum_{i=1}^{N}{\bold r_i \wedge \bold F_{aero}^i}

\bold r_i est le vecteur allant du centre de masse du satellite au centre de pression de la ième surface.

En principe, les couples aérodynamiques peuvent être utilisés pour effectuer un contrôle passif de l'attitude, comme les plumes d'une flèche, et même pour un contrôle actif avec des surfaces amovibles.


Perturbations internes

Bien que les CubeSats puissent généralement être modélisés comme un simple corps solide, de nombreuses raisons peuvent rendre la situation beaucoup plus complexe :

On qualifie ces couples internes de couples d'échange de moment cinétique car ils correspondent à un échange de moment cinétique entre des composants d'un satellite complexe sans que le moment cinétique du satellite dans son ensemble ne soit modifié.


Matériel

Auteur: Gary Quinsac

Introduction aux capteurs et actionneurs

Capteurs

Les capteurs se trouvent en amont de la chaîne du SCAO. Historiquement, les progrès réalisés se sont concentrés sur leur résolution et leur précision, leur masse, leur taille et leur puissance. À partir d'une référence, un capteur déduit son orientation dans l'espace ou sa vitesse de rotation. Le choix d'un capteur dépend de nombreux paramètres techniques, parmi lesquels :

Les capteurs se basent sur différents types de mesures permettant ainsi de les classer :

Actionneurs

Les actionneurs sont des dispositifs conçus pour engendrer des forces ou couples capables de produire des mouvements du satellite. Les solutions existantes sont relativement variées et les principales peuvent être classées de la manière suivante :

Les actionneurs peuvent également être séparés en deux catégories. Ceux qui ne servent qu'au contrôle d'attitude, et ceux qui peuvent réaliser à la fois du contrôle d'attitude et du contrôle d'orbite.


Capteurs

Auteur: Gary Quinsac

Capteurs optiques

Les capteurs optiques fournissent l'orientation dans l'espace du repère du capteur, lui-même lié au repère du satellite, par rapport à des directions de références extérieures, telles que les étoiles, le Soleil et la Terre.

Capteurs stellaires

Un viseur d'étoiles ou capteur d'étoiles est un instrument optique qui repère les coordonnées d'une ou plusieurs étoiles et les compare ensuite aux éphémérides des étoiles enregistrées dans une bibliothèque inclue dans l'instrument. C'est l'instrument optique le plus précis (entre 1 et 10 secondes d'angle pour les plus performants). Il se compose d'un baffle afin d'éviter l'illumination par des éléments parasites tels que le Soleil, d'une partie optique chargée de collecter et focaliser la lumière sur un détecteur (CCD ou APS), d'une électronique de traitement du signal et d'un refroidisseur pour le détecteur. La matrice du détecteur est constituée de pixels qui permettent d'obtenir une image numérisée du champ de vue de l'instrument, chaque pixel étant repéré par ses coordonnées dans le repère lié au viseur stellaire. On détermine finalement la position d'une étoile en calculant le barycentre de l'énergie collectée sur les pixels éclairés. Les viseurs d'étoiles sont utilisés lorsqu'une connaissance fine de l'attitude est nécessaire. Ils ont besoin que la vitesse de rotation du véhicule soit contrôlée en amont afin de ne pas dépasser la vitesse de décrochage, vitesse au dessus de laquelle la lumière d'une étoile se trouve projetée sur de trop nombreux pixels durant la pose et ne permet plus la mesure.

Un capteur d'étoiles possède deux modes d'opération : le mode d'acquisition et le mode de suivi. Dans le premier, la position et la magnitude des objets brillants éclairant la matrice du détecteur sont comparées au catalogue d'étoiles afin de déterminer de façon grossière l'attitude du satellite sans information préalable. Une fois cette estimation de l'attitude intiale effectuée, le second mode permet le suivi sur la matrice des positions des étoiles identifiées. En sortie, un tel capteur est capable de fournir un quaternion d'attitude du repère capteur par rapport à un repère inertiel, tel que le repère J2000, et dans certains cas la vitesse de rotation du satellite.

Viseur d'étoile
images/capteur-stellaire.jpg
Viseur d'étoiles ASTROP APS développé par l'agence spatiale nationale allemande DLT et la compagnie Jena-Optronik en Allemagne. Il est équipé d'une technologie de protection de radiation permettant de longues missions.
Crédit : ESA, Jena-Optronik

Capteurs solaires

Les capteurs solaires permettent de déduire l'attitude du satellite de la mesure de l'angle d'incidence des rayons solaires sur le capteur. Ils sont classés en deux catégories : les capteurs analogiques et les capteurs digitaux. Dans les grosses missions satellitaires, ils permettent respectivement d'obtenir une précision de 1° à 0,1° et inférieure à 0,05°.

Capteur solaire digital
images/capteur-solaire-digital.jpg
Capteur solaire analogique pyramidal développé par NTO pour la plateforme de satellites de télécommunication Spacebus-4000. Il fournit la position du Soleil selon 2 axes avec une précision meilleure que 0,1°.
Crédit : ESA, NTO

Capteurs terrestres

Les capteurs terrestres sont utilisés pour déterminer l'orientation du satellite par rapport à la Terre. Plus précisément, c'est l'horizon de la Terre qui est utilisé, car la Terre elle-même peut couvrir jusqu'à 40% de l'espace environnant pour un satellite en orbite passe. Néanmoins, il est difficile de détecter précisément la limite de l'horizon à cause de l'atmosphère terrestre (jusqu'à 70 km), de la décroissance graduelle de l'énergie réémise par la Terre, des variations entre les régions illuminées ou à l'ombre, et enfin de la limite de précision des capteurs. Le principe de détection adopté est donc basé sur une variation thermique de l'élément sensible dans la bande spectrale infra-rouge où la Terre est vue comme un disque uniforme : la bande d'absorption du CO2 entre 14 et 16 μm. Ainsi, l'énergie émise par la Terre est plus homogène et l'horizon, précisément délimité, est visible de jour comme de nuit.

Ces capteurs peuvent être de deux types : les capteurs statiques, qui pointent dans une direction fixe, et les capteurs à balayage. Ils sont principalement utilisés sur des satellites en orbite basse et les satellites de télécommunication en orbite GEO ou MEO. Ils ont jusqu'à présent été assez peu utilisés sur CubeSats.


Capteurs magnétiques

Magnétomètres

Les magnétomètres convertissent un champ magnétique ambiant en tension électrique. Ils sont principalement constitués de bobines conductrices qui génèrent un courant ou une variation de courant lorsqu'elles sont placées dans un champ magnétique. Ils ne possèdent pas de partie mobile, n'ont pas besoin d'un champ de vue dégagé, consomment peu et sont faiblement encombrants. Ils peuvent néanmoins être contaminés par le champ magnétique local créé par des matériaux ferromagnétiques ou des boucles de courant dans les panneaux solaires. Ainsi, il faut compenser ces champs locaux s'ils sont connus, ou s'en affranchir en se plaçant à bonne distance (au bout d'un mât par exemple) dans le cas contraire. La technologie la plus utilisée, "flux gate", délivre directement la projection du champ magnétique selon l'axe de la bobine, contrairement aux magnétomètres à induction qui fournissent la dérivée temporelle de la projection du champ magnétique. Ces capteurs étant monoaxiaux, on associe généralement trois magnétomètres orientés orthogonalement afin de mesurer le vecteur champ magnétique instantané.

Les magnétomètres sont limités à des environnements possédant un champ magnétique suffisamment fort, et donc à l'orbite terrestre basse du fait de la décroissance en 1/r^3 de son champ magnétique (r étant l'altitude du satellite). On les utilise de différentes manières, l'une d'entre elles étant de calculer le champ magnétique instantané afin de mieux calibrer les couples à générer par les magnétocoupleurs. Ils servent surtout à restituer l'attitude du satellite avec une précision de quelques degrés du fait des erreurs de modélisation du champ magnétique, des erreurs d'orbitographie et de celles propres au capteur. Dans ce cas, seule la connaissance de deux axes est disponible, l'orientation autour du champ magnétique n'étant pas observable. Enfin, on peut utiliser la dérivée du champ magnétique afin d'obtenir une mesure sur 2 axes de la vitesse angulaire du satellite.

Magnétomètre monoaxial "fluxgate"
images/magnetometre-fluxgate.jpg
Un magnétomètre "fluxgate" génère son propre champ magnétique. En inversant régulièrement la direction du courant, on inverse le champ magnétique, ce qui permet d'obtenir un champ magnétique moyen nul. Dans le cas où la magnétomètre se trouve dans un champ magnétique ambiant, la moyenne n'est plus nulle et il est alors possible de connaître ce champ extérieur.
Crédit : Wikipedia

Capteurs inertiels

Les capteurs inertiels fournissent au satellite une mesure par rapport à une référence fixe dans l'espace. Les gyromètres délivrent l'attitude (vitesse angulaire) et les accéléromètres la position par rapport à cette référence. Pour les premiers, il y a détection du mouvement de rotation absolue, tandis que pour le second c'est le mouvement de translation accéléré qui est détecté. Nous ne nous intéresserons pas ici aux accéléromètres qui ne sont pas utiles à la détermination d'attitude.

Gyromètres

Les gyromètres mesurent donc les vitesses angulaires du satellite. On peut en déduire l'attitude de celui-ci en intégrant les vitesses calculées sur un temps donné. Ils sont très intéressants car ils permettent de fournir en permanence les mesures de vitesse de rotation sans se soucier du champ de vue et avec une très bonne précision à court terme. Ils fournissent également des informations à plus haute fréquence que les autres capteurs, ce qui est nécessaire pour certaines boucles de contrôle comme pour le contrôle du vecteur de poussée lors de phases de propulsion. On distingue plusieurs types de gyromètres : les gyromètres mécaniques, les gyromètres optiques et les gyromètres vibrants.

Gyromètres mécaniques

Les gyromètres mécaniques utilisent une toupie gyroscopique. Celle-ci possède une raideur gyroscopique du fait d'une vitesse de rotation élevée permettant de la maintenir selon une direction fixe. Tout couple s'exerçant celui-ci provoque l'écartement de cet axe par rapport à la direction initiale avec une vitesse faible du fait de la rigidité gyroscopique. Le principe consiste à estimer les mouvements du véhicule par rapport à la direction de référence que matérialise l'axe de rotation de la toupie.

Gyroscope
images/Gyroscope.png
Exemple de gyroscope. Tant que le rotor (plateau central) sera en rotation, il gardera son axe de rotation fixe quelles que soient les orientations des cercles extérieurs.
Crédit : Gary Quinsac

Gyromètres optiques

Les gyromètres optiques peuvent être des gyromètres laser ou à fibre optique. Dans les deux cas, ils présentent l'avantage de se dispenser de pièce mécanique en mouvement (pas d'usure), d'avoir de plus grande dynamique de mesure et bande passante, une insensibilité à l'accélération et moins de contraintes concernant la stabilité en température. Les gyromètres laser fonctionnent suivant le principe du laser à cavité résonnante. Les gyromètres à fibre optique reprennent l'effet Sagnac. Deux ondes parcourant un chemin fermé en rotation (par rapport à un référentiel inertiel) subissent un décalage temporel lorsqu'elles ont été émises et reçues par un émetteur/récepteur fixe par rapport au chemin optique. Le décalage temporel entre les deux rayons lumineux est ainsi proportionnel à la vitesse de rotation du système.

Gyromètre optique
images/Gyrometre-optique.png
La lumière émise par la source se propage dans la bobine de fibre optique dans deux directions opposées suite à une première traversée de la lame séparatrice (un quart de l'énergie émise initialement arrivera sur le détecteur selon chacune des directions de parcours). Du fait de la rotation de la plateforme, les signaux lumineux parcourant la bobine de fibre dans des directions opposées arriveront au récepteur dans des temps différents. C'est l'effet Sagnac.
Crédit : Gary Quinsac

Gyromètres vibrants

Les gyromètres vibrants quant à eux sont assez proches des gyromètres mécaniques, à la différence près qu'aucune pièce n'est ici en mouvement. Ils détectent le déplacement d'une onde vibratoire dans une structure, dû à la force de Coriolis.

Accéléromètres

Les accéléromètres sont principalement utilisés pour la navigation et le guidage des véhicules de rentrée atmosphérique ou dans l'identification de microvibrations. Une modification de leur tension de sortie est traduite en accélération. Le principe de base consiste à disposer d'une masse dans un boîtier fixée par des ressorts. Lorsque le boîtier est accéléré, la masse a tendance à rester fixe par inertie : elle est donc en mouvement par rapport au boîtier. Les ressorts ont alors pour effet de contrer le déplacement de la masse par rapport au boîtier, et ce déplacement devient alors proportionnel à l'accélération de ce dernier. Les accéléromètres sont capables de mesurer la résultante des forces de surface mais pas les accélérations d'origine gravitationnelle puisque la masse et son boîtier sont soumis au même champ gravitationnel.

Accéléromètre
images/accelerometre.png
Le déplacement de la masse par rapport à la boîte dans lequelle elle se trouve dépend de l'accélération de la boîte. \bold F= m \ \bold a = k \ \bold x, avec \bold a l'accélération, m la masse, k la constante de raideur du ressort et \bold x le déplacement du ressort.
Crédit : Gary Quinsac

Actionneurs

Auteur: Gary Quinsac

Actionneurs inertiels

Parmi les actionneurs inertiels, on distingue les roues d'inertie et les actionneurs gyroscopiques.

Roues à inertie

Les roues à inertie sont les actionneurs les plus utilisés pour le contrôle d'attitude des satellites. Elles permettent le stockage et la restitution du moment cinétique. Elles sont composées d'une masse en rotation autour d'un axe fixe ou volant d'inertie. Le couple créé par une roue à inertie est égal au changement du moment cinétique durant un temps donné (voir la page sur la dynamique d'attitude). Un couple est ainsi créé lorsque le moment cinétique de la roue à inertie est modifié, c'est-à-dire que sa vitesse de rotation change. Cette accélération ou décélération angulaire permet d'emmagasiner ou de libérer du moment cinétique. Ce type d'actionneur peut saturer, c'est-à-dire atteindre une limite supérieure ou inférieure en vitesse angulaire. Dans ce cas il lui devient impossible de fournir un couple selon cet axe (toute évolution possible est une décélération de la roue entraînant un couple dans le sens contraire à celui souhaité). Il faut alors utiliser un autre actionneur à bord pour ramener la vitesse dans une plage admissible tant pour le fonctionnement propre de la roue que pour les performances du contrôle d'attitude. Ces actions de réduction de la vitesse absolue du volant d'inertie, appelées "désaturation", se font lors de l'application d'un couple antagoniste, généralement à l'aide de magnéto-coupleurs ou de propulseurs.

Roues à inertie
images/roue-a-inertie-Kepler.jpg
Deux des quatre roues à inertie du télescope Kepler durant l'assemblage. Elles sont inclinées différemment afin de permettre un contrôle de l'attitude selon plusieurs axes. L'une de ces roues a été victime d'un problème que l'on rencontre parfois avec ce type d'actuateurs, c'est à dire une friction trop importante. Pour parer à la perte d'une roue à inertie, on se permet généralement des configurations redondantes sur les gros satellites.
Crédit : Ball Aerospace photo

Actionneurs gyroscopiques

Les roues à inertie sont limitées en termes de capacité de couple. C'est la raison pour laquelle les satellites nécessitant de rapides manœuvres ou possédant des fortes inerties (comme les stations orbitales) utilisent plutôt des actionneurs gyroscopiques, ou gyrocoupleurs. Contrairement aux roues à inertie, le principe n'est plus de produire un couple en faisant varier la vitesse de rotation de la roue, mais en modifiant l'axe de rotation d'une roue tournant à une vitesse constante. Une variation du moment cinétique est ainsi créée, se traduisant par un couple perpendiculaire au moment cinétique de la roue et au vecteur vitesse de rotation qui lui est appliqué (suivant le principe du couple gyroscopique). Les actionneurs gyroscopiques consomment moins d'énergie et possèdent une plus grande capacité de couple pour des masses et des tailles comparables. Néanmoins, leur utilisation est limitée par l'importance des couples appliqués aux articulations (risques de panne mécanique) et aux précisions requises dans les mesures de position et de vitesse angulaire.

Actionneur gyroscopique
images/actionneur-gyroscopique.png
Fonctionnement d'un actionneur gyroscopique.
Crédit : Gary Quinsac

Actionneurs magnétiques

Magnéto-coupleurs

Un magnéto-coupleur est une bobine qui, parcourue par un courant, génère un moment dipolaire \bold M (en A.m2). En présence d'un champ magnétique tel que le champ magnétique terrestre \bold B, le magnéto-coupleur fournit alors un couple \bold C_{MC} = \bold M \wedge \bold B. On distingue trois types de magnéto-coupleurs :

La principale limitation de cet actionneur est que le couple généré est toujours orthogonal au champ magnétique, limitant à seulement deux angles d'attitude le contrôle du satellite en un point donné de son orbite. À l'instar des magnétomètres, leur utilisation est limitée aux orbites terrestres basses. Ils peuvent être utilisés soit pour effectuer du contrôle d'attitude soit pour "désaturer" des actionneurs inertiels. La plupart des applications des magnéto-coupleurs utilisent trois appareils produisant des couples sur trois axes orthogonaux. Il n'est pas toujours nécessaire d'employer plus de magnéto-coupleurs pour la redondance puisqu'ils ont habituellement un "double enroulement" fournissant une redondance interne.

Magnéto-coupleurs
magneto-coupleur-cubesat.png
"SatBus MTQ" est un système composé de trois magnéto-coupleurs orthogonaux respectant le standard CubeSat. Les bobines 1 et 2 bénéficient d'un barreau ferromagnétique, contrairement à la bobine 3.
Crédit : Nano Avionics

Propulsion

Auteur: Gary Quinsac

Introduction à la propulsion

Spécificités de la propulsion

Parmi les fonctions couvertes par le SCAO il y a la réalisation des manœuvres de modification de la vitesse ainsi que le contrôle d'attitude associé (assurer le pointage des propulseurs lors de la poussée). Le ΔV nécessaire au contrôle d'orbite ne peut être fourni que par des propulseurs, néanmoins ceux-ci peuvent également être utilisés pour générer des couples. Contrairement aux magnéto-coupleurs, ce sont des actionneurs utilisables sur n'importe quelle orbite car ils n'ont pas besoin d'un environnement particulier pour fonctionner. Leur principal inconvénient est une durée de vie limitée inhérente à l'utilisation d'un carburant, lui-même en quantité finie.

Fonctions de la propulsion satellitaire

Il faut différencier la propulsion des lanceurs de celle des satellites. La première doit permettre des incréments de vitesse de l'ordre de 7 à 100 km/s et de très importants niveaux de poussée. Elle se caractérise par une faible capacité d'emport et se présente sous la forme de puissants propulseurs chimiques. La seconde, qui nous intéresse ici, sert à effectuer des transferts orbitaux et des voyages interplanétaires, du contrôle d'orbite et du contrôle d'attitude. Le sous-système propulsif d'un satellite remplit ainsi certaines fonctions :

Orientation du vecteur de poussée

Pour cela, il doit délivrer des forces et des couples. Les forces, ou poussées, sont obtenues par l'éjection de matière à grande vitesse et varient entre quelques μnewtons et quelques centaines de newtons. Suivant les axes de poussée, deux cas de figure sont possibles :

Moteur principal de la navette américaine
images/moteur-principal-navette.jpg
Test d'allumage du moteur principal de la navette spatiale.
Crédit : NASA
Système de propulsion de BepiColombo
images/BepiColombo_propulsion.jpg
Vue d'artiste du système de propulsion ionique qui sera utilisé pour la mission BepiColombo. Cette mission d'exploration de la planète Mercure doit être lancée en octobre 2018 et est développée conjointement par l'ESA et la JAXA.
Crédit : ESA

Fondamentaux de la propulsion

Conversion d'énergie

Tous les types de systèmes de propulsion sont basés sur un processus de conversion d'énergie. Du carburant est libéré à grande vitesse (vitesse d'expulsion notée v_e qui représente la vitesse relative entre le satellite et le carburant expulsé) avec une quantité de mouvement associée m \ \bold v_e, ce qui, par conservation de la quantité de mouvement, résulte en une quantité de mouvement opposée pour le véhicule. En partant de la troisième loi de Newton et en considérant que la vitesse d'expulsion est constante, on obtient : \bold F = \dot m \bold v_e \ \textup{[N]} .

Incrément de vitesse

Ecrivons que la variation de la quantité de mouvement du satellite est opposée à la variation de la quantité de mouvement du carburant expulsé : \Delta V \ m = -\Delta m \ v_e

On peut directement en déduire la capacité d'incrément de vitesse total (\Delta V) du satellite : \int_{0}^{v=\Delta V}{dv} = -v_e \ \int_{m_i}^{m_f}{\frac{1}{m} \ dm}

On en déduit l'équation de Tsiolkovski : \Delta V = -v_e \ \textup{ln} \left( \frac{m_f}{m_i} \right)

complementManœuvres orbitales

Voici quelques exemples d'incréments de vitesse associés à des lancements et à des manœuvres orbitales issus de "Spacecraft propulsion - A brief introduction" par Peter Erichsen :

Incréments de vitesses associés à des manœuvres spatiales et de décollage
ManœuvreΔV typique [m/s]
Kourou LEO (équatorial)9300
Kourou GTO 11443
Cap Canaveral LEO (équatorial)9500
Cap Canaveral GEO13600
LEO GEO (changement d'inclinaison de 28°)4260
GTO GEO (changement d'inclinaison de 9°)1500
GTO GEO (changement d'inclinaison de 28°)1800
Maintien à poste Nord/Sud50 / an
Maintien à poste Est/Ouest5 / an
LEO Orbite de libération terrestre3200
LEO Orbite lunaire3900
LEO Orbite martienne5700

Quantité de carburant

Si l'on veut déterminer la quantité de carburant nécessaire à la réalisation d'un manœuvre spatiale m_p = m_i - m_f, il ne reste plus qu'à déplacer les termes de l'équation précédente afin d'obtenir : m_p = m_i \left( 1 - exp \left( -\frac{\Delta V}{v_e} \right) \right)

Impulsions

Action-réaction
images/action-reaction.png
Illustration du principe d'action-réaction. Le carburant éjecté propulse le véhicule dans la direction opposée.

Systèmes de propulsion

Auteur: Gary Quinsac

Systèmes de propulsion

Le sous-système de propulsion est en interaction proche avec les sous-systèmes mécanique et thermique, notamment pour l'implantation des réservoirs et le contrôle thermique de la propulsion. Il doit également respecter les exigences du contrôle d'attitude et d'orbite (SCAO). Si son principe de fonctionnement est basique (une énergie emmagasinée est libérée afin de transmettre une énergie cinétique à un véhicule) il existe différents types de propulsion, eux-mêmes divisés en sous-groupes :

Dans le but de répondre aux exigences du SCAO, les systèmes de propulsion sont en particulier caractérisés par :

Certains de ces critères sont repris dans le tableau suivant pour les différents types de propulsion introduits dans ce cours.

Comparaison des différents types de propulsion
Type de propulsionFiabilitéCoûtIspPousséePuissance électrique
Gaz froidsGazTrès bonneTrès basTrès basseFaibleTrès faible
LiquideBonneTrès basTrès basseFaibleTrès faible
Gaz chaudsSolideBonneBasMoyenneTrès forteTrès faible
Mono-carburantBonneBasBasseFaibleTrès faible
Bi-carburantMoyenneHauteMoyenneTrès faible
ÉlectriqueÉlectrothermiqueMoyenneHauteTrès faibleForte
ÉlectromagnétiqueFaibleTrès hauteExtrêmement faibleForte
ÉlectrostatiqueFaibleExtrêmement hauteTrès faibleTrès forte

Une comparaison de la force de poussée et de l'impulsion spécifique de systèmes de propulsion adaptés aux nano.micro-satellites est proposée dans cette figure.

Classification des sous-systèmes de propulsion
images/classement-propulsion.png
Les principaux systèmes de propulsion sont ici classés par catégorie. Les couleurs indiquées sur cette figure correspondent au couleurs présentes dans la figure suivante.
Crédit : Gary Quinsac
Performances de systèmes de propulsion pour CubeSat
images/isp_thrust.png
Impulsion spécifique et force de poussée de systèmes de propulsion pour CubeSat (en développement pour la plupart en 2018). Des couleurs permettent de différencier les différents types de propulsion.
Crédit : Gary Quinsac

Propulsion chimique

La propulsion chimique utilise des gaz à haute température et/ou pression, accélérés à travers une tuyère. Les systèmes de propulsion chimique sont généralement associés à des impulsions spécifiques plus faibles que les propulsions électriques, mais de plus grandes poussées. On peut les diviser en deux catégories : les systèmes à gaz froid et à gaz chaud.

Systèmes de propulsion à gaz froid

Ces systèmes utilisent des gaz stockés sous haute pression ou sous forme liquide. Les gaz sont détendus dans une tuyère convergente-divergente pour obtenir la force de poussée. Ce sont les systèmes les plus simples à mettre en œuvre, mais cela s'accompagne d'une faible force de poussée et d'un faible rendement (impulsion spécifique). Ils présentent une bonne aptitude au fonctionnement en mode pulsé, du fait du faible temps de réponse, les rendant attrayant pour assurer le contrôle d'attitude. Ils ont également l'avantage de limiter les contaminations de l'environnement, ce qui est intéressant notamment pour les optiques des missions scientifiques.

La simplicité de ces systèmes les rend intéressants pour les CubeSats. Néanmoins, du fait de la nécessité de pressuriser le carburant, ils ne respectent pas le cahier des charges décrit par le CDS ("CubeSat Design Specification").

Systèmes de propulsion à gaz chauds

Pour les missions requérant des niveaux de poussée et d'impulsion supérieurs, les gaz froids ne sont plus adaptés et il est nécessaire d'utiliser des carburants plus énergétiques générant des gaz chauds. Les systèmes à gaz chaud sont le type le plus commun de propulsion spatiale. Les ergols des systèmes à gaz chaud sont stockés à l'état liquide ou solide. Une réaction de combustion exothermique de l'ergol est nécessaire pour obtenir des produits à haute température qui sont ensuite expulsés dans la tuyère. Ils nécessitent donc généralement une étape de plus que les gaz froids. On les classe en deux catégories en fonction de leur ergol :

Mono-ergols

Le mono-ergol le plus utilisé est l'hydrazine. Il se décompose dans le propulseur par catalyse. Les gaz chauds résultant sont explulsés par la tuyère. Il présente l'avantage d'être fiable tout en conservant de bonnes performances, mais sa haute toxicité a poussé les chercheurs à s'orienter vers des aternatives appelée "mono-ergols verts". Ces ergols sont des sels dérivés de l'acide nitrique, tels que le dinitramide d'amonium.

Bi-liquides

Dans les systèmes à bi-liquides, deux ergols, un comburant et un carburant, produisent une force de poussée par combustion. Ils sont introduits séparément dans la chambre de combustion où ils s'inflamment spontanément par contact et génèrent des gaz chauds, une nouvelle fois détendus dans la tuyère. Ces systèmes sont plus complexes et plus chers que les systèmes présentés précédemment, mais ils sont également plus efficaces (meilleure Isp) et plus puissants (meilleure poussée).

Schéma des systèmes de propulsion chimiques
images/schema-propulsion-chimique.png
Crédit : Gary Quinsac

Propulsion électrique

La propulsion électrique contourne la limitation fondamentale de la propulsion chimique, c'est-à-dire que l'énergie du carburant expulsé ne dépend que de son énergie chimique et du débit. Une énergie électrique ou électromagnétique est utilisée afin d'éjecter de la matière à des vitesses beaucoup plus élevées. En d'autres termes, on utilise la puissance électrique issue du sous-système électrique (panneaux solaires, batteries...) pour accélérer le carburant et produire une force de poussée. Ces vitesses d'éjection plus importantes se traduisent immédiatement par une plus grande efficacité (moins de carburant est nécessaire pour obtenir un même incrément de vitesse). Néanmoins, les forces de poussée produites sont nettement plus faibles que dans le cas de la propulsion chimique. Par conséquent, la propulsion électrique est préférée lorsque le ΔV à réaliser est important ou lorsque il est nécessaire des manœuvres avec des poussées très faibles (contrôle d'attitude très précis, etc.).

La propulsion électrique offre une grande gamme de performances en fonction du type de sous-système utilisé. On les classe ainsi en trois catégories : les systèmes électrothermaux, électromagnétiques et électrostatiques.

Systèmes de propulsion électrothermaux

Historiquement, ces systèmes sont une amélioration par rapport aux systèmes de propulsion chimiques. Le gaz est chauffé en passant le long d'une surface chauffée électriquement ou à travers un arc électrique afin de lui conférer plus d'énergie. Le gaz ainsi chauffé bénéficie d'une détente plus efficace.

Systèmes de propulsion électromagnétiques

La propulsion électromagnétique utilise la conversion d'un gaz en plasma. Le plasma est constitué d'électrons (de charge électrique négative), d'ions (pour la plupart de charge électrique positive) et d'atomes ou molécules neutres (non chargés électriquement). Les ions positifs résultants sont alors accélérés à de très grandes vitesses par l'énergie électrique grâce à la force de Laplace \bold j \wedge \bold B, où \bold j et \bold B sont respectivement le flux de courant ionique dans le plasma et le champ magnétique. Il en résulte une force de poussée sur le satellite dans la direction opposée.

Contrairement aux systèmes électrostatiques qui vont être présentés par la suite, les systèmes électromagnétiques expulsent un plasma globalement neutre, ce qui est intéressant pour éviter de charger électriquement le reste du satellite. Cette famille de propulseurs contient notamment les PPT (Pulsed Plasma Thrusters), les VAT (Vacuum Arc Thrusters) ou encore les MPDT (Magneto Plasma Dynamic Thrusters).

Systèmes de propulsion électrostatiques

À la manière de l'accélération électromagnétique, l'énergie électrique est dans un premier temps utilisée pour transformer le fluide propulsif en plasma. La différence se situe au niveau de l'accélération des ions qui n'est plus obtenue par les forces de Laplace mais par l'application d'un champ électrostatique \bold E créant une force de Coulomb (\bold F = q \ \bold E). Les systèmes de propulsion électrostatiques nécessitent généralement l'installation d'un neutraliseur (cathode) qui fournit des électrons au faisceau d'ions, afin de conserver la neutralité électrique du jet.

Parmi les propulseurs électrostatiques, on peut citer les propulseurs ioniques, les propulseurs à effet Hall et propulseurs FEEP (Field Emission Electric Propulsion).

Schéma des systèmes de propulsion électriques
images/schema-propulsion-electrique.png
Crédit : Gary Quinsac

Filtrage et lois de commande

Auteur: Gary Quinsac

Introduction

Le filtrage et les lois de commande sont présentés car ce spaont des aspects essentiels d'un SCAO. Néanmoins, ce cours a simplement pour ambition de vous en faire une brève introduction.

En mathématiques et en ingénierie, la théorie du contrôle a comme objet l’étude du comportement de systèmes dynamiques. En électronique et traitement du signal, un filtre est originellement un circuit qui rejette une partie indésirable d'un signal. On appelle également filtre un outil logiciel dont le but est la séparation des fréquences contenues dans un signal numérisé.


Estimation d'attitude

Auteur: Gary Quinsac

Principe

L'estimation d'attitude consiste à estimer l'état actuel de l'orientation d'un satellite à partir d'un jeu d'observations et de références obtenues à partir de modèles. Ces observations ont été préalablement effectuées par des capteurs fixés sur le satellite. L'objectif est ici de trouver la meilleure estimation de l'état réel du système sous forme de matrice de changement de repère ou de quaternion d'attitude. La résolution exacte du problème n'est généralement pas possible car les observations sont entachées d'erreurs (erreurs de mesure, d'orientation du capteur, de modélisation...). De plus, on dispose souvent d'une surabondance d'information puisque plusieurs capteurs fournissent des informations par rapport à des références différentes (Soleil, champ magnétique, étoile...). On cherche alors à exploiter de manière optimale ces sources d'information en leur associant des modèles d'erreur.

Les problèmes de détermination d'attitude font intervenir des observations (orientation d'objets) pris à certaines dates. La détermination d'attitude statique représente le cas le plus simple, dans lequel on considère que toutes les mesures sont effectuées au même instant. Au contraire, lorsque le temps est introduit, on parle de détermination d'attitude récursive.

La qualité de la connaissance d'attitude dépend des limitations des capteurs, de la quantification des données, du temps d'échantillonnage et du traitement numérique. La détermination d'attitude embarquée est limitée par les capacités de filtrage de l'ordinateur de bord. Il arrive que pour obtenir une meilleure connaissance de l'attitude a posteriori les données des capteurs soient transmises au segment sol où elles sont post-traitées puis exploitables (par le segment sol ou le satellite).

Boucle SCA
images/boucle-SCA.png
Boucle de contrôle d'attitude.
Crédit : Gary Quinsac

Cas statique

Le cas particulier de l'estimation d'attitude à partir de mesures simultanées de directions non parallèles est ici introduit. À chaque observation sont associés deux vecteurs. Le premier est un vecteur unitaire {\bold b}_i définissant la direction mesurée (observée) de la source (la Terre, le Soleil, une étoile, le champ magnétique terrestre...), exprimée dans le repère lié au satellite. Le second est un vecteur unitaire {\bold r}_i qui définit la direction de référence de la source, exprimée dans le repère origine (généralement inertiel). L'estimation d'attitude consiste ici à déterminer la matrice de transformation orthogonale \bold C satisfaisant pour chaque observation i :

{\bold b}_i = \bold C \ {\bold r}_i

Méthode TRIAD

La méthode TRIAD se base sur l'observation de deux directions non-parallèles. Il s'agit de déterminer la MCD \bold C permettant de transformer les vecteurs de référence {\bold r}_1 et {\bold r}_2 en vecteurs d'observation {\bold b}_1 et {\bold b}_2. Puisque l'on cherche à obtenir l'attitude suivant 3 axes, il nous faut créer deux bases orthonormées (y1, y2, y3) et (x1, x2, x3), respectivement associées aux vecteurs d'oservation et de référence. Il ne reste plus qu'à déduire la matrice de transformation orthogonale (ou MCD) \bold C(3,3) satisfaisant :

\bold y_i = [C] \ \bold x_i , \begin{cases} \bold x_1 = \bold r_1 \\ \bold x_2 = \frac{\bold r_1 \wedge \bold r_2}{|\bold r_1 \wedge \bold r_2|} \\ \bold x_3 = \bold x_1 \wedge \bold x_2 \end{cases} , \begin{cases} \bold y_1 = \bold b_1 \\ \bold y_2 = \frac{\bold b_a1\wedge \bold b_2}{\bold b_1 \wedge \bold b_2} \\ \bold y_3 = \bold y_1 \wedge \bold y_2 \end{cases}

Cette méthode présente l'avantage d'être extrêmement simple, d'où son utilisation dans de nombreuses missions passées. De nos jours, cette méthode n'est plus considérée comme suffisamment précise. En effet, les mesures d'observation sont entachées d'erreur, ce qui empêche d'obtenir le même résultat suivant le vecteur d'observation choisi au départ. C'est pour cette raison que l'on choisit généralement l'observation la plus précise. Des techniques de calcul de la covarience de l'erreur de l'estimation ont été développées pour parer à ces inconvénients.

Méthode QUEST

Un critère quadratique peut être utilisé pour déterminer la matrice d'attitude. Cela revient à chercher la matrice orthogonale vecteur(C) minimisant la fonction de moindres carrés :

L = \frac{1}{2} \ \sum_{i=1}^{n}{a_i \left| \bold b_i - [C] \bold r_i \right|^2}

La minimisation de ce critère n'a rien d'évident et de nombreuses méthodes ont été proposées. Il s'agit d'identifier les 9 paramètres de la MCD respectant les différentes contraintes énoncées précédemment (moindres carrés et règles de la MCD). L'algorithme QUEST (QUaternion ESTimation) offre une alternative intéressante. La forme quadratique est alors utilisée à la place de la MCD, permettant de réduire le nombre de paramètres. Nous ne rentrerons pas dans le détail de cette méthode dans le cadre de ce cours.


Cas général

Dans le cas général où nous ne disposons pas de plusieurs mesures de directions non parallèles effectuées au même instant, le problème d'estimation devient dépendant du temps. Bien que des méthodes récursives basées sur l'algorithme QUEST aient été développées et utilisées, le filtrage de Kalman est le moyen le plus utilisé pour estimer l'attitude d'un satellite en présence de bruits de mesure.

Filtre de Kalman

Le filtre de Kalman a été développé en 1960 comme une nouvelle approche pour le filtrage linéaire et les problèmes de prédiction. Il permet de maintenir une estimation de l'état d'un système dynamique en dehors des périodes d'observation, à partir d'un modèle de son erreur. Puisqu'il s'agit d'un filtre récursif, la quantité d'informations à traiter reste limitée, ce qui en fait un filtre très apprécié à bord des satellites. On a pour habitude de distinguer deux phases dans ce type de filtres, la prédiction et la mise à jour :

exempleFiltre de Kalman discret

C'est la version la plus simple du filtre de Kalman, seules l'estimation de l'état précédent et les mesures actuelles sont nécessaires.

Processus à estimer

Ici, le processus stochastique à estimer est gouverné par une équation différentielle linéaire :

\bold x_k = [A]_k \ \bold x_{k-1} + [B]_k \ \bold u_{k-1} + \bold w_{k-1}

La mesure devant permettre l'estimation s'écrit :

\bold z_k = [H]_k \ \bold x_k + \bold v_k

\bold w_k et \bold v_k représentent respectivement les bruits de processus et de mesure. On les suppose indépendants, blancs et de distribution de probabilité normale. [A] est la matrice qui relie l'état précédent k-1 à l'état actuel k, [B] est la matrice qui relie l'entrée de commande \bold u à l'état \bold x. [H] est la matrice reliant l'état \bold x à sa mesure \bold z.

Phase de prédiction

Durant la phase de prédiction, l'état et l'estimation de la covariance sont projetés dans le temps de l'état k-1 à l'état k :

  • \hat{\bold x}_{k|k-1} = [A]_k \ \hat{\bold x}_{k-1|k-1} + [B]_k \ \bold u_{k-1}
  • [P]_{k|k-1} = [A]_k \ [P]_{k-1|k-1} \ {[A]_k}^T + [Q]_k

[Q] est la matrice de covariance du bruit de processus \bold w, [P]_{k|k-1} est la matrice d'estimation a priori de la covariance de l'erreur.

Phase de mise à jour

Trois étapes se succèdent dans la phase de mise à jour. Il faut d'abord calculer le gain de Kalman [K], puis générer une estimation de l'état a posteriori en incorporant la mesure. Enfin, on obtient la matrice de covariance de l'erreur d'estimation a posteriori [P]_{k|k}.

  • [K]_k = [P]_{k|k-1} {[H]_k}^T \ {[S]_k}^{-1}
  • \hat{\bold x}_{k|k} = \hat{\bold x}_{k|k-1} + [K]_k \ \bold y_k
  • [P]_k = \left( [I] - [K]_k \ [H]_k \right) [P]_{k|k-1}

[I] est la matrice identité. Deux équations supplémentaires permettent d'obtenir l'innovation, ou résiduel, \bold y_k, et la covariance de l'innovation [S]_k :

  • \bold y_k = \bold z_k - [H]_k \ \hat{\bold x}_{k|k-1}
  • [S]_k = [H]_k \ [P]_{k|k-1} \ {[H]_k}^T + [R]_k

À chaque étape le processus est répété afin d'obtenir de nouvelles estimations a posteriori à partir des estimations a priori. En pratique, la matrice de covariance [R] du bruit de mesure est déterminée avant d'utiliser le filtre et peut être mise à jour par la suite. Il est plus compliqué de déterminer la matrice de covariance du bruit de processus [Q] car nous ne pouvons généralement pas directement observer le processus à estimer. Afin d'améliorer les performances du filtre, il est habituel de régler ces deux paramètres.

La plupart des systèmes physiques, et notamment ceux étudiés, sont non linéaires. Le filtre de Kalman classique n'est donc optimal que sur une faible portion des phénomènes pris en compte. Dans le cas de systèmes non-linéaires, nous utilisons donc un filtre de Kalman étendu, ou "Extended Kalman Filter".


Lois de contrôle

Auteur: Gary Quinsac

Introduction à la théorie du contrôle

La théorie du contrôle s'intéresse au comportement de systèmes dynamiques en fonction de leurs paramètres. Elle peut être vue comme une stratégie permettant de sélectionner la bonne entrée d'un système pour que le sortie soit celle désirée. Cela fait partie du domaine de l'automatique.

Boucles ouvertes et fermées

Un système de contrôle est un mécanisme altérant l'état futur d'un système. En l'absence de retour d'information concernant la sortie du système, on se trouve dans le cas d'une boucle ouverte. Prenons l'exemple d'un lave-vaisselle. Celui-ci est programmé pour tourner un certain temps, à une certaine température et avec une certaine quantité d'eau. Ces paramètres ne dépendent pas de l'état de la vaisselle qu'il contient.

Une boucle de rétroaction peut être ajoutée afin de modifier intelligemment la durée du cycle. On obtient alors ce que l'on appelle une boucle fermée, puisqu'une information sur l'état de sortie de notre système, obtenue à l'aide de capteurs, va être comparée à un signal de référence afin de nourir un contrôleur qui a la charge de choisir la bonne entrée. On peut ici parler d'asservissement.

Les boucles de contrôle d'attitude ont pour but d'assurer un contrôle stable de l'orientation du satellite, en prenant en compte les contraintes opérationnelles (temps de réponse aux commandes par exemple) et les perturbations externes et internes. On met en place un asservissement dans le but d'atteindre une valeur de consigne et de la maintenir. Pour ce faire, l'asservissement, ou correcteur, mesure en permanence l'écart entre la valeur réelle de la grandeur à asservir et la valeur de consigne. Il en déduit la commande appropriée que les actionneurs devront ensuite appliquer afin de réduire cet écart.

Systèmes linéaires

Un système linéaire est un objet qui peut être décrit par des équations linéaires. De tels systèmes sont essentiels car nous pouvons les résoudre. Pourtant, presque aucun système réel n'est un système linéaire. L'objectif est donc de simplifier l'objet étudié (actionneur, capteur, système dynamique...) afin de pouvoir l'approximer par un système linéaire. On parle alors de son domaine linéarité.

La réponse d'un système linéaire peut être obtenue en sommant ses réponses impulsionnelles. Cette sommation dans le domaine temporel est appelée convolution. Soit un signal d'entrée u(t) et une réponse impulsionnelle g(t), la sortie y(t) s'exprime :

y(t) = u(t) \ast g(t) = \int_0^t{u(\tau) \ g(t- \tau) \ d \tau}

Fonction de transfert

Afin de simplifier cette opération, on introduit la fonction de transfert. Une fonction de transfert est la transformée de Laplace de la réponse impulsionnelle d'un système linéaire lorsque ses conditions initiales (ou aux limites) sont nulles. Elle permet de transformer le produit de convolution en simple produit :

Y(p) = U(p) \cdot G(p)

definitionTransformée de Laplace

Soit f(t) une fonction du temps. Sa transformée de Laplace unilatérale F(p) est définie par L \left( f(t) \right) = F(p) = \int_{0}^{\infty}{f(t) \ exp(-p \ t) \ dt}p est la variable complexe.

Transformées de Laplace usuelles
f(t)F(p)
\delta (t) (Dirac)1
t\frac{1}{p^2}
x(t)X(p)
\dot x(t)p \cdot X(p) - X(0)
\ddot x(t)p^2 \cdot X(p) - p \cdot X(p) - \dot X(0)

Soit l'équation a x^n D \left( \frac{d}{dt} y \right) = N \left( \frac{d}{dt} u \right)u et y sont respectivement l'entrée et la sortie et D et N sont des polynômes à coefficients réels en (d/dt). Si l'on considère que les conditions initiales sont nulles, on peut réécrire l'équation différentielle précédente pour obtenir la fonction de transfert H :

D(p) \ Y(p) = N(p) \ U(p) \ \leftrightarrow \  \frac{Y(p)}{U(p)} = \frac{N(p)}{D(p)} = H(p)

Les pôles d'une fonction de transfert sont les valeurs pour lesquelles le dénominateur D, aussi appelé équation caractéristique, s'annule. Attention, tout ceci est vrai à condition que la fonction de transfert soit sous forme irréductible. Pour que le système soit stable, il faut que tous les pôles soient strictement à l'intérieur du cercle unité (\|p|<1).

Représentation de la boucle de contrôle d'attitude

On représente la boucle du SCA comme un contrôle en boucle fermée, avec le terme de rétroaction. On note R(p) le signal de référence, Y(p) le signal de sortie, D(p) la perturbation, U(p) le signal de contrôle, Gc(p) le contrôleur, E(p) l'erreur, Gp(p) le matériel à contrôler et C(p) la dynamique des capteurs. Si l'on considère que les perturbations sont nulles, la fonction de transfert s'écrit :

\frac{Y(p)}{R(p)} = \frac{G_c(p) \ G_p(p)}{1+G_c(p) \ G_p(p) \ C(p)}

Le dénominateur de cette équation est un polynome dont les racines déterminent le type de réponse. Le contrôleur peut être utilisé pour stabiliser le système ou lui donner des caractéristiques particulières.

Boucle ouverte ou fermée
images/boucles-ouverte-fermee.png
Dans la boucle ouverte, la durée du cycle de lavage ne dépend pas de la propreté de la vaisselle qu'il contient. Afin d'adapter cette durée à l'état des assiettes et verres, il faut qu'un capteur de propreté fournisse une information à comparer à la propretée désirée et qu'un contrôleur en déduise une nouvelle durée. C'est ce que l'on appelle une boucle fermée.
Crédit : Gary Quinsac
Fonction de transfert
images/fonction-transfert.png
Crédit : Gary Quinsac
Diagramme en bloc de la boucle de contrôle
images/boucle-SCA-fonction-transfert.png
Chaque élément de la boucle de contrôle d'attitude est représenté par sa fonction de transfert.
Crédit : "Fundamentals of Spacecraft Attitude Determination and Control", F. Landis Markley et John L. Crassidis.

Contrôleur

Le contrôleur a pour objectif de convertir l'erreur, c'est-à-dire l'écart entre la mesure de la sortie de la boucle et le signal de référence, en un signal de contrôle qui va finir par ramener l'erreur à 0.

Les performances du contrôleur et a fortiori de l'asservissement sont décrites par plusieurs paramètres :

L'asservissement doit ainsi assurer un compromis entre performance et stabilité. La performance est proportionnelle à la valeur du gain du correcteur, mais à partir d'une certaine valeur celui-ci a tendance à déstabiliser le système.

Contrôleur PID

Le contrôleur "Proportionnel-Intégral-Dérivé" est la logique de contrôle la plus utilisée pour les régulateurs avec boucle de rétroaction. Ce contrôleur agit de trois manières :

La fonction de transfert d'un régulateur PID s'exprime :

C(p) = K_p + \frac{1}{K_i} \ \frac{1}{p} +K_d \ p

Considérons un système de contrôle d'attitude mono-axe simple. L'équation d'Euler s'exprime :

[I] \ \ddot \theta (t) = u(t) + w(t)

[I] est la matrice d'inertie, \theta est l'angle, u est le couple de contrôle et w est le couple perturbateur extérieur.

Contrôleur PD

Un simple contrôle proportionnel ne pourrait pas atteindre une réponse asymptotiquement stable, nous introduisons donc un régulateur PD (proportionnel-dérivé) :

u(t) = -K_p \ \theta(t) - K_d \ \dot \theta (t)

K_p et K_d sont des gains qu'il faut déterminer. Le système en boucle fermée et son équation caractéristique s'écrivent alors :

[I] \ \ddot \theta (t) + [K_d] \ \dot \theta (t) + [K_p] \ \theta(t) = w(t) \ \leftrightarrow \ I \ p^2 + [K_d] \ p + [K_p] = 0

Dans le but d'identifier les valeurs des deux gains, nous introduisons \omega_n et \zeta, respectivement la fréquence propre (fréquence de la réponse sinusoïdale du système non amorti) et le facteur d'amortissement. L'équation caractéristique est réécrite en introduisant ces deux nouvelles grandeurs :

p^2 + 2 \ \zeta \ \omega_n \ p + {\omega_n}^2 = 0

Les gains du contrôleur s'expriment alors : [K_p] = [I] \ {\omega_n}^2 et [K_d] = 2 \ [I] \ \zeta \ \omega_n. On choisit généralement le facteur d'amortissement de tel sorte que 0,5 \leq \zeta \leq 0,707. Il est important de noter que l'information sur la dérivée provient de gyroscopes ou de différences finies de l'attitude.

Contrôleur PID

Pour une perturbation constante de valeur unitaire, le système asservi par le contrôleur PD produit une attitude en régime permanent non-nulle : \theta(\infty) = 1/K_p. Idéalement nous souhaitons que l'attitude en régime permanent soit nulle, c'est la raison pour laquelle nous introduisons le contrôleur PID (proportionnel-intégral-dérivé) :

u(t) = -K_p \ \theta(t) - K_i \int{\theta(t) \ dt} \ - K_d \ \dot \theta(t)

L'équation caractéristique s'écrit cette fois :

[I] \ p^3 + [K_d] \ p^2 + [K_p] \ p + [K_i] = 0 \ \leftrightarrow \ \left( p^2 + 2 \ \zeta \ \omega_n \ p + {\omega_n}^2 \right) \left( p + \frac{1}{T} \right) = 0

\omega_n et \zeta sont toujours la fréquence propre et le facteur d'amortissement, et T est la constante temporelle associée au contrôle intégral. Les gains du contrôleur PID s'expriment : [K_p] = [I] \left( {\omega_n}^2 + \frac{2 \ \zeta \ \omega_n}{T} \right), [K_i] = [I] \ \frac{{\omega_n}^2}{T} et [K_d] = [I] \left( 2 \ \zeta \ \omega_n + \frac{1}{T}\right). On choisit souvent la constante T telle que : T \approx \frac{10}{\zeta \ \omega_n}.

Facteur d'amortissement
images/facteur_amortissement.png
Réponse pour différents facteurs d'amortissement.
Crédit : "Fundamentals of Spacecraft Attitude Determination and Control", F. Landis Markley et John L. Crassidis.

Se tester

Auteur: Gary Quinsac

Présentation des exercices

Cette section doit vous permettre de vous exercer sur certaines des notions présentées dans ce cours. Un QCM reprend la première partie du cours, soit la découverte d'une mission spatiale, du standard CubeSat et du système de contrôle d'attitude et d'orbite. Des exercices plus poussés sont ensuite proposés, recouvrant la représentation d'attitude, les équations du mouvement, les couples perturbateurs et le contrôle d'attitude, la propulsion et enfin les lois de commande. La majeure partie des aspects abordés dans ce cours trouvent ainsi un écho dans ces exercices.


QCM sur la partie "découvrir"

Auteur: Gary Quinsac

qcmDécouvrir

Ce QCM reprend des notions de la partie "Découvrir". Pour certaines questions plusieurs réponses sont possibles.

Difficulté :   

1)  Comment nomme-t-on une orbite circulaire autour de la Terre à une altitude de 300 km ?




2)  Dans quelle classe de satellite se trouvent les CubeSats ?



3)  Quelle est la phase de construction d'un véhicule spatial ?







4)  Quels sont les avantages offerts par le standard CubeSat ?



5)  Quels sous-systèmes font partie de la plateforme du satellite ?





6)  Quels sont les domaines de longueur d'onde absorbés par l'atmosphère ?




7)  Quelle est la masse d'un CubeSat 6U d'après les standards qui vous ont été présentés ?




8)  Quel est le secteur d'utilisation des CubeSats montrant parfaitement l'adoption généralisée de ce standard ?



9)  Quel est le type de mouvement en jeu lorsque l'on parle de contrôle d'attitude ?


10)  Comment nomme-t-on le sous-système chargé de modifier la trajectoire du satellite ?




Exercices : Représentation d'attitude

Auteur: Gary Quinsac

exerciceMatrice du Cosinus Directeur

Difficulté :   

On souhaite montrer que la MCD est une matrice orthonormale, c'est-à-dire que [T] \ [T]^T = [I] = [T]^T \ [T].

Soit la MCD [T]_{B|A} entre deux référentiels orthogonaux décrits par les vecteurs unitaires \{ \bold a_1, \bold a_2, \bold a_3 \}^T et \{ \bold b_1, \bold b_2, \bold b_3 \}^T :

\begin{pmatrix} b_1 \\ b_2 \\ b_3 \end{pmatrix} = [T]_{B|A} \ \begin{pmatrix} a_1 \\ a_2 \\ a_3 \end{pmatrix}

Question 1)

Ecrire le vecteur transposé de \bold B = (B_i).

Question 2)

Calculer le produit \bold B \ {\bold B}^T et conclure.

Auteur: Gary Quinsac

exerciceAngles d'Euler

Difficulté :   

Cet exercice a pour but de démontrer l'expression de la MCD à partir d'une certaine séquence d'angles d'Euler. On reprend la notation du cours en nommant \theta_1, \theta_2 et \theta_3 les trois angles d'Euler.

Question 1)

Démontrer qu'en choisissant la séquence [T(\theta_1)]_1 \leftarrow [T(\theta_2)]_2 \leftarrow [T(\theta_3)]_3 afin de passer du référentiel A au référentiel B, on obtient bien la formule présentée dans le cours :

[T]_{B|A} = \begin{pmatrix} c_{\theta_2} c_{\theta_3} & c_{\theta_2} s_{\theta_3} & -s_{\theta_2} \\ s_{\theta_1} s_{\theta_2} c_{\theta_3} - c_{\theta_1} s_{\theta_3} & s_{\theta_1} s_{\theta_2} s_{\theta_3} + c_{\theta_1} c_{\theta_3} & s_{\theta_1} c_{\theta_2} \\ c_{\theta_1} s_{\theta_2} c_{\theta_3} +s_{\theta_1} s_{\theta_3} & c_{\theta_1} s_{\theta_2} s_{\theta_3} - s_{\theta_1} c_{\theta_3} & c_{\theta_1} c_{\theta_2} \end{pmatrix}

Question 2)

Considérons maintenant la séquence suivante : [T(\theta_1)]_1 \leftarrow [T(\theta_3)]_3 \leftarrow [T(\theta_2)]_2. Exprimer la MCD associée à cette séquence.

Auteur: Gary Quinsac inspiré de "Space Vehicle Dynamics and Control" de Bong Wie.

exerciceQuaternions

Difficulté :   

Considérons la séquence de rotations fixées par rapport à un satellite allant du référentiel A au référentiel B :

[T(\theta_1)]_1 \leftarrow [T(\theta_2)]_2 \leftarrow [T(\theta_3)]_3

Les quaternions associés à ces rotations sont :

[T(\theta_1)]_1 = \begin{pmatrix} sin(\theta_1 / 2) \\ 0 \\ 0 \\ cos(\theta_1 / 2) \end{pmatrix}, [T(\theta_1)]_1 = \begin{pmatrix} 0 \\ sin(\theta_2 / 2) \\ 0 \\ cos(\theta_2 / 2) \end{pmatrix}, [T(\theta_1)]_1 = \begin{pmatrix} 0 \\ 0 \\ sin(\theta_3 / 2) \\ cos(\theta_3 / 2) \end{pmatrix}

Question 1)

Montrer que les angles d'Euler de cette séquence de rotation sont reliés aux quaternions de la manière suivante :

\begin{pmatrix} q_0 \\ q_1 \\ q_2 \\ q_3 \end{pmatrix} = \begin{pmatrix} c_1 c_2 c_3 + s_1 s_2 s_3 \\ s_1 c_2 c_3 - c_1 s_2 s_3 \\ c_1 s_2 c_3 + s_1 c_2 s_3 \\ c_1 c_2 s_3 - s_1 s_2 c_3 \end{pmatrix}

s_i = sin(\theta_i / 2) et c_i = cos(\theta_i / 2)

Question 2)

Vérifier que pour des angles infinitésimaux on obtient un quaternion très simple.


Exercices : Equations du mouvement

Auteur: Gary Quinsac

exerciceCinématique d'attitude avec la MCD

Difficulté : ☆☆  

On souhaite démontrer l'équation de la cinématique exprimée avec la MCD.

\frac{d}{dt}([T]) = -[\Omega] \ [T] avec [\Omega] = \begin{pmatrix} 0 & -\omega_z & \omega_y \\ \omega_z & 0 & -\omega_x \\ -\omega_y & \omega_x & 0 \end{pmatrix} et [T] = \begin{pmatrix} T_{11} & T_{12} & T_{13} \\ T_{21} & T_{22} & T_{23} \\ T_{31} & T_{32} & T_{33} \end{pmatrix}

Soit la MCD [T] entre deux référentiels orthogonaux décrits par les vecteurs unitaires \{\bold{a}_1, \bold{a}_2, \bold{a}_3\}^T et \{\bold{b}_1, \bold{b}_2, \bold{b}_3\}^T.

Question 1)

Rappeler la propriété principale de la MCD [T] .

Question 2)

Exprimer la dérivée de l'équation exprimant un vecteur du référentiel (B) en fonction d'un vecteur du référentiel (A).

Question 3)

Obtenir l'équation de la cinématique exprimée avec la MCD.

Question 4)

À partir de l'équation de la cinématique que nous venons de démontrer, exprimer les différentes coordonnées du vecteur vitesse angulaire.

Auteur: Gary Quinsac

exerciceCinématique d'attitude avec les angles d'Euler

Difficulté : ☆☆  

Cet exercice cherche à établir les équations de la cinématique pour certaines représentations d'Euler. Les premières questions considèrent la séquence d'Euler permettant de passer du référentiel (A) au référentiel (B) suivante :[T(\theta_1)]_1 \leftarrow [T(\theta_2)]_2 \leftarrow [T(\theta_3)]_3.

Question 1)

Ecrire les trois vecteurs vitesse angulaire correspondant à chaque transformation élémentaire en fonction des dérivées des angles d'Euler.

Question 2)

Exprimer le vecteur de vitesse angulaire {\boldsymbol\omega}_{B|A} en fonction des vecteurs de vitesse angulaire précédents.

Question 3)

Reformuler cette équation afin de faire apparaître les vecteurs de base des différents repères.

Question 4)

Exprimer les vecteurs de base des repères A'' et A' en fonction de ceux de (B).

Question 5)

Montrer la relation de la cinématique pour cette séquence d'Euler :

\begin{pmatrix} \dot{\theta_1} \\ \dot{\theta_2} \\ \dot{\theta_3} \end{pmatrix} = \frac{1}{\textup{cos}(\theta_2)} \begin{pmatrix} \textup{cos}(\theta_2) & \textup{sin}(\theta_1) \ \textup{sin}(\theta_2) & \textup{cos}(\theta_1) \ \textup{sin}(\theta_2) \\ 0 & \textup{cos}(\theta_1) \ \textup{cos}(\theta_2) & -\textup{sin}(\theta_1) \ \textup{cos}(\theta_2) \\ 0 & \textup{sin}(\theta_1) & \textup{cos}(\theta_1) \end{pmatrix} \begin{pmatrix} \omega_1 \\ \omega_2 \\ \omega_3 \end{pmatrix}

Question 6)

Considérons maintenant la séquence suivante : [T(\theta_1)]_1 \leftarrow [T(\theta_3)]_3 \leftarrow [T(\theta_2)]_2. Exprimer alors l'équation de la cinématique.

Auteur: Gary Quinsac

exerciceCinématique d'attitude avec les quaternions

Difficulté : ☆☆  

Il est maintenant question de démontrer l'équation de la cinématique avec les quaternions.

Question 1)

Reprendre la forme de l'équation de la cinématique trouvée dans la dernière question du premier exercice sur les équations du mouvement :

\begin{cases} \omega_1 = \dot C_{21} C_{31} + \dot C_{22} C_{32} + \dot C_{23} C_{33} \\ \omega_2 =  \dot C_{31} C_{11} + \dot C_{32} C_{12} + \dot C_{33} C_{13} \\ \omega_3 = \dot C_{11} C_{21} + \dot C_{12} C_{22} + \dot C_{13} C_{23} \end{cases}

Substituer les coefficients de la MCD par leur forme avec les quaternons.

Question 2)

Exprimer la dérivée de l'équation contraignant les quaternions.

Question 3)

Regrouper ces 4 équations sous forme matricielle.

Question 4)

Utiliser une propriété remarquable de la matrice de quaternion obtenue dans la questions précédente pour exprimer la dérivée du quaternion.

Question 5)

Réécrire l'équation afin d'obtenir l'équation de la cinématique avec les quaternions.


Exercice : Couples perturbateurs sur un CubeSat

Auteur: Gary Quinsac

exerciceCouples perturbateurs agissant sur un CubeSat

Difficulté : ☆☆  

Une mission scientifique nécessite l'envoie d'un CubeSat 3U sur une orbite circulaire à 300km d'altitude (ce qui correspond à une vitesse de 7726 m/s). On considère que le centre de masse de satellite se trouve décalé du centre géométrique de + [1; 1; 2] cm et que la surface du satellite est homogène. Étant donnée l'altitude, il est possible d'utiliser le champ magnétique pour effectuer le contrôle de l'attitude du CubeSat. Une combinaison de trois magnétocoupleurs, chacun étant orienté selon un axe du satellite, est proposée. Le courant maximum parcourant les bobines est ±0,2 A et le rayon du fil mesure 10,4 mm.

Voici différentes données nécessaires :

Données
Masse volumique de l'atmosphère à 300 km\rho = 2 \times 10^{-11} \ \textup{kg}.\textup{m}^{-3}
Coefficient de trainéeC_x = 2
Constante gravitationnelle de la Terre\mu = 398,6 \times 10^3 \ \textup{km}^{3} . \textup{s}^{-2}
Rayon de la TerreR_{\oplus} = 6,371 \times 10^3 \ \textup{km}
Irradiance solaire moyenne\phi_s = 1362 \ \textup{W}. \textup{m}{-2}
Coefficient de réflexion moyen du satelliteq = 0,9
Champ magnétique terrestre à 300 kmB = 2,6 \times 10^{-5} \ \textup{Tesla}
Dipôle résiduel du satelliteD = 4 \times 10^{-4} \ \textup{A} . \textup{m}^2
Courant maximum dans magnéto-coupleursI_{MTQ} = 0,2 \ \textup{A}
Diamètre de la bobine des magnéto-coupleursD = 10 \ \textup{mm}
CubeSat 3U
images/exercice-cubesat.png
CubeSat 3U de longueur l, de côtés a et b et de moments d'inertie Ixx, Iyy et Izz.
Crédit : Gary Quinsac
Question 1)

Que signifie le fait que la surface du satellite est homogène ?

Question 2)

Estimer les dimensions et la masse totale du satellite.

Question 3)

Quels sont les principaux moments d'inertie du satellite ?

Question 4)

Identifier les couples perturbateurs.

Question 5)

Exprimer les couples perturbateurs maximums créés par les différentes perturbations agissant sur le satellite si son axe +Y est aligné avec sa vitesse. On utilisera les notations données en introduction de l'exercice.

Question 6)

Estimer l'ordre de grandeur de la somme de tous les couples perturbateurs agissant sur le satellite.

Question 7)

Combien de spires la bobine du magnétocoupleur doit-elle contenir pour contrebalancer le couple perturbateur précédemment estimé ?


Exercice : Propulsion

Auteur: Gary Quinsac

exerciceExercice

Difficulté :   

On reprend le CubeSat présenté lors de l'exercice précédent. Cette fois-ci, nous nous plaçons dans le cas où celui-ci doit effectuer une manœuvre orbitale nécessitant un incrément de vitesse de 50 m/s. Six systèmes de propulsion vous sont proposés, chacun étant défini par sa masse sèche Msèche (masse du système de propulsion sans le carburant), son impulsion spécifique Isp, sa force de poussée F et sa consommation électrique P.

Systèmes de propulsion
Type de propulsionModèleMsèche [kg]Isp [s]F [N]P [W]
Gaz froidPalomar MiPS0,89503,5.10-25
Mono-carburantBGT-X51,242205.10-120
Bi-carburantPM2001,102855.10-16
ÉlectromagnétiquePPTCUP0,286704.10-52
ÉlectrostatiqueIFM Nano0,6438003,5.10-432
Question 1)

Quel lien peut-on faire entre la vitesse d'expulsion du carburant l'impulsion spécifique Isp ?

Question 2)

Estimer la quantité de carburant nécessaire pour effectuer la manœuvre souhaitée avec chacun des systèmes de propulsion.

Question 3)

Sachant que l'on cherche généralement à éviter d'allouer plus de 33% de la masse d'un satellite au système de propulsion

Question 4)

La puissance électrique disponible à bord d'un CubeSat 3U recouvert de panneaux solaires en orbite autour de la Terre est estimée à 7 W. Qu'est-ce que cela change au niveau de vos choix ?

Question 5)

En supposant que l'efficacité de la manœuvre ne dépend pas du lieu où celle-ci est effectuée, c'est à dire du moment, combien durerait-elle pour chacun des systèmes de propulsion proposés ? Cette hypothèse est fausse dans de nombreux cas, notamment lorsque les forces de poussée en jeu sont faibles et les manœuvres importantes (ce qui est le cas ici).


Exercices : Lois de commande

Auteur: Gary Quinsac

exerciceÉtude d'un ressort

Difficulté :   

Cet exercice a pour but de vous entraîner à utiliser les transformations de Laplace pour résoudre une équation différentielle.

Considérons une masse m accrochée à un ressort de constante de rappel K. On mesure le déplacement vertical de la masse, provoqué par une stimulation u(t), par la grandeur x. L'installation est illustrée par cette figure.

Ressort
images/ressort.png
Crédit : Gary Quinsac
Question 1)

Quelle est l'équation de déplacement de la masse ?

Question 2)

On veut étudier le cas d'une stimulation impulsionnelle. Que devient u(t) ?

Question 3)

Exprimer la fonction de transfert du système.

Question 4)

Effectuer la transformée de Laplace inverse de la fonction de transfert afin d'exprimer le déplacement issu d'une stimulation impulsionnelle dans le domaine temporel.

Question 5)

Supposons maintenant que la stimulation n'est plus impulsionnelle mais une rampe u(t) =t. Afin d'obtenir la réponse dans le domaine temporel, il faudrait faire le produit de convolution de cette rampe avec la réponse impulsionnelle :

t \ast \frac{1}{\sqrt{K \ m}} sin(\sqrt{\frac{K}{m}} \ t)

Passer par la transformée de Foutier.

Auteur: Gary Quinsac

exerciceReprésentation de la boucle de contrôle d'attitude

Nous allons retrouver la fonction de transfert de la boucle de contrôle d'attitude :

\frac{Y(p)}{R(p)} = \frac{G_c(p) \ G_p(p)}{1+G_c(p) \ G_p(p) \ C(p)}

On note R(p) le signal de référence, Y(p) le signal de sortie, D(p) la perturbation, U(p) le signal de contrôle, Gc(p) le contrôleur, E(p) l'erreur, Gp(p) le matériel à contrôler et C(p) la dynamique des capteurs.

Question 1)

Exprimer le signal de sortie en fonction du signal de contrôle.

Question 2)

Sachant que l'on considère que les perturbations sont nulles, exprimer le signal de contrôle en fonction de l'erreur.

Question 3)

Appliquer la même approche pour trouver l'expression de l'erreur.

Question 4)

Réorganiser les résultats précédents afin de retrouver l'expression de la fonction de transfert.


Mini-projets

Auteur: Gary Quinsac

Présentation des mini-projets

objectifsObjectifs des mini-projets

Quatre mini-projets vous sont proposés afin de tester vos connaissances. Si certaines informations utiles peuvent être retrouvées dans le cours, il sera également nécessaire d'aller en chercher en dehors. Une liste de questions commune aux différents mini-projets vous est proposée, tâchez d'y répondre pour chacun des cas présentés. Ce cours n'étant qu'une introduction aux nanosatellites et au contrôle d'attitude et d'orbite, les questions sont avant tout qualitatives. De plus, face à la complexité d'une mission spatiale, une approche plus poussée nécessiterait de répondre à ces questions plusieurs fois, de manière itérative, afin de prendre en compte l'impact de chaque décision sur les choix effectués précédemment.

Le travail d'un ingénieur spatial est de développer une mission capable de répondre à des besoins. Dans notre cas, ces besoins sont spécifiés par des chercheurs. Quatre missions nous ont ainsi été proposées. Nous intervenons au tout début de ces projets puisque nous sommes chargés d'étudier leur faisabilité.

Étude de l'ionosphère terrestre

Il nous est demandé d'étudier l'ionosphère terrestre. L'ionosphère représente l'atmosphère supérieure d'une planète, de 85 à 600 km d'altitude, une région où le gaz est partiellement ionisé par les radiations solaires. Son fonctionnement est important car elle constitue la partie intérieure de la magnétosphère de notre planètre. Elle joue notamment un rôle essentiel dans les télécommunications et la géolocalisation par satellite, puisqu'elle a tendance à retarder voire même réfléchir certains signaux. Si de nombreux satellites ont déjà acquis des données sur ce milieu, son étude est plus que jamais d'actualité.

Afin d'effectuer des mesures du contenu de l'ionosphère terrestre, il nous est demandé d'utiliser une sonde de Langmuir. C'est un appareil capable de mesurer la température électronique, la densité électronique ainsi que le potentiel électrique du plasma. Une telle sonde permet d'étudier le plasma in-situ, c'est-à-dire à l'endroit où elle se trouve.

Démonstration technologique d'une nouvelle optique de télescope.

Une équipe de chercheurs est en train de développer une nouvelle optique permettant d'améliorer grandement la performance des télescopes d'observation de la Terre en orbite basse. Afin de qualifier en vol leur système, dernière étape de leur développement, ils souhaitent l'embarquer sur un CubeSat. L'ensemble du télescope avec son électronique de lecture doit faire 1,5 U de volume. La lecture se fait avec un capteur CMOS.

Observation d'un transit d'exo-planète

Suite à la première tentative initiée par la mission PICSAT de l'Observatoire de Paris, des scientifiques veulent observer un nouveau transit d'exoplanète. L'étoile autour de laquelle orbite cette exoplanète se trouve dans le plan de notre galaxie. Le même instrument scientifique que celui embarqué par Picsat est envisagé. Son utilisation permet d'effectuer la photométrie du transit, c'est-à-dire de mesurer la luminosité de l'étoile brillante.

Géodésie d'un astéroïde

Surfant sur la recrudescence de missions d'étude d'astéroïdes, un chercheur nous propose une mission d'accompagnement avec un CubeSat. La mission principale doit étudier le système d'astéroïdes géocroiseur nommé 65803 Didymos. Un CubeSat présente l'intérêt de pouvoir s'approcher beaucoup plus proche du système d'astéroïde (faibles risques associés à son faible coût). Les perturbations provoquées par les astéroïdes lors des survols doit permettre d'en déduire leur champ gravitationnel. Pour ce faire, une mesure précise de l'orbite du satellite est nécessaire. De l'astronomie radio-science est envisagée pour réaliser la mesure précise de la position du CubeSat au cours des survols.

Le CubeSat permet d'étudier les populations d'astéroïde (masse, composition...) et en particulier les nombreux astéroïdes doubles pourtant complexes à examiner. L'enjeu est de comprendre leur origine et leur contribution dans la formation du système solaire. D'une manière plus générale, cette étude doit également permettre d'identifier les lois régissant la formation des systèmes exo-planétaires. C'est cette technique qui a permis d'obtenir la majorité des informations concernant la structure interne des corps du système solaire.

L'utilisation d'un transpondeur similaire à ceux utilisés pour la télécommunication nous offre le suivi du CubeSat depuis le sol ou un autre satellite en effectuant des mesures d'effet Doppler et de distance. Ces mesures permettent d'obtenir la vitesse radiale et la distance entre le CubeSat et l'observateur, permettant de calculer son accélération et de déduire in fine le champ gravitationnel de l'astéroïde. Afin d'obtenir des mesures suffisamment précises, le transpondeur Iris, développé par le JPL, est proposé. Cela veut dire que le suivi peut se faire depuis la mission principale ou depuis le sol avec un réseau d'antennes tel que le Deep Space Network ou le ESA Tracking Network..

complementQuelques sources d'information

Sonde de Langmuir sur le satellite Demeter
demeter-sonde-langmuir.png
On peut voir une sonde de Langmuir embarquée par le satellite Demeter.
Crédit : CNRS
Télescope d'observation de la Terre
images/telescope-spatial-enmap.jpg
Télescope hyperspectral d'observation de la Terre EnMAP.
Crédit : DLR
Transit de Vénus
images/transit-venus.jpg
Photographie pris lors du dernier transit de Vénus devant le Soleil en 2012.
Crédit : ESA
Mission AIDA
images/didymos-aida.jpg
Vue d'artiste de la mission AIDA accompagnée d'un CubeSat autour du système d'astéroïdes Didymos. AIDA observe l'impact de la mission DART sur l'astéroïde principal.
Crédit : ESA/Science Office

Questions

Voici une liste de questions auxquelles vous devez essayer de répondre, en le justifiant, pour les quatre missions qui vous ont été proposées.

I - Considérations générales

  1. Étant donné le principe de fonctionnement de l'instrument que nous devons embarquer, quel type de mission envisagez-vous (orbite, nombre de CubeSats...) ?
  2. Qu'est-ce que cela implique concernant le lancement ?
  3. Que pensez-vous des besoins de télécommunication ?
  4. La gestion d'énergie sera-t-elle un aspect critique de cette mission ?
  5. Quel format de CubeSat proposez-vous ?

II - Focalisation sur le SCAO

  1. Que pouvez-vous dire des effets environnementaux sur le contrôle d'attitude ?
  2. Quels besoins identifiez-vous en termes de contrôle d'attitude ?
  3. Ces besoins nécéssitent-ils un contrôle fin de l'attitude des satellites ?
  4. Quels capteurs et actionneurs recommandez-vous ?
  5. Sera-t-il nécessaire d'effectuer des manœuvres orbitales ?
    1. Si oui, évaluez ce que cela représente en budget ΔV.
    2. Quel type de propulsion vous semble le plus adapté ?

Imagerie directe d'exoplanètes

Auteur: JLB

Imagerie directe d'exoplanètes

Bienvenue dans ce cours portant sur l'imagerie directe des exoplanètes.

Vous allez découvrir ici cette technique de prospection et d'étude, à la pointe de la technologie et qui fait partie des quelques méthodes pouvant prétendre à la découverte d'une planète jumelle de la Terre...

La première exoplanète découverte par imagerie directe
2M1207b_First_image_of_an_exoplanet_ESO.jpg
C'est en 2004 que Gaël Chauvin et ses collaborateurs publient dans Astronomy and Astrophysics la première image potentielle d'une exoplanète, autour de la naine brune 2M1207 (un étoile qui ne fusionne pas l'hydrogène car trop légère pour atteindre les condition extrêmes nécessaires, voir cours sur la Formation et évolution II.A.2. ) grâce à l'instrument NaCo du VLT. [Pour plus d'informations cliquez ici]
Crédit : ESO

[Cliquez ici pour commencer le cours]


Découvrir

Auteur: JLB

Introduction

Auteur: JLB

Prérequis

Pour pouvoir suivre ce cours dans les meilleurs conditions il vous faut maîtriser les bases des domaines suivants :

NewtonsPrincipia.jpg

Optique ondulatoire, pour pouvoir comprendre le fonctionnement des instruments :

Vous êtes invités à au moins parcourir les liens mis à disposition dans cette page pour pleinement bénéficier de ce cours.


Qu'est ce que c'est ?

L'imagerie directe d'exoplanètes se propose d'obtenir l'image d'une planète tournant autour d'une autre étoile que le soleil.

L'idée de base est de prendre des photographies comme on le fait pour les planètes du système solaire.

Le système que l'on observe
Beta_Pictoris_b_artists_impression.jpg
Une vue d'artiste de β Pictoris b
Crédit : ESO, Calçada

Malheureusement, à cause de leurs distances, il est exclu pour le moment de pouvoir distinguer le disque de n'importe laquelle des exoplanètes connues. Nous les voyons donc comme une source ponctuelle, et de plus, l'image de ce point est déformée par l'optique de l'instrument utilisé.

L'image que l'on obtient
betapictorisbLagrange2009.jpg
Une observation de β Pictoris b (dans les cases du bas, la planète est la tache blanche en haut à gauche du centre de l'image).

Première approche

Les planètes du système solaire sont facilement observables, la plupart le sont même à l'oeil nu ! Et pendant des siècles on les a étudiées uniquement par l'imagerie dans le visible, d'abord à l'oeil nu puis avec des lunettes et des télescopes.

Le système solaire
Systeme_solaire_fr.jpg
Schéma du système solaire. Les tailles des objets sont à l'échelle, mais pas les distances !

Chercher à faire l'image d'une planète tournant autour de son étoile peut sembler, de prime abord, la meilleure façon de découvrir une exoplanète.

À la différence des méthodes comme la vélocimétrie radiale ou l'étude des transits, l'idée n'est pas ici d'étudier une étoile perturbée par de la présence d'une planète mais bien d'étudier la lumière de la planète elle-même. Cette lumière comprend pour partie la lumière de l'étoile réfléchie par la surface de la planète et, pour partie, de la lumière émise par la planète elle-même.

Un exemple de transit
transit.jpg
Crédit : CNES

Des difficultés techniques importantes

Une planète possède une luminosité très faible par rapport à son étoile hôte, cette dernière est aveuglante en comparaison !

Et l'on doit pouvoir séparer, sur le détecteur, l'étoile et la planète, très proches l'une de l'autre (8 minutes-lumière pour une planète à une unité astronomique de son étoile) mais toutes deux situées à plusieurs années-lumière de nous !

Pour se faire une idée de la difficulté
Le_phare_de_Sein_sous_le_grain.jpg
Imaginez une gardien de phare avec une chandelle juste à coté de la lanterne du phare. Maintenant prenez la mer jusqu'à ne plus voir la lumière du phare que sous forme d'un point et trouvez un moyen de voir la lumière de la flamme de la chandelle ! Voilà une idée de la difficulté du travail à effectuer.

Buts

Auteur: JLB

Plusieurs finalités

Les techniques d'imageries directes ont plusieurs buts :

MassPeriod.png

Faire de nouvelles découvertes

L'imagerie directe permet d'accéder aux planètes situées loin de leur étoile et suffisamment grosses (de masse supérieure à celle de Jupiter). Ces planètes sont difficiles à déteminer par les méthodes indirectes (transits ou vitesses radiales) car elles demandent une étude sur au moins une période orbitale complète, soit plusieurs (dizaines d') années .

Répartion des planètes suivant les méthodes de détection
MassPeriod.png
Répartition des exoplanètes en masse/période, les points verts sont les planètes observées par imagerie directe.
Crédit : Données provenant du site exoplanet.eu .

Étudier l'atmosphère

Si on arrive à identifier la lumière émise par une planète, et que la quantité de lumière reçue est suffisante, on peut la décomposer par spectroscopie. Cette technique nous permet de déterminer la composition chimique de l'atmosphère de la planète, d'obtenir des informations, comme la température efficace (ou effective temperature en anglais).

Cette technique nous permettra peut être un jour prochain d'identifier la première exo-Terre dotée d'une atmosphère ressemblant à la nôtre...

Spectroscopie
em_abs.png

Comprendre la formation des planètes

La formation des planètes et la formation des systèmes planétaires sont des phénomènes encore mal compris, augmenter nos connaissances sur les planètes géantes, jeunes, éloignées de leur étoile, nous permettra de déterminer lesquels parmi les modèles actuels sont valides.

Image d'une planète en formation ?
apjl462949f2_lr.jpg
En 2013 Sascha Quanz et collaborateurs publient dans the Astrophysical Journal un article sur une potentielle planète en formation détectée par l'instrument NaCo au télescope VLT (Very Large Telescope). [Pour en savoir plus cliquez ici]

Or les jeunes Jupiter sont justement les cibles privilégiées de l'imagerie directe, voyons pourquoi dans les écrans suivants ...


Cibles

Auteur: JLB

Choisir des cibles

L'observation par imagerie directe nécessite certaines conditions sur les cibles observables :

solarSystemSeager2010.jpg

Contraste

Spectres dans le système solaire
solarSystemSeager2010.jpg
Comparaison de la distribution des flux spectraux lumineux émis (en échelle logarithmique) en fonction de la longueur d'onde dans le système solaire. La composante de gauche du spectre (autour d'un micron) correspond à la réflexion de la lumière du soleil sur la planète, la partie droite autour de 20 µm correspond au rayonnement thermique émis par chaque planète et dépendant de sa température.

C'est en comparant les flux lumineux du Soleil et de ses planètes que l'on peut remarquer au moins deux choses :

Attention : un contraste d'un facteur X correspond à un rapport de 10^(X)!


Luminosités

Comme vous pouvez facilement l'imaginer, pour pouvoir détecter/voir la planète, la différence de luminosité entre l'étoile et la planète doit être aussi faible que possible. Il est donc plus facile de chercher des exoplanète autour d'étoiles peu brillantes.

La luminosité de l'étoile dépend de sa température, cette dernière dépendant de sa masse, et la durée de vie d'une étoile st inversement proportionnelle à cette masse. Suivant sa position dans le diagramme HR (voir ci-dessous) l'étoile évolue donc plus ou moins vite.

Diagramme de Hertzsprung-Russell
H-R_diagram_-edited-3.gif
Le diagramme HR, pour diagramme Hertzsprung-Russell, permet de classer un étoile grâce à sa luminosité en fonction de sa température. Sur la séquence principale (Main sequence, V, ou MS) on trouve les étoiles fusionnant l'hydrogène (comme le Soleil). En haut à gauche donc à forte température et luminosité, on trouve les étoiles bleues, très jeunes, et en bas à droite les naines rouges qui sont peu brillantes et à faible température.

Si on cherche à étudier les exoplanètes autour d'une étoile de faible luminosité, on va donc être intéressé par des étoiles de faible masse et faible température, voire même par des naines brunes. Dans les faits, la première exoplanète imagée l'a été autour d'une naine brune.

Mais une planète comme β Pictoris b tourne autour d'une étoile A (blanc-bleutée) de la séquence principale ! Comment se fait-il que l'on puisse imager une planète autour d'une étoile aussi brillante ? Une étoile de type A est très massive, elle quitte donc rapidement la séquence principale. Une étoile A sur la séquence principale est donc jeune, et ses planètes le sont aussi : ainsi β Pictoris a un âge compris entre 10 et 20 millions d'années seulement. Pourquoi est-il intéressant de cibler un système planétaire si jeune ?

Les sources d'énergie permettant à une planète de rayonner peuvent être de deux types :

Courbes d'évolution de la luminosité d'une planète
LuminosTimeMordasini2012.jpg
En 2012 Christoph Mordasini et collaborateurs présentent dans Astronomy & Astrophysics, un modèle d'évolution planétaire. Vous pouvez voir ici l'évolution de la luminosité (comparée à la luminosité solaire, le tout en échelle logarithmique) de planètes de type géante gazeuse (comme Jupiter) en fonction du temps. Observez le pic autour d'un million d'années qui survient à la fin du processus de formation et à partir duquel la luminosité se met à chuter.

Distances

Comme nous l'avons présenté précédemment, notre problème est similaire à celui d'observer à plusieurs kilomètres de distance la lumière d'une chandelle posée à côté de la lampe d'un phare. Si vous collez la chandelle à la lampe du phare vous n'avez aucune chance de la voir car vous serez totalement éblouis. En revanche, si vous attachez la chandelle à un bras télescopique de plusieurs mètres, vous pourrez la détecter plus facilement.

De plus, si, avec votre bateau, vous vous éloignez trop du phare, vous êtes sûr de ne pas pouvoir observer la chandelle. Pour augmenter les chances d'observer directement une exoplanète, il faut donc que la séparation apparente entre l'étoile et l'exoplanète sur le ciel soit aussi grande que possible, ce qui nécessite :

Exemple de relation distance,orbite,distance angulaire
Primera_foto_planeta_extrasolar_ESO.jpg
La première planète imagée orbite à environ 55 fois la distance Terre-Soleil de son étoile hôte, qui elle-même se trouve à 70 pc de nous. Cela se traduit par une distance angulaire de 778 mas (milliarcsecondes), ce qui est accessible aux grands télescopes actuels.
Crédit : ESO

Exemples d'instrument

Auteur: JLB

Quelques instruments

Dans les écrans qui suivent vous trouverez quelques exemples d'instruments qui sont utilisés ou vont être utilisés dans un proche avenir pour imager les exoplanètes. Cette liste est loin d'être exhaustive mais se veut constituée d'exemples concrets d'instruments dédiés ou non à cette technique.

Dans l'espace

En premier lieu nous présentons deux satellites dont les archives (observations anciennes) regorgent peut-être de planètes à découvrir (avis aux amateurs) :

De nombreux concepts de satellites dédiés à l'imagerie directe ont été développés, que ce soit par coronographie ou interférométrie, à l'instar de SPICES, Darwin ou TPF. Les développements techniques pour permettre la réalisation de ces missions sont en cours au moment où sont rédigées ces lignes.

Au sol

Les deux instruments au sol que nous présentons ici sont des instruments européens (contrairement à Hubble et Spitzer qui sont pour leur part américains). Il s'agit de NaCo et de SPHERE.

Ce second instrument, SPHERE, fait partie d'une génération d'instruments pour grands télescopes qui comprend, entre autres, le Projet 1640, MagAO et GPI . L'arrivée de tous ces instruments, pour la plus part dédiés à l'imagerie directe d'exoplanètes, promet une moisson de découvertes dans les prochaines années.


Satellites

HST

Le télescope spatial Hubble (Hubble Space Telescope, HST en anglais) de la NASA est une des sources d'images d'exoplanètes. Son principal point fort est de se trouver hors de l'atmosphère et donc d'atteindre un pouvoir de séparation angulaire permettant la détection de l'exoplanète.

Remarque : nous verrons comment l'on tente de corriger les perturbations causées par l'atmosphère terrestres pour les instruments situés au sol, dans la partie sur l'optique adaptative.

Pour l'imagerie directe on utilise ACS (pour Advanced Camera for Surveys) qui possède un coronographe, permettant de masquer la lumière d'une étoile pour voir seulement celle provenant des planètes situées autour (voir suite du cours). Cette caméra, installée en 2002, est la plus utilisée pour l'imagerie astronomique en général. L'autre instrument utilisé est STIS (pour Space Telescope Imaging Spectrograph) qui nous donne par exemple l'image ci-dessous.

Fomalhaut b
fomalhaut_b.jpg

Un exemple de détection par HST : Fomalhaut b. Cette planète a été annoncée par Paul Kalas, James R. Graham et collaborateurs en 2008 dans la revue Science, autour d'une étoile âgée de 400 millions d'années et située à 7,7 pc de nous. Une non-détection par un autre satellite a jeté un doute sur son existence (voyez la page suivante)...

Hubble Space Telescope
HST_creditNASA.jpg
Crédit : NASA

Satellites (Suite)

Spitzer

Un autre satellite jouant un rôle important dans l'imagerie directe d'exoplanètes est le télescope spatial Spitzer. C'est le télescope spatial spécialisé dans l'infrarouge de la NASA, il est utilisé dans notre cas pour vérifier la présence de planètes ou pour contraindre leur rayon et leur masse.

C'est l'instrument IRAC (InfraRed Array Camera), qui est utilisé dans une de ses bandes dans le proche infrarouge pour rechercher les jeunes exoplanètes géantes.

Spitzer
Spitzer.jpg
Crédit : NASA

Certains chercheurs expliquent la non-détection par Spitzer de Fomalhaut b (voir la page précédente sur HST) par le fait que la planète serait de faible rayon. Dans ce cas, Spitzer nous donne une limite sur le rayon maximal de la planète.


Au sol

NaCo

NaCo est un instrument du Very Large Telescope (VLT) de l'Observatoire Européen Austral (ESO en anglais), il a permis de faire la première image d'une exoplanète confirmée en 2005 par Gaël Chauvin, Anne-Marie Lagrane et collaborateurs.

Son nom vient de la fusion de NAOS et de CONICA, qui sont respectivement un système d'optique adaptative (Nasmyth Adaptive Optics System) et un imageur, polarimètre, coronographe et spectrographe dans le proche infrarouge (Near-Infrared Imager and Spectrograph) et est utilisé par de nombreuses communautés d'astronomes.

NaCo
NACO_at_Yepun_small.jpg
Crédit : ESO
La première exoplanète découverte par imagerie directe
2M1207b_First_image_of_an_exoplanet_ESO.jpg
2M1207 b, observée par NaCo
Crédit : ESO

Au sol (suite)

SPHERE

Spectro Polarimetric High contrast Exoplanet REsearch (SPHERE) est un instrument de seconde génération du VLT, il doit permettre d'obtenir le spectre des planètes cibles et d'étendre le nombre de planètes étudiées en imagerie directe. Il conjugue une optique adaptative de pointe, la coronographie et l'imagerie différentielle spectrale, polarimétrique et angulaire. Ces concepts vont vous être présentés dans ce cours.

SPHERE
eso1417c.jpg
L'instrument SPHERE installé sur la plateforme d'un des télescope du VLT.
Crédit : ESO

Illustrations

Auteur: JLB

Quelques observations

Pour conclure cette partie d'introduction sur le sujet de l'imagerie directe des exoplanètes, voici deux exemples de systèmes planétaires, confirmés et étudiés.

Beta_Pictoris_b_artists_impression.jpg

Le système HR8799

Autour de l'étoile HR 8799 se trouve un système d'au moins 4 planètes géantes plus massives que Jupiter, c'est une étoile jeune (moins de 100 millions d'années), chaude (7230 K de température efficace) et plutôt proche de nous (40 pc).

HR8799
HR8799_Marois2010.jpg
En 2010 Christian Marois et collaborateurs ont publié dans Nature la découverte d'une quatrième planète (HR8799 e) autour de l'étoile HR 8799 observée avec le télescope Keck II.

Ce système de planètes nous permet de rappeler ici la nomenclature utilisée actuellement pour nommer une exoplanète : on commence par le nom de son étoile hôte suivi d'un lettre minuscule partant de "b", les lettres étant distribuées dans l'ordre de découverte des exoplanètes qui ne correspond pas forcément avec un ordre de taille ou de distance à l'étoile hôte. Ainsi, HR 8799 e a été la dernière à être découverte car la plus proche de son étoile et donc la moins facilement séparable.

Comparaison avec le système solaire
HR8799.png
Répartition en demi-grand axe (en unités astronomiques, avec une échelle logarithmique) des planètes dans le système HR8799 (en blanc) comparé au Système solaire (en jaune). Le diamètre de chaque point varie en fonction de la masse de la planète.

Beta Pictoris

Autour de la jeune (20 millions d'années) et chaude (8040 K de température efficace) étoile β Pictoris tourne la planète β Pictoris b, située à seulement 20 pc (60 années-lumière) de nous. C'est un jeune Jupiter massif qui perturbe le disque de gaz et de poussières gravitant autour de son étoile.

Beta Pictoris b
betapictorisbLagrange2009.jpg
En 2009 Anne-Marie Lagrange et collaborateurs publient dans Astronomy and Astrophysics la première image de β Pictoris b, prise avec NaCo au VLT.[Pour plus d'informations cliquez ici]
Une planète jeune et proche de son étoile
BetaPicb_JeuneProche.png
Voici la répartition des planètes observées par imagerie directe selon l'âge (en miliards d'années, Gyr) et le demi-grand axe (en unités astronomiques, AU). Vous trouverez, en rouge, l'exoplanète β Pictoris b.

Comprendre

Auteur: JLB

Plan

banniere_comprendre.jpg

Nous commencerons cette partie par quelques rappels sur la physique des objets que nous étudions.

Puis nous verrons les informations que nous donne la lumière provenant de ces objets.

Enfin nous verrons comment capturer cette lumière et extraire ces informations.


Physique de la cible

Auteur: JLB

Introduction

Fomalhaut b
Fomalhaut_planet-credit_ESA_NASA_L_Calcada-.jpg
Crédit : ESA/NASA

Commençons par étudier ce qui se passe d'un point de vue physique dans le système planétaire que l'on va chercher à imager:


Mécanique

La planètes suivent les lois de la mécanique découvertes par Newton. En particulier, elles sont soumises à la force de gravitation universelle qui définit des orbites képlériennes.

La position et le mouvement relatif de la planète par rapport à son étoile vont nous permettre de contraindre les éléments de l'orbite (demi grand axe, inclinaison, excentricité), sa période et donc les masses des corps.

Éléments d'une orbite
Angular_Parameters_of_Elliptical_Orbit.jpg
A – planète B – étoile C – plan de référence, l'écliptique D – Plan orbital de la planète E – noeud descendant F – Périapse G – noeud ascendant H – Apoapse i – Inclinaison J – Direction de référence (ligne de visée) Ω – Longitude du noeud ascendant ω – Argument du périapse

Pour aller plus loin.


Formation

Une planète commence sa formation sous la forme d'un noyau solide qui grossit par accrétion de matière. Si la masse de ce planétoïde dépasse quelques dizaines de M_Terre(1 M_Terre correspondant à une fois la masse Terre) , l'accrétion de gaz augmente brutalement pour former une planète géante.

Naissance d'une planète géante
aa18457-11-fig2.jpg
En 2012, Christoph Mordasini et collaborateurs publient dans Astronomy and Astrophysics une étude sur la formation des planètes, ici celle de Jupiter, de haut en bas et de gauche à droite, se trouvent l'évolution de la masse, du taux d'accrétion, du rayon et la luminosité de la planète en fonction du temps.

Remarque: Instabilités gravitationnelles

Le modèle précédent, dit de "core accretion" ou accrétion de coeur, n'est pas le seul existant pour expliquer la formation des planètes géantes, un autre modèle est basé sur les modèles de formation des étoiles. En effet les instabilités gravitationnelles dans le disque protoplanétaire provoquent une fragmentation de celui-ci suivi d'effondrements locaux menant à la formation directe d'astres principalement gazeux... Identifier le mode de formation est donc une tache complexe, et l'imagerie directe donne des pistes pour ce faire (notamment la luminosité ou la température en fonction de l'âge de la planète mais aussi sa position par rapport à l'étoile).

Pour en savoir plus, reportez-vous au cours sur la formation des planètes en cliquant ici.


Disque zodiacal

Lorsqu'une étoile vient de se former, elle est entourée d'un disque de poussière et de gaz comme β Pictoris par exemple RAJOUTER LE LIEN. C'est dans ce dernier que vont se former les planètes. Au fil de l'évolution du système planétaire, ce disque va être alimenté par les collisions entre les comètes et les astéroïdes. Ce disque de poussière est très lumineux dans les systèmes jeunes. Il absorbe le rayonnement de l'étoile et son émission (principalement dans l'infrarouge lointain) va avoir tendance à gêner l'observation directe des exoplanètes.

Dans le système solaire le contraste moyen entre la lumière zodiacale et la lumière solaire est de 7 ordres de grandeur. alors que le rapport des masses entre le disque de poussière et les planètes vaut 10^{-10} et que le disque s'étend de 5 à plusieurs centaines d'UA. Il existe des étoiles autour desquelles on trouve un disque plus de 1200 fois plus brillant, comme η Corvi !

On exprime l'intensité diffusée par la poussière interplanétaire en zodi, 1 zodi étant l'intensité diffusée par le disque de notre système solaire.

Disque
Exoplanet_caught_on_the_movecredit_ESO_A_M_Lagrange.jpg
Image composite combinant le disque et la planète en orbite autour de β pictoris (ici masquée, au centre du cercle) .
Crédit : ESO/Lagrange

Corps Noir

Tout corps, à une température donnée, émet un rayonnement particulier appelé rayonnement thermique (ou par abus, rayonnement de corps noir, un corps noir étant un corps parfaitement absorbant à toutes les longueurs d'onde).

Le spectre du rayonnement d'un corps noir ne dépend que de sa température T. La longueur d'onde \lambda_{\mathrm{max}} où ce spectre atteint son maximum est donnée par la loi de Wien:  \lambda_{\mathrm{max}} = \frac{hc}{4.965 k_B T}. h, c et k_B désignent respectivement les constantes de Planck, la vitesse de la lumière et la constante de Boltzmann. Un corps chaud présente donc un pic d'émission décalé vers les courtes longueurs d'onde par rapport à un corps plus froid. Aux températures ambiantes, ce pic est dans l'infrarouge (dit infrarouge thermique), mais pour des corps atteignant une température plusieurs milliers de Kelvins, ce maximum se décale dans le spectre visible : c'est le cas des étoiles par exemple, ou bien d'un tison chauffé à blanc.

Le flux total F (intégré sur toutes les longueurs d'onde) émis par un corps noir ne dépend également que de sa température, suivant la loi de Stefan-Boltzmann : F = \sigma T^4\sigma désigne la constante de Stefan-Boltzmann. Un corps chaud rayonne donc bien davantage qu'un corps froid.

La température du corps noir émettant autant de flux thermique que la planète est appelée température efficace (T_{\mathrm{eff}}) de la planète. Elle est en règle générale voisine de la température physique de la région de la planète d'où est principalement issue l'émission thermique (atmosphère, voire surface solide pour des planètes telluriques dotées d'une atmosphère mince).

Or, on a pu voir précédemment, que le processus de formation des planètes était un processus impliquant des chocs et autres phénomènes violents, ce qui provoque un dégagement d'énergie considérable sous forme de chaleur.

Evolution température
TempMordasini2012.jpg
En 2012, Christoph Mordasini et collaborateurs publient dans Astronomy & Astrophysics une étude sur la formation des planètes, ici celle de Jupiter. En rouge vous pouvez remarquer l'évolution de la température efficace de la planète en fonction du temps.

Vous pouvez remarquer que, une fois formée, plus la planète est jeune, plus elle est chaude, et donc plus important est le flux lumineux qu'elle émet. Mais aussi plus la longueur d'onde du maximum de luminosité est courte (et se rapproche du domaine visible) ! Ainsi Jupiter émet actuellement son maximum d'émission autour de 30 µm, tandis que β Pictoris b l'émet autour de 1,7 µm.

Pour en savoir plus.


L'infrarouge Proche

Le rayonnement de corps noir des jeunes exoplanètes géantes culmine généralement dans le proche infrarouge. C'est une chance car il y a de nombreuses raies moléculaires (méthane, monoxyde de carbone...) et atomiques (Na, K ...) dans ce domaine spectral, ce qui permet potentiellement d'analyser la composition chimique de ces planètes.

Pour observer depuis le sol dans ce domaine de longueurs d'onde, il faut hélas se restreindre aux fenêtres de transparence de l'atmosphère terrestre, comme les fenêtres J,H et K situées dans le proche infrarouge (voir l'image ci-dessous).

sofi_filters.png
Filtres J (1,1-1,4 μm), H(1,5-1,8 μm) et (2-2,5 μm)K (en rouge et vert) disponible dans le proche infrarouge à l'ESO, comparé à la transmission de l'atmosphère terrestre (bleu).

Age

La formation des planètes étant quasi-concomittante à celle de leur étoile hôte, on assimile souvent l'âge de la planète à celui de son étoile. Par exemple la Terre a terminé sa formation 20 millions d'années après le Soleil, ce qui est négligeable en comparaison des 4,6 milliards d'années du système solaire.

Fragmentation d'un nuage interstellaire
protoplanetDiskModel.jpg
Modèle de formation de disque protoplanétaire par fragmentations d'un nuage se situant dans le milieu interstellaire. Dans ce nuage un très grand nombre d'étoiles sont en formation en même temps, mais elles sont de masses différentes. Nous allons pouvoir répartir les étoiles résultantes sur un diagramme HR et, suivant leur emplacement, pouvoir dater le groupe d'étoiles et donc contraindre l'âge des exoplanètes possiblement présentes.
Crédit : Starplan

Groupe local

Pour déterminer l'âge d'une étoile on peut déterminer, par son mouvement propre, à quel groupe d'étoiles elle appartient. Le groupe d'étoiles, dont les étoiles ont été formées au même moment et se déplaçant dans la même direction, peut nous donner son âge grâce à sa répartition au sein du diagramme HR. http://astro.unl.edu/naap/hr/animations/hr.html

Activité

Age/Activité
Age_RHK_AgeEstim_Mamajek2012.gif
Eric E. Mamajek et Lynne A. Hillenbrand ont publié en 2008 dans the Astrophysical Journal une étude sur les estimateurs d'âge des étoiles de type solaire. Ce graphique nous présente la répartition des âges, en ordonnées (en années et en échelle logarithmique), en fonction d'un marqueur d'activité à savoir \log (R'_{HK}) : plus il est élevé, plus l'activité est grande. Les courbes représentes plusieurs tentatives pour déterminer une relation entre ces deux observables.

On peut aussi relier, pour un type stellaire donné, l'âge à l'activité et à la couleur de l'étoile. La couleur s'obtient en prenant deux mesures de flux photométriques dans deux domaines de longueur d'onde différents. Pour l'activité, l'observation de plusieurs marqueurs spectroscopiques est possible ainsi que l'émission dans le domaine des rayons X.

Activité/X
RHK_X_AgeEstim_Mamajek2012.gif
Dans le même article de Eric E. Mamajek et Lynne A. Hillenbrand, on trouve ce graphique qui nous présente une relation linéaire entre le marqueur spectroscopique qu'est le \log (R'_{HK}) et le rayonnement en X . B-V est l'indice de couleur des étoiles qui peut donc être relié à leur type spectral.

Rotation

La rotation de l'étoile est aussi liée à l'activité et donc à son âge, la comparaison de la rotation propre d'une étoile avec sa couleur va donc nous permettre de remonter à ce premier paramètre, pour un type spectral donné.

Rotation/Activité
Rotation_RHK_AgeEstim_Mamajek2012.gif
L'article de Eric E. Mamajek et Lynne A. Hillenbrand présente enfin ce graphique qui nous présente les relations linéaires entre le marqueur spectroscopique qu'est le log (R'_{HK}) et la rotation de l'étoile exprimée par le nombre de Rossby.

Source d'information

Auteur: JLB

Introduction

Les planètes et les étoiles émettent des photons dans l'espace et certains vont arriver jusqu'à la Terre... Notre seule source d'information, ce sont ces photons !

Les observations sont effectuées avec un ou plusieurs télescopes, qui vont collecter et envoyer un grand nombre de photons au foyer de l'instrument. L'image se forme alors sur un capteur CCD (Charge-Coupled Device, dispositif à transfert de charges), qui est un récepteur à photons transformant ces derniers par effet photoélectrique en courant électrique. Ceci permet donc l'enregistrement d'une image notamment pour être envoyée et traitée par un ordinateur.

Sont identifiables sur l'image obtenue par le capteur CCD :

Observation de Fomalhaut b
fomalhaut_b.jpg

Position

Pour voir la planète, il faut que son image et celle de l'étoile ne soient pas superposées, cela sous-entend que leur écartement angulaire sur le ciel soit suffisamment important. La mesure de cet angle se fait en seconde d'arc (aussi noté "), qui est une subdivision du degré, un degré correspondant à 60 minutes d'arc (60') et une minute d'arc à 60 secondes d'arc (60").

Cette séparation angulaire dépend de la distance séparant les deux corps a (voir la partie mécanique) et de la distance séparant le système exoplanétaire de l'observateur terrestre d. Or, si l'on prend un cas typique d'un planète à 100 UA autour d'un étoile située à 10 pc de nous, le rapport d/a vaut plus de cent mille ! La séparation angulaire i entre l'étoile et l'exoplanète vues depuis la Terre est alors donnée simplement par la formule trigonométrique \tan (i) = \frac{a}{d}. Comme \frac{a}{d} \ll 1, cette formule se simplifie en i \approx \frac{a}{d} si l'on mesure i en radians (il faudra alors le convertir en secondes d'arc : 1\,\mathrm{rad} \approx 206265^{''}).


Photométrie

La lumière qui nous permet d'identifier la planète provient de plusieurs mécanismes physiques. L'étoile émet de la lumière au niveau de sa photosphère, dont l'intensité et la couleur vont dépendre de sa température efficace (cf. corps noir). Mais la planète (suivant son éloignement par rapport à son étoile) va réfléchir une partie de la lumière stellaire suivant son albédo (littéralement sa capacité à réfléchir la lumière). Elle va aussi émettre sa propre émission thermique selon sa propre température efficace. AJOUTER LIEN.

On exprime la différence d'intensité lumineuse I entre l'étoile et la planète grâce au contraste, définit comme : c = \frac{I_{\'etoile} - I_{plan\`ete}}{I_{\'etoile} + I_{plan\`ete}}

Le contraste en magnitude est défini comme la différence de magnitude (LIEN VERS PAGE SUIVANTE) entre la planète et l'étoile.

solarSystemSeager2010_Modif.jpg
Comme nous l'avons vu précédemment, le flux lumineux émis par les planètes du système solaire se compose de deux parties, une partie (au niveau de la flèche rouge) dû à l'albédo de la planète qui va provoquer une réflexion de la lumière solaire (avec un maximum au même endroit que le maximum solaire, puisqu'il s'agit de la même lumière) et une partie d'émission thermique propre (au niveau de la flèche bleue). La température des planètes étant plus froide que celle de leur étoile, ce second maximum local se situe à de plus grandes longueurs d'onde.

Pour aller plus loin sur la photométrie, cliquer ici.


Magnitudes

Pour mesurer la luminosité d'un objet en astrophysique, on utilise les magnitudes.

Par définition la magnitude m est liée au flux spectral émis ou réfléchi E par la formule m = -2.5 \log_{10} \left( \frac{E}{E_0} \right)E_0 est le flux spectral d'une étoile de référence (par défaut Véga) qui correspond arbitrairement à une magnitude de 0.

En général on considère deux types de magnitudes :

[Pour aller plus loin.]

Les magnitudes sont d'usage courant en astronomie et très utiles. Elles permettent, entre autres choses, de construire des diagrammes couleur-magnitude ou couleur-couleur qui donnent des informations similaires au diagramme HR tout en pouvant être construits beaucoup plus facilement à partir des observations disponibles. Ici, une couleur désigne la différence entre deux magnitudes observées dans deux bandes spectrales différentes.

Diagramme couleur-couleur
HR8799_HRdiag.jpg
Diagramme couleur-couleur comparant les naines rouges (M dwarfs) naines brunes (L et T dwarfs) et les planètes HR8799 b,d et d. Ici on compare des observations dans l'infrarouge dans avec des filtres K',Ks,L' et M'..

[Pour aller plus loin.]


Acquérir l'information

Auteur: JLB

Introduction

SPHERE_fig2_detection.jpg
De gauche à droite : image de l’étoile corrigée par optique adaptative, image de l’étoile atténuée par coronographie, SDI, ADI (ces sigles recouvrent des techniques expliquées par la suite).
Crédit : LESIA

Une fois les photons observés, il faut trouver puis étudier les éventuelles planètes... Or ce n'est pas chose facile : les planètes ne sont pas du tout visibles directement dans les données brutes (les deux premières images en partant de la gauche de la figure ci-dessus).

Il faudra donc utiliser certains concepts avancés de traitement du signal :

Hubble space telescope
HST_creditNASA.jpg
Crédit : NASA

Optique ondulatoire

La lumière est une onde électromagnétique, et l'intensité lumineuse est proportionnelle au carré de l'amplitude de cette onde. Comme toute onde, elle est sujette aux phénomènes de diffraction et d'interférence, qui vont être particulièrement importants ici. Ainsi l'image de l'étoile hôte, que l'on assimile a une source ponctuelle vue depuis la Terre, va devenir une tache d'Airy (voir image ci-dessous) sur le récepteur du fait de l'utilisation d'instruments d'ouverture finie (l'ouverture est directement reliée au diamètre du miroir principal du télescope). La lumière de l'étoile va donc s'étaler sur l'ensemble du détecteur, compliquant la détection de la ou des planètes éventuellement présentes !

Il est important de remarquer que cette tache centrale a une taille caractéristique proportionnelle à la longueur d'onde et inversement proportionnelle à l'ouverture du télescope. Cela implique que pour avoir une résolution suffisante, il faut une ouverture en adéquation avec la longueur d'onde : pour pouvoir espérer observer une planète proche de son étoile dans l’infrarouge lointain, il faudrait ainsi un télescope de plusieurs dizaines de mètres d'ouverture !

Airy-pattern2.jpg
Image simulée d'une source ponctuelle à travers un instrument d'ouverture finie et circulaire : tache d'Airy

Mais cet aspect ondulatoire présente aussi des avantages : il permet de mettre en œuvre des techniques d'observation basées sur la combinaison de plusieurs télescopes. Ainsi, l'interférométrie permet ainsi de combiner plusieurs télescopes individuels et distants les uns des autres pour obtenir un gain de séparation angulaire. L'interférométrie permet aussi d'occulter l'étoile hôte en jouant sur les interférences destructives.

[Pour aller plus loin]


Coronographie

Comme constaté précédemment, l'image de l'étoile hôte formée sur le récepteur d'un instrument se présente sous la forme d'une tache qui recouvre les images des planètes tournant éventuellement autour d'elle. Notre but va donc être de retirer l'image de l'étoile et d'autres résidus parasites qui pourraient se former à cause des phénomènes de diffraction et d'interférence (les tavelures). Un moyen naturel de retirer la lumière d'une étoile, observable sur Terre depuis l'aube des temps, est le phénomène de l'éclipse solaire, où le Soleil est masqué par la Lune.

Coronographe de Lyot
Shemacoronographelyot_domainePublic.jpg
Schéma original du coronographe de Lyot, tel qu'il le présenta lui-même en 1932. La lentille placée en A forme l'image du soleil sur un disque en B, légerement moins large que l'image du soleil. Puis la lentille C produit une image A'A" sur un diaphragme dont le centre est occupé par le petit écran E. Les bords du diaphragme arrêtent la lumière diffractée par les bords de la première lentille, le petit écran arrête la lumière des images solaires produites par les réflexions parasites sur les faces de la lentille. L'image de la seule couronne solaire finit par apparaître en B'B".
Crédit : Domaine public

C'est sur ce principe que l'astrophysicien Bernard Lyot développa au début du vingtième siècle un coronographe, instrument qui permet de cacher la lumière du soleil par l'utilisation d'un masque disposé sur le chemin optique et d'un collimateur pour atténuer les résidus. Les instruments qui font de l'observation en imagerie directe d'exoplanète utilisent ce même concept, voire des versions plus évoluées : coronographie de phase, coronographie interférentielle achromatique, etc.

[Pour en savoir plus sur les coronographes actuels et futurs cliquez ici.]


Coronographe, diffraction

Corono_ShemaAvecInterference_2.png
Représentation du fonctionnement d'un coronographe de Lyot.
Crédit : JLB pour SESEP

Voici ce qui se passe dans un coronographe de Lyot, expliqué au moyen de l'optique géométrique. La lumière de l'étoile (vert) et celle de la planète (rouge), sont légerement décalées d'un certain angle sur le ciel. Si l'on place la lumière de l'étoile dans l'axe de l'instrument, celle de la planète arrive avec un certain angle, on dit que la planète est située hors-axe. Une lentille placée en A va donc faire converger en son foyer image les rayons de l'étoile mais pas ceux de la planète, il suffit alors de placer un petit écran au foyer image (dans le plan B) de la lentille (placée en A) pour arrêter toute la lumière provenant de l'étoile et ne garder que celle de la planète, dont on forme finalement l'image seule sur l'écran D.

Malheureusement cela ne fonctionne pas directement. En effet, il faut considérer ici le fait que l'ouverture de l'instrument est finie (le télescope a un certain diamètre), ce que l'on modélise ici par la présence d'un collimateur en A.

diffraction.gif
Dans le cadre de l'optique ondulatoire, si une onde plane passe à travers un trou, elle change de forme, le trou devient virtuellement l'emplacement d'une nouvelle source de lumière : c'est le phénomène de diffraction. Le principe de de Huygens présente qu'en optique ondulatoire, chaque point atteint par l'onde se comporte comme une nouvelle source ponctuelle)

En tenant compte du phénomène de diffraction par l'entrée de l'instrument (rayons en bleu), une partie importante des rayons difractés ne sont pas arrétés par l'écran en B. Il faut donc placer un autre diaphragme sur le chemin, en C, qui va bloquer la plus grande partie des rayons diffractés.

Dans une approche pleinement ondulatoire (on utilisera le formalisme complexe par la suite) : si l'on considère l'amplitude A_A de l'étoile avant l'entrée dans l'instrument de diamètre d et sa phase \varphi_A , alors la phase du rayon provenant de la position x_A sur le plan A, vu à la position angulaire \theta_B au niveau du plan B est donnée par \varphi_A(x_A) = 2 \pi x_A \frac{\sin(\theta_B)}{\lambda} \simeq 2 \pi x_A \frac{\theta_B}{\lambda} dans l'approximations de Gauss (petits angles hors-axe).

L'amplitude reçue au niveau du plan B depuis tous les points source virtuels dans l'ouverture en A est alors donnée par intégration : A_B (\theta_B) = \frac{\int_D A_A (x_A) e^{i \varphi_A (x_A)} dx_A }{d} ou, en omettant le facteur de normalisation : A_B (\theta_B) = \int_D A_A (x_A) e^{i 2 \pi x_A \frac{\theta_B}{\lambda}} dx_A . L'amplitude de lumière reçue dans l'instrument, venant de l'étoile, est donc dépendante du diamètre d de l'instrument et de la longueur d'onde d'observation \lambda .


Coronographe, convolution

Coronographie, effets
Principe_corono.jpg
Image de l'étoile, étape par étape, sur le trajet optique du coronographe.
Crédit : LESIA

En fait, à chaque étape, les images intermédiaires vont être convoluées (voir ici, partie Transformée de Fourier et de Laplace, et ) par la fonction de transmission de l'instrument (masque, diaphragmme ...) et va voir son intensité diminuer.

Au niveau du plan C (indiqué par stop dans le schéma ci-dessus), après le passage du masque (mask), on obtient une amplitude de formule : A_C (x_C) = \int_D M_B( \theta_B ) A_B (\theta_B) e^{i 2 \pi x_C \frac{\theta_B}{\lambda}} d\theta_B M_B est la fonction de transmission du masque placé en B. Dans le cadre d'un coronographe, M_B(\theta_B)=0 ~\mathrm{si}~\frac{-\theta_r}{2}\le\theta_B\le\frac{\theta_r}{2}~\mathrm{et}~1~\mathrm{sinon}. L'amplitude au niveau du plan C va être donc être atténuée par rapport à celle au niveau du plan B, ce rapport dépendant de celui entre la taille angulaire du masque \theta_r et l'ouverture d de l'instrument.

Au niveau où l'on place le détecteur, en D, l'amplitude finalement observée est donnée par : A_D (\theta_D) = \int_D M_C( x_C ) A_C (x_C) e^{i 2 \pi \theta_D \frac{x_C}{\lambda}} dx_C M_C est la fonction du transmission du Lyot-Stop, un diaphragme dont on considérera la fonction de tranmission également rectangulaire : M_C(x_C)=1 ~\mathrm{si}~\frac{-x_r}{2}\le x_C\le\frac{x_r}{2}~\mathrm{et}~0~\mathrm{sinon}.

On montre alors que l'amplitude de la lumière entrant dans l'axe de l'instrument (celle de l'étoile) va diminuer selon le rapport \frac{\theta_r x_r}{d^2} : plus le masque sera grand et le Lyot-Stop fermé, plus la lumière de l'étoile sera "éteinte" et donc plus facilement la planète sera visible. Attention toutefois, la lumière provenant d'une éventuelle planète doit quant à elle être transmise ! Il faut donc trouver un compromis entre la diminution d'intensité de la lumière de l'étoile et la conservation de l'intensité en provenance d'une éventuelle planète, dont on ne connaît pas a priori la séparation angulaire avec l'étoile...


Optique adaptative

Nous venons de voir que la coronographie permet de retirer la majorité de la lumière provenant de l'étoile... mais d'une étoile théorique, considérée comme ponctuelle ! Or il n'y a pas que les effets d'optique ondulatoire au sein de l'instrument qui entrent en jeu, mais aussi (dans le cas des instruments au sol) les effets de l'atmosphère terrestre. À elle seule cette dernière va modifier la forme de l'image de l'étoile, ce qui va accentuer les résidus et ce d'une façon très variable dans le temps, du fait notamment du vent. Ces effets atmosphériques se manifestent par la déformation des fronts d'onde, et dégradent la résolution angulaire de l'instrument au-delà des limites théoriques imposées par l'optique ondulatoire (dépendant de l'ouverture et de la longueur d'onde). Dans les cas les plus extrêmes, ces déformations optiques sont mêmes visibles à l'oeil nu : c'est le fourmillement apparent d'un objet observé au-dessus d'une route asphaltée en été, ou au-dessus d'un barbecue...

Correction
boucleretrooverteferme.jpg
À gauche, une observation sans optique adaptative. À droite la même cible avec optique adaptative, qui nous révèle que l'objet est une en fait une étoile binaire.
Crédit : ESO

Pour s'opposer à ces effets, on utilise l'optique adaptative. Cette technique analyse le front d'onde après réflexion sur un miroir déformable, puis modifie la forme du miroir pour compenser les effets de l'atmosphère en temps réel.

Fonctionnement
oaprincipe.png
Crédit : LESIA

Tavelures

Dans les précédentes parties nous avons vu les techniques utilisées pour retirer la lumière de l'étoile hôte et corriger les perturbations sur le chemin de la lumière... mais ces corrections ne sont pas parfaites ! Sur le détecteur, nous voyons des taches dispersées qui sont les résidus que la coronographie et l'optique adaptative n'ont pas réussi à corriger. Le problème est que ces taches peuvent être prises pour des planètes ou se superposer aux images de ces dernières. Nous allons donc devoir tenter de retirer ces résidus, aussi appelés artefacts.

Exemple de tavelures
Speckle_fiber.jpg
Image produite par un faisceau laser après passage dans une fibre optique. On voit des tavelures, les mêmes que l'on pourrait observer. Les causes possibles sont multiples : des fibres optiques (comme ici), mais aussi la turbulence atmosphérique imparfaitement corrigée, les imperfections des miroirs, etc.

Interferometrie

Présentation

Une manière différente d'aborder le problème est de passer par l'interférométrie, et en particulier l'interférométrie annulante. L'idée de base va être d'utiliser au moins deux télescopes assez éloignés pour augmenter la résolution angulaire (et donc bien distinguer l'étoile de l'éventuelle planète), et d'essayer de diminuer l'intensité en provenance de l'étoile (mais pas de la planète !) au moyen d'interférences destructives.

Acquisition

Au lieu d'avoir comme facteur limitant, en résolution angulaire, le diamètre D de l'instrument, l'interférométrie permet de passer d'une résolution proportionnelle à \frac{\lambda}{D} à un résolution proportionnelle à \frac{\lambda}{B}B est la ligne de base d'interférométrie (dans le cas de deux télescopes, il s'agit de la distance entre ces deux télescopes). Ces télescopes éloignés sont reliés entre eux par un chemin optique conçu de telle sorte que les interférences produites par la lumière arrivant dans l'axe des télescopes (la lumière de l'étoile) conduisent à une annulation des deux ondes en provenance des deux télescopes. On obtient donc sur le récepteur une figure de franges d'interférences centrées sur l'étoile au coeur d'une frange sombre. Mais la planète, elle, est située hors-axe : elle apparaît donc légèrement décalée et, si la figure d'interférences est correctement mis en place, échappe non seulement aux interférences destructives mais profite même d'interférences constructives pour augmenter le signal.

Interférométrie annulante
Nulling_interferometer.jpg
Représentation d'une observation par interférométrie annulante. Le disque blanc au centre est placé à l'endroit où se trouve l'étoile, qui se retrouve complètement masquée par les interférences (destructives : bandes noires) alors que les planètes en rouge ne sont pas masquées.

Intérêt

Nous avons parlé précédemment de la coronographie qui est utilisée sur des grands télescopes, notamment ceux de 8 m de diamètre du VLT. Ces instruments travaillent dans le proche infrarouge et le visible mais ne peuvent pas atteindre de plus grandes longueurs d'onde comme l'infrarouge moyen qui serait pourtant très intéressant pour étudier les raies spectrales des molécules, ou pour étudier des planètes plus froides émettant leur spectre thermique à de plus grandes longueurs d'onde. Le problème vient du fait qu'un télescope de 8 m de diamètre ne peut pas facilement séparer les sources à grandes longueurs d'onde, le pouvoir de résolution d'un télescope étant proportionnel à \frac{\lambda}{D}. Il faut donc augmenter la taille du télescope, ou combiner le flux de plusieurs télescopes comme nous le présentons ici. On peut alors aisément obtenir une ligne de base de 100 m en séparant 2 télescopes de cette distance.


Interférométrie annulante

Plusieurs étapes-clés sont à mettre en oeuvre pour l'interférométrie annulante :

Ce système annule alors la lumière située sur l'axe optique (celle de l'étoile) par interférences destructives mais pas la lumière hors axe (celle des planètes). Le déphasage en entrée de l'instrument sera donné par \varphi_E (x_E) = 2 \pi \frac{\vec{\theta}.\vec{r}}{\lambda}\vec{\theta} désigne l'écart sur le ciel entre la planète et l'étoile (donc dans une direction normale à l'axe optique), et \vec{r} est la séparation entre la planète et l'étoile dans la direction de l'axe optique.


L'exemple de Darwin/TPF-I

Deux satellites de recherche d'exoplanètes par interférométrie font partie des projets à long terme des agences spatiales européenne et américaine, ce sont respectivement les missions Darwin et TPF-I. Difficiles à mettre en oeuvre techniquement, ces missions nécessitent encore des développements technologiques pour envisager leur réalisation.

TPF_Xarray_w_credit.jpg
Crédit : NASA

Comme vous pouvez le voir sur l'illustration ci-dessus, l'idée et de faire voler en formation 4 quatres satellites "miroirs", combinant leurs faisceaux sur un cinquième satellite, la longue ligne de base étant négligeble devant la "distance focale" de l'instrument (le dernier satellite est très éloigné des 4 premiers). Pour être efficace, chaque faisceau va recevoir un déphasage précis selon deux configurations (appelées droite et gauche).

Configuration\varphi_A\varphi_B\varphi_C\varphi_DSignal attendu
Gauche180°90°270°étoile annulée + disque de poussière gauche + planète gauche
Droite180°270°90°étoile annulée + disque de poussière droite + planète droite
Simulation Darwin
DARWIN-Simulation.png
Simulation d'une observation Darwin de 60 h sur un système solaire à 10 pc de nous.
Crédit : Bertrand Mennesson

Imagerie différentielle

Présentation

L'idée de base de l'imagerie différentielle est de prendre plusieurs images de l'étoile et de sa planète (ou ses planètes) et de profiter des différences entre les images de ces objets pour les identifier et les distinguer. Après l'acquisition des données brutes par l'instrument, il faut commencer par les corriger des biais instrumentaux, de la réponse des pixels du capteur CCD, on obtient alors les images dites scientifiques. Il faut ensuite corriger les effets de l'instrument (on appelle cela déconvoluer l'image de l'étoile (selon la PSF, ou Point Spread Function de l'instrument, c'est-à-dire l'étalement d'un point source sur le détecteur). Pour ce faire, plusieurs méthodes sont possibles suivant l'instrument.

ADI

L'imagerie différentielle angulaire (ADI en anglais), va exploiter la rotation des objets sur la voûte céleste, comme vous pouvez le voir sur cette [ animation ]. Les étoiles présentent un déplacement apparent dans le ciel au cours de la nuit suivant des arcs de cercle centrés sur le pôle céleste. En général, un télescope moderne compense cette rotation automatiquement, mais ici nous bloquons cette rotation et suivons seulement le déplacement apparent de l'étoile sans rotation de l'instrument. Cela a pour effet d'appliquer une rotation de l'image de la planète (à ne pas confondre avec la révolution de la planète autour de son étoile) dans le ciel autour de l'axe de rotation de la Terre. Il "suffit" alors de faire la médiane des différentes images pour annuler les signaux non fixes (comme les éventuelles planètes), ce qui revient à ne garder que la PSF de l'étoile (ponctuelle) comme image médiane. Ensuite on soustrait cette PSF de toutes les images scientifiques, puis on applique une rotation de sens opposée à celle observée sur les images de façon à corriger la rotation sur le ciel, et finalement on additionne les images pour faire ressortir les planètes (si il y en a).

ADI
ADI_Lafreniere_2007.jpg
Exemple de ce que permet l'imagerie différentielle angulaire : (a) une des images prise de l'étoile HD 691 avec un coronographe. Les images (b) et (c) sont le résultat de l'ADI appliquée sur deux groupes d'images. (d) est l'image finale qui est la médiane de toute les images résiduelles (comme (b), (c)). Remarquez le point source au-dessus de l'étoile qui était complètement invisible dans l'image (a).

Polarisation

La lumière émise par les étoiles n'est pas polarisée, mais quand celle-ci est diffusée ou réfléchie par des disques ou des planètes elle peut acquérir une polarisation LIEN VERS GRAIN POLARISATION. Forts de ce constat, nous pouvons prendre deux images acquises avec deux polariseurs dans des directions perpendiculaires. L'étoile apparaît inchangée, tandis que les sources secondaire par réflexion ou diffusions présenteront des différences. On peut dont soustraire l'une des images à l'autre pour ne garder que les disques et les planètes proches.

Imagerie différentielle spectrale

Les planètes et les étoiles émettent des spectres caractéristiques, comportant des raies spectrales diverses selon la physico-chimie de ces objets (température, gravité, composition). Dans certaines bandes de longueurs d'onde, seul l'un des deux types de corps possède des absorbants : c'est par exemple le cas du méthane pour les planètes (du moins celles assez froides pour que des molécules puissent exister dans leurs atmosphères). Les tavelures, quant à elles, apparaissent à une distance angulaire proportionnelle à la longueur d'onde. L'imagerie différentielle spectrale (SDI en anglais) part du principe que l'on acquiert plusieurs images, simultanément, dans plusieurs bandes de longueurs d'onde judicieusement choisies. On ajuste ensuite leur échelle relative afin de pouvoir identifier et de retirer les tavelures. Ceci nous permet d'exploiter les différences entre étoiles et planètes pour extraire des informations sur ces dernières.


Spectroscopie

Pésentation

Acquérir une image de la planète, dans différentes bandes spectrales, permet d'obtenir quelques informations sur celle-ci. Mais ces informations sont dégénérées, c'est-à-dire que plusieurs jeux de paramètres physiques vont pouvoir correspondre aux différentes images observées. Ces dégénérescences peuvent être en partie levées si l'on obtient un véritable spectre de la planète (avec une résolution spectrale suffisante), ce qui explique pouquoi les instruments qui sont mis en service depuis 2013 (SPHERE, GPI, Project 1640, etc.) soient conçus pour en obtenir.

Acquisition

Pour ce faire, ces instruments comportent un IFS (Integral Field Spectrograph), qui va disperser spectralement la lumière censée arriver sur chaque pixel. Ainsi, au lieu d'avoir une image en deux dimensions comme pour l'imagerie pure, on obtient un cube spectral (une image en 3 dimensions) : les deux coordonnées de position sur la grille des pixels et la troisième coordonée selon la longueur d'onde observée. Une coupe du cube selon les dimensions horizontales donnera une image à la longueur d'onde de la "tranche" choisie, tandis qu'une ligne à position spatiale donnée suivant la dimension spectrale donnera le spectre observé en ce point de l'image. L'observable brut obtenu est donc un cube correspondant au flux reçu par le capteur CCD en fonction de la position du pixel et de la longueur d'onde.

Exemple de cube
psfcube.gif
Succession temporelle de différentes "tranches spectrales" correspondant aux différentes longueurs d'onde d'un cube spectral (les abscisses et les ordonnées correspondent aux coordonnées spatiales des pixels). Remarquez que le spectre de la planète (le point qui apparaît en bas à gauche à la moitié de l'animation) n'apparaît que à certaines longueurs d'ondes à une position spatiale donnée, alors que les autres éléments (artefacts, tavelures) s'éloignent en fonction de la longueur d'onde.
Crédit : GPI

Réduction des données

Il faut retirer des cubes spectraux les artefacts lumineux provenant de l'étoile et les tavelures pour pouvoir localiser les éventuelles planètes.

Déconvolution spectrale

Les artefacts proviennent des phénomènes d'interférence et de diffraction qui ont lieu le long du chemin optique, leurs positions vont changer proportionnellement à la longueur d'onde. Il est donc possible d'effectuer un changement d'échelle du cube suivant la longueur d'onde pour superposer toutes les images d'une tavelure en fonction de la longueur d'onde (dans ce nouveau cube où toutes les longueurs d'onde sont ramenées à la même échelle c'est désormais l'image de la planète qui va changer de position suivant la longueur d'onde). Il est alors possible de déterminer la forme exacte des tavelures et artefacts (indépendante de la longueur d'onde dans ce cube mis à l'échelle). On peut alors remettre les tavelures et artefacts seuls à lPuis on cherche quelle est la forme du flux en fonction de la longueur d'onde, et on retire les pixels où elle apparaît. Enfin on change à nouveau l'échelle du cube à sa valeur initiale pour toutes les longueurs d'onde.

DeconvolutionSpectrale_1.jpg
1. En décomposant un cube d'observation acquis par un IFS, on observe sur chaque tranche la planète (disque en bas à gauche de l'étoile jaune) noyée dans des tavelures (nuage rouge). La position d'un tavelure par rapport au centre va évoluer proportionnelement à la longueur d'onde. La position de la planète reste fixe. 2. Si on change l'échelle de chaque tranche en contractant chaque image proportionnelement à la longueur d'onde, les tavelures seront à position fixée d'une tranche à l'autre. C'est en revanche la planète qui va maintenant changer de position en fonction de la longueur d'onde.
DeconvolutionSpectrale_2.jpg
3. Si on calcule la médiane des images fabriquées à l'étape n°2, on va obtenir une image comportant les tavelures mais pas la planète car la position de la planète n'est pas la même sur toutes les images. 4. On peut alors effectuer une transformation d'échelle inverse de celle effectuée à l'étape n°2 pour obtenir la position des tavelures seules à chaque longueur d'onde. 5. On soustrait ces nouvelles images aux observations. 6. Il ne reste plus alors que l'image de la planète à chaque longueur d'onde.

Extraction du spectre

Dans ce cube, débarrassé des tavelures, on peut maintenant chercher les spectre d'une ou plusieurs planètes. Pour faire cela on effectue une corrélation croisée avec un jeu de spectres synthétiques sur chaque pixel et on se concentre sur les meilleurs coefficients de corrélations. On extrait ensuite le spectre de la planète identifié si elle existe.


Restrictions sur la séparation observable

On a déjà vu qu'il fallait une séparation angulaire minimale pour pouvoir imager une planète, du fait de la proximité de l'étoile bien plus brillante. En pratique, pour les instruments modernes, cette séparation minimale est de l'ordre du dixième de seconde d'arc. Attention cependant, la zone du capteur CCD où l'optique adaptative est efficace est restreinte à une petite partie du champ de vue. Les techniques de recherche d'objets se focalisent ainsi sur une zone restreinte... Pour l'instrument SPHERE, par exemple, on peut considérer que l'on recherche des planètes entre 0,1" et 3". Les planètes trop loin de leur étoile hôte sont donc difficiles à imager !


Confirmation

Auteur: JLB

Deux époques

Avoir une cible qui se comporte lors d'une observation comme une exoplanète ne suffit pas à annoncer la découverte d'une exoplanète. On recense avec le satellite Kepler 4234 candidats, en juillet 2014, et (seulement ?) 977 exoplanètes confirmées. Dans le cas de l'imagerie directe, une première détection ne suffit pas à annoncer la découverte d'une exoplanète, il en faut au moins deux pour prouver que l'objet en question est lié gravitationnellement‎ à une étoile, et cela permet de se faire une idée de l'orbite de l'objet. Le problème étant que les planètes détectées en imagerie directe sont éloignées de leurs étoiles et donc ont un mouvement autour de leur étoile très lent, il faut attendre plusieurs mois voire années pour obtenir des positions significativement différentes !

En effet, la source lumineuse que l'on observe à côté de l'étoile (un possible candidat planétaire), peut, en définitive, se révéler être une étoile située plus loin sur la ligne de visée (une étoile de champ), ou bien une zone plus dense que la moyenne dans le disque autour de l'étoile. En imagerie directe il faut au moins deux observations de l'objet, avec des images différentes, cohérentes avec une orbite képlérienne et un masse minimale inférieure à 13 masses de Jupiter, pour confirmer la présence d'une exoplanète. On peut alors déclarer la détection d'un objet lié à l'étoile et de masse planétaire (au dessus de 13 masses de Jupiter on entre dans le domaine des naines brunes).

Une planète tournant autour d'une étoile
beta_pic_Chauvain2012.jpg
Gaël Chauvin et collaborateurs dans un article de 2012 de Astronomy and Astrophysics présente une étude de l'orbite de β Pictoris b Ici nous avons une compilation de huit observations qui montre bien que l'objet tourne autour de l'étoile. Remarquez la différence de date et de position entre les point 1 et 2 : en 2003 les chercheurs ont découvert un objet proche de l'étoile mais ils ont dû attendre 2009 pour avoir la preuve que c'était bien une planète.

Autres méthodes

Une autre grande inconnue laissée par l'imagerie directe est la masse de la planète, paramètre essentiel qui va déterminer si l'objet est une planète ou une naine brune ! Or, si l'on se restreint à l'imagerie directe, seule l'utilisation de modèles plus ou moins bien contraints permettent d'en estimer une.

ESO_-_The_Radial_Velocity_Method_.jpg
Représentation de la modification du spectre d'une étoile, décalé vers le bleu ou vers le rouge, suivant que la planète s'éloigne ou s'approche de nous, c'est ce décalage qui est utilisé par la méthode de vélocimétrie radiale.
Crédit : ESO

Une mesure, indirecte, en vitesse radiale ou en astrométrie, si celles-ci sont possibles, permettraient de contraindre la masse de la cible ainsi que sa période de révolution autour de l'étoile..

astrometrie-courbe.jpg
Crédit : Évolution de la position d'une étoile dans le ciel, les petits écarts (au chemin en pointillés) viennent de la présence d'un planète, ce sont ces écart que recherche l'astrométrie pour les exoplanètes. Michael Perryman,arxiv:1209.3563

[Cours sur la technique des vitesses radiales.]

[Cours sur la technique des vitesses radiales.]


Le cas de Fomalhaut b

C'est autour de l'étoile Fomalhaut que se trouve un objet, peut-être encore sujet à controverse. En effet dans le disque d'accrétion de cette étoile, on a annoncé avoir trouvé dans des images visibles du HST une planète.

Kalas.jpg

Mais les images prises par Spitzer en infrarouge ne montrent rien ! Pour les défenseurs de la "découverte", c'est que la planète est trop petite pour être vue par Spitzer. Pour les détracteurs de cette "découverte" un objet vu en visible mais pas en infrarouge, ne peut pas être une planète.

janson.jpg

Se tester

Auteur: JLB

QCM Lexique

Auteur: JLB

Objets observés

qcmParamètres

Voici quelques questions sur les paramètres importants à prendre en compte dans l'imagerie directe des exoplanètes :

1)  Pourquoi est-il plus facile de détecter une planète (sans considération sur son âge) plutôt éloignée de son étoile ?



2)  Pour l'imagerie directe, quel est le plus important ?



qcmCibles

Voici quelques questions sur les cibles de l'imagerie directe :

1)  A priori, une jeune naine M est une cible intéressante, pourquoi ?



2)  Plusieurs exoplanètes ont été imagées autour d'étoiles de type A, pourquoi ?




Atmosphère

qcmAtmosphère

Voici quelques questions sur les effets de l'atmosphère terrestre, et comment on tente de les corriger.

1)  L'atmosphère est très absorbante dans :


2)  Quel effet va avoir l'atmosphère sur les observations dans des gammes de longueurs d'onde où elle est transparente ?




Instruments

qcmSéparer

Hors atmosphère, avec un optique parfaite, il n'est toujours pas simple de séparer les planètes de leurs étoiles. Voici quelques questions sur ces techniques :

1)  Dans le principe du coronographe de Lyot, seul le fait placer un masque unique sur la trajectoire de la lumière par l'étoile est important.



2)  L'imagerie différentielle angulaire (ADI) utilise un mouvement de rotation pour séparer la lumière provenant de l'étoile de la lumière provenant de la planète, lequel ?



3)  L'imagerie différentielle spectrale utilise des bandes spectrales calibrées pour profiter des raies d'absorptions de l'étoile et ainsi pouvoir retirer la lumière de de celle-ci.



qcmCorriger

Au sol, nous devons corriger les effets de l'atmosphère terrestre et le fait que l'optique n'est pas parfaite. Voici quelques questions sur la correction de ces effets:

1)  Qu'est-ce qu'une tavelure (speckle) ?



2)  Comment fonctionne l'optique adaptative ?



Exercices

Auteur: JLB

Astronomie

exerciceAstronomie

L'une des données les plus importantes pour l'imagerie directe d'exoplanète est l'angle sur le ciel entre la planète et son étoile, les questions qui suivent vont vous permettre de comprendre les liens entre la dynamique du système observé et cette importante observable.

Unités et constantes
\mathcal{G}6.67384 \times 10^{-11}\,\mathrm{m^3/kg/s^2}}constante de la gravitation universelle
L_soleil3.846 \times 10^{26}\,\mathrm{W}luminosité solaire
M_terre5.9742 \times 10^{24}\,\mathrm{kg}masse de la Terre
M_jupiter1.8987 \times 10^{27}\,\mathrm{kg}masse de Jupiter
M_soleil1.9891 \times 10^{30}\,\mathrm{kg}masse du Soleil
N_A6.02214129 \times 10^{23} \, \mathrm{mol^{-1}}nombre d'Avogadro
R8.3144621\,\mathrm{J/K/mol}constante des gaz parfaits
R_terre6378.136\,\mathrm{km}rayon terrestre équatorial
R_jupiter71492\,\mathrm{km}rayon jovien équatorial
R_soleil695508\,\mathrm{km}rayon solaire équatorial
Ryd10973737.6\,\mathrm{m^{-1}}constante de Rydberg
UA1.49597871 \times 10^{11}\,\mathrm{m}unité astronomique
c299792458\,\mathrm{m/s}vitesse de la lumière dans le vide
e1.60217657 \times 10^{-19}\,\mathrm{C}charge électrique élémentaire
h6.62606957 \times 10^{-34}\,\mathrm{J \cdot s}constante de Planck
k_B1.3806488 \times 10^{-23}\,\mathrm{J/K}constante de Boltzmann
pc3.08567758 \times 10^{16}\,\mathrm{m}parsec
\sigma5.670373 \times 10^{-8}\,\mathrm{W/m^2/K^4}constante de Stefan-Boltzmann
T_{\mathrm{eff}_{\odot}}5780\,\mathrm{K}température efficace du Soleil

Crédits

Question 1)

51 Peg b est la première exoplanète découverte autour d'une étoile de type solaire, elle a été découverte par la méthode des vitesses radiales.

Elle est en orbite à 52 millièmes d'unités astronomiques autour de l'étoile 51 Peg, qui se situe à 14,7 parsec de nous.

Quel est l'ordre de grandeur de la séparation angulaire entre la planète de son étoile ?

Question 2)

Corot 7 b est une planète de type super-Terre, d'un rayon inférieur à 2 fois le rayon terrestre, découverte par le satellite du CNES CoRot grâce à la technique des transits.

Elle est en orbite à 17 millièmes d'unités astronomiques autour de l'étoile Corot 7, qui se situe à 150 parsec de nous.

Quel est l'ordre de grandeur de la séparation angulaire entre la planète de son étoile ?

Question 3)

2M1207 b est la première planète imagée, autour d'une naine brune.

Elle est en orbite à 46 unités astronomiques autour de la naine brune 2M1207 qui se situe à 52 parsec de nous.

Quel est l'ordre de grandeur de la séparation angulaire entre la planète de son étoile ?

Question 4)

Les deux premières questions de cette page portent sur des planètes découvertes par les techniques des vitesses radiales et par celle des transits.

Au vu des résultats que vous avez obtenu, pensez-vous qu'il soit possible d'imager facilement ces deux planètes ?


Détectabilité

exerciceDétectabilité

Pouvoir observer un objet va dépendre de plusieurs facteurs.

Question 1)

Pour faire de l'imagerie directe, on utilise soit des instruments au sol, soit des satellites. Ces deux méthodes ont leurs avantages et leurs inconvénients... Quels sont-ils ?

Question 2)

La gamme de longueur d'onde que vous utilisez pour observer est essentielle. Pour observer un planète, il faut que le flux qui en provient soit suffisant en comparaison de celui de son étoile hôte. La sélection du domaine spectral va dépendre de l'âge de la planète, de sa distance à l'étoile et des domaines spectraux accessibles.

Déterminez pour les trois planètes qui suivent, à quelle longueur d'onde se trouve le maximum spectral de leur émission, et calculez leur flux surfacique.

  • Jupiter, dont la température efficace est de 124 K et qui tourne autour du soleil en 12 ans.
  • 2M1207 b (voir page précédente), dont la température efficace est de 1600 K.
  • Osiris, de son nom scientifique HD 209458 b, planète découverte et très étudiée par la méthode des transits, avec une température effective de 1130 K et qui tourne en 85 heures autour de son étoile.

Concluez sur la facilité de détecter ces planètes.


Visibilité du système solaire depuis AlphaCen b

Auteur: JLB

Présentation

Fin 2012, une planète ressemblant à la Terre et tournant autour de l'étoile α Centauri B (faisant partie du système stellaire le plus proche de nous) a été annoncée. Elle a été découverte par vélocimétrie radiale. [Pour plus d'information cliquez ici]

the_planet_around_Alpha_Centauri_B.jpg
Crédit : ESO

Le système α Centauri est constitué des 3 étoiles :

Alpha du Centaure
Alpha_Centauri_and_its_surroundings.jpg
Crédit : ESO

Imaginons qu'une forme de vie intelligente, au même niveau technologique que nous, y habite et cherche à étudier notre système solaire. Auraient ils la possibilité de détecter la Terre ? Ou au moins Jupiter ? Pour le savoir répondons aux quelques questions des pages suivantes...

Quelques Grandeurs

MassePériodeVitesse orbitaleRayonTempérature efficace
Terre5.97 \times 10^{24}\,\mathrm{kg}d'après vous ?30 km/s6371\,\mathrm{km}254\,\mathrm{K}
Jupiter320 M_{\oplus} soit 9.55 \times 10^{-4}\,M_{\odot}11.86\,\mathrm{ans}à calculer11\,R_{\oplus} soit environ 0.1\,R_{\odot}124\,\mathrm{K}

α Cen B a une parallaxe de 796,92 milliarcsecondes.

Remarque: la distance en parsec est par définition l'inverse de la parallaxe en arcsec, "parsec" étant d'ailleurs l'abréviation de "par seconde" (d'arc) .


Questions

exerciceDistances

Question 1)

Quel la distance entre la Terre et le Soleil ? Entre Jupiter et le Soleil ?

Sous quel angle apparent dans le ciel de α Cen Bb observerait-t-on la distance Terre-Soleil ? la distance Jupiter-Soleil ?

exerciceLuminosité

Question 1)

Dans quelle gamme de longueur d'onde rechercher ces planètes ?

solarSystemSeager2010_Modif.jpg

Quel est le contraste entre la Terre et le soleil, entre Jupiter et le soleil ?

exerciceTechnique

Question 1)

Si ces extraterrestres ont un petit peu d'avance sur nous et ont à disposition les télescopes au sol que nous prévoyons d'avoir au cours des décennies à venir. Peuvent-ils observer, voire étudier la Terre ou Jupiter ? Si oui est-ce une tache facile ?

DirectImagingContrast_final.png
Voici les courbes des capacités de détection des instrument actuels (GPI 2013, SPHERE 2014) et futur avec les ELT, télescopes de plus de 20 m de diamètre (TMT,GMT et E-ELT, arrivant après 2020). Si une planète a un contraste avec son étoile, à séparation angulaire donnée, supérieur à la courbe, alors elle est détectable. Ces instruments ciblent le domaine du proche infrarouge (1 à 5 µm) particulièrement les bandes J (1,25 µm), H (1,75 µm) et L (3,75 µm) qui sont des fenêtres de transparence de l'atmosphère terrestre (l'eau absorbe beaucoup dans le proche infrarouge en dehors de ces fenêtres).

Question 2)

Sachant que le contraste entre la lumière zodiacale et la lumière solaire dans le système solaire est de 10-7 entre 5 et plusieurs centaines d'UA, cela change-t-il vos conclusions ?


Mini-projet

Auteur: JLB

Présentation

Ce projet va vous confronter au travail que les astrophysiciens effectuent pour étudier les planètes extra-solaires par la technique de l'imagerie directe.

Jupiter dans le proche infrarouge
aa20838-12-fig1.jpg
Image de β Pictoris b, prise dans les bandes J, H et M'. Vous pouvez remarquer que la magnitude de la planète (au bout de la flèche) varie en fonction de la longueur d'onde.

Pour ce faire, vous allez partir des contrastes photométriques obtenus pour une planète, déterminer les magnitudes de l'objet, et comparer ces caractéristiques à celles des naines brunes. Pourquoi les naines brunes ? Parce que ce sont de objets étudiés de façon similaire aux jeunes exoplanètes géantes et que l'on a beaucoup plus d'observations sur ces étoiles avortées.


Données

Les données qui suivent proviennent d'un article scientifique, et d'observations par imagerie directe coronographique. Le premier tableau donne des informations sur la date des observations, les filtres utilisés (ici J, H, et M') et le contraste entre l'objet et l'étoile, en magnitude.

Observations
Dates :FiltreContraste en magnitude
16/12/2011J10,4plusoumoins0,5
16/12/2011J10,5 plusoumoins 0,3
16/12/2011J10,8 plusoumoins 0,3
18/12/2011H9,9 plusoumoins 0,3
18/12/2011H10,2 plusoumoins 0,4
18/12/2011H9,9 plusoumoins 0,3
11/01/2012H10,1 plusoumoins 0,3
11/01/2012H10,0 plusoumoins 0,2
11/01/2012H9,9 plusoumoins 0,2
11/01/2012H10,0 plusoumoins 0,3
26/11/2012M'7,5 plusoumoins 0,3
26/11/2012M'7,5 plusoumoins0,3
26/11/2012M'7,6 plusoumoins 0,3
26/11/2012M'7,8 plusoumoins 0,3

Le second tableau, extrait du même article, vous donne des informations sur les caractéristiques de l'étoile.

L'étoile
ParamètresValeur
Distance depuis la Terre (pc)19,44 plusoumoins 0,05
m_J3,524 plusoumoins 0,013
m_H3,491 plusoumoins 0,009
m_Ks3,451 plusoumoins 0,009
m_L'3,454 plusoumoins 0,003
m_M'3,458 plusoumoins 0,009
Type spectralA6V
Température efficace (K)[8052, 8036]
Luminosité : \log_{10}(L/L_{\odot})0,91 plusoumoins 0,01
Masse (en masse solaire)1,70 plusoumoins 0,05

Une base de données contenant des informations sur les naines brunes est disponible ici : DwarfArchives


Travail à effectuer

  1. Calculer les magnitudes apparentes et absolues de la planète.
  2. Comparer la température de l'étoile et de la planète par rapport à la répartition des magnitudes en longueur d'onde.
  3. Construire des diagrammes couleur-magnitude pour comparer la planète avec les naines brunes.

Question subsidiaire : Quel type de naine brune est le plus proche de ces observations?


Magnitudes de la planète

Les observations présentées ici consistent en des contrastes entre la planète et l'étoile. Il vous faut donc utiliser les magnitudes de l'étoile et la distance nous séparant du système pour déterminer les magnitudes de la planète.


Liens entre températures et magnitudes

Pour comparer la température de l'étoile et la planète il est préférable d'utiliser les flux émis par ces deux corps.


Diagramme couleur-magnitude

La table suivante réunit des informations sur les naines brunes connues.

Couleur magnitude naines brunes application.png

Construire un diagramme magnitude - couleur des naines brunes en utilisant l'application et en choisissant judicieusement les bandes spectrales. Placer la planète dans la diagramme.


Comparaison exoplanète-naines brunes

En comparant les types spectraux (L, T) des naines brunes et leur position dans le diagramme, conclure sur le type spectral de la planète.


Un exemple de résultat

Référez vous à l'article de Mickael Bonnefoy et collaborateur dans Astronomy & Astrophysics en 2013 pour une étude détaillée de ce qui est demandé ici.


-------------FIN DU CHAPITRE -------------FIN DU CHAPITRE -------------FIN DU CHAPITRE -------------FIN DU CHAPITRE -------------

ACCES AU PLAN DES CHAPITRES


Vitesses radiales et astrométrie

Auteurs: Nathan Hara, Jacques Laskar

Vitesses radiales et astrométrie

introductionPrésentation

L'observation directe d'exoplanètes est délicate à cause du grand contraste entre l'étoile et la planète. La plupart des détections sont faites en utilisant un effet de la planète sur l'étoile. Par exemple, la technique des transits consiste à mesurer une baisse de luminosité reçue, éventuellement due à une planète passant devant l'étoile observée.

Les techniques d'observations dont il est question dans ce cours reposent sur un principe simple: si des planètes orbitent autour d'une étoile, alors celle-ci aura un mouvement dépendant des planètes. En l'analysant, on infère la présence ou non de planètes et si oui, leurs orbites.

En effet, en astrométrie on mesure les variations de position angulaire de l'étoile et la détection par vitesse radiale consiste à mesurer la vitesse de l'étoile sur la ligne de visée. Le phénomène physique exploité et la réduction des données est similaire, c'est pourquoi ces deux méthodes seront présentées conjointement. Ce cours a deux objectifs:

On présentera un modèle d'observations "sans bruit" relativement réaliste, les principales sources d'incertitude, le principe des instruments utilisés et des éléments de traitement de données.

prerequisPrérequis


Décrire

Auteur: Nathan Hara & Jacques Laskar

Vitesses radiales

Lorsque la distance entre une source d'onde et un observateur varie dans le temps, la longueur d'onde vue par l'observateur varie aussi. Ce phénomène, appelé effet doppler, est ce qui permet la détection du mouvement radial de l'étoile. Cet effet est géométrique, et présent pour tous les types d'ondes. Un exemple bien connu est celui de la sirène d'ambulance: le son qu'elle émet a l'air plus grave une fois qu'elle est passée devant nous. Pour le comprendre, considérons une personne qui se baigne sur une plage (suffisament loin pour que les vagues se brisent derrière elle). Si elle reste statique les vagues vont l'atteindre avec une certaine période. Selon qu'elle s'avance vers le large ou revient vers la plage elle rencontrera les vagues plus fréquemment ou moins fréquemment. De la même manière, plus vite l'étoile s'avance vers la Terre, plus la lumière reçue est décalée vers les hautes fréquences.

L'énergie par longueur d'onde d'une source lumineuse, ou de manière équivalente, le nombre de photons reçus par longueur d'onde, est appelé le spectre de cette source. Cette définition fait intervenir une mesure, le spectre dépend donc de l'observateur. La lumière provenant d'une étoile est composée à priori d'une infinité de longueurs d'ondes. Certaines d'entre elles sont absorbées par l'atmosphère de l'étoile, de sorte qu'elles sont absentes du spectre mesuré. On parle de raies d'absorption. Le spectre d'une étoile a un aspect proche de la figure 1. Si la source lumineuse et l'observateur sont immobiles l'un par rapport à l'autre, l'observateur verra un certain profil spectral I_0(\lambda) (intensité par longueur d'onde \lambda). Si maintenant la source et l'observateur ont une vitesse relative \delta V(t) au temps t, l'observateur verra un spectre décalé I_t(\lambda) = I_0(\lambda-\delta \lambda(t)) avec \frac{\delta \lambda(t)} \lambda \approx \frac{\delta V(t)}{c}c est la vitesse de la lumière, dans l'hypothèse où \delta V est très petit par rapport à c. En mesurant \delta \lambda on peut remonter à \delta V. La présence d'une planète autour d'une étoile engendre un mouvement périodique de celle-ci, donc un décalage périodique du spectre (voir figure 2).

La mesure du décalage du spectre est utilisée depuis la fin du XIXe siècle pour détecter des étoiles binaires. La vitesse de l'étoile dont on observe le spectre (étoile cible) diminue avec le rapport de masse du compagnon et de l'étoile cible. Plus faible est la masse du compagnon plus il est difficile de le détecter. Les techniques ont été perfectionnées pour détecter des compagnons de masses de plus en plus faible.

Remarque: Une des limitations des mesures de vitesse radiale est qu'on ne mesure qu'une masse minimale car on mesure la projection du mouvement selon une direction. En notant i l'angle entre la ligne de visée et le plan orbital d'un objet de masse m, on mesure m sin(i).

En 1989, Latham trouve un objet d'une masse minimale de 11 masses de Jupiter (notée M_J) en orbite autour d'une étoile de type solaire. Etant donné que la limite admise à la masse d'une planète (au delà de laquelle le deutérium entre en fusion) est de 13 M_J, la conclusion de l'article est encore valide: il est possible que ce compagnon soit une Naine brune ou une super Jupiter, selon la valeur de sin(i). La première planète confirmée comme telle est découverte en 1995 par Michel Mayor et Didier Queloz à l'observatoire de Haute Provence.

Pour donner une idée des ordres de grandeur considérées, la Terre engendre un déplacement du Soleil d'environ 9 cm/s, Jupiter de 12.5 m/s. Un déplacement d'1 m par seconde correspond à un décalage relatif de longueurs d'onde \frac{\Delta \lambda}{\lambda} = 3 . 10^{-9}. La précision attendue doit être maintenue sur plusieurs mois, voire plusieurs années.

Spectre du Soleil dans le visible
spectre_soleil.gif
Représentation de la lumière du Soleil diffractée dans le visible. Pour une exploration plus précise du spectre du Soleil, voir cette page.
Crédit : Observatoire de Paris
Décalage du spectre
exoplanet_spectro.gif
L'étoile et la planète orbitent autour de leur centre de gravité. L'observateur (représenté par une lunette) voit le spectre reçu se décaler et en infère la vitesse V de l'étoile au cours du temps.
Crédit : Observatoire de Paris, ASM, E. Pécontal

Astrométrie

L'astrométrie désigne la mesure de la position des astres. Chronologiquement, l'astrométrie peut être considérée comme la première discipline de l'astronomie. Les anciens s'étaient déjà aperçus que certains astres semblent mobiles: les planètes, mais l'observation à l'oeil nu et avec les premiers instruments astronomiques sont trop imprécises pour détecter le mouvement des étoiles. Ils pensaient donc qu'elles sont fixes, mais ce n'est pas du tout le cas.

Plus précisément, on mesure la position des astres sur la Sphère céleste: Il s'agit d'une manière d'appeler l'ensemble des coordonnées angulaires d'un système de coordonnées sphériques. Selon le contexte, le centre de centre de ce repère est le barycentre du système solaire ou celui de la Terre, l'observateur, ou un autre point. Les directions du repère fixe peuvent être définies par rapport à des étoiles très lointaines (quasars), ou l'intersection du plan de l'orbite de la Terre (l'ecliptique) et de l'équateur.

Les observations doivent être exprimées dans un même système de référence. En l'occurrence, le repère fixe choisi est le référentiel barycentrique du système solaire qui est un référentiel galiléen. De ce fait, on peut modéliser simplement la trajectoire de l'étoile dans ce référentiel. Si l'étoile a des compagnons planétaires, le mouvement dû aux planètes projeté aura l'aspect d'ellipses imbriquées les unes dans les autres (voire figure). Le mouvement rectiligne uniforme a une amplitude bien supérieure au mouvement dû aux planètes, il n'est pas représenté sur la figure pour cette raison.

Une mesure astrométrique comporte toujours plusieurs étoiles dans le champ, de sorte que l'on peut mesurer le déplacement de l'étoile cible par rapport aux étoiles du champ. Ce qui nous intéresse est en effet un mouvement différentiel (on compare les mesures les unes aux autres, on ne cherche pas une position absolue). Un mouvement global des étoiles du champ provient des turbulences atmosphériques ou de bruits instrumentaux, qui peuvent être corrigés.

En mars 2015, deux planètes on été découvertes par astrométrie (DE0823-49 b et HD 176051 b). La résolution nécessaire à la détection de planètes est difficilement atteignable à cause des perturbations atmosphériques. Pour les corriger, il est possible d'utiliser une technique appelée astrométrie différentielle. Sa présentation sort du cadre de ce cours. Il est probable que la mission astrométrique spatiale GAIA, dont la précision est de l'ordre de 20 μas permettra de faire de nombreuses découvertes.

Les mouvements de l'étoile autour du centre de gravité du système planétaire sont de l'ordre du rayon de l'étoile en général. Par exemple, le mouvement de Jupiter entraine un mouvement quasi circulaire du Soleil dont le rayon est environ 1.06 rayon solaire.

L'ordre de grandeur du déplacement observé dépend de la distance de l'étoile, des masses de l'étoile et de la planète et du demi-grand axe de l'orbite.

ordres de grandeur
Type de planète Distance à l'étoileAmplitude du mouvement
Jupiter10 parsec500 µas
100 parsec50 µas
Terre 10 parsec0.3 µas
100 parsec0.03 µas
Projection du mouvement de deux planètes sur la sphère céleste
HIP116745_planetarysignal_withreal-ConvertImage.png
Observations idéales (sans bruit, mouvement de l'étoile uniquement dû aux planètes) d'un système à deux planètes sur cinq ans. En bleu on représente tout le parcours de la planète et en rouge les quarante-cinq mesures de position.

Exercices

Auteur: Nathan Hara

exerciceQuestions générales

Difficulté :   

Question 1)
  1. Pourquoi peut-on dire que la vitesse radiale et l'astrométrie se basent sur des effets dynamiques ?
  2. Le système étoile + planètes tourne autour de son centre de masse G (ou centre de gravité). Si une seule planète de masse m orbite autour d'une étoile de masse M à une distance r de G que vaut la distance de l'étoile à G, notée r^\star ? Que pensez vous de l'affirmation: "à orbite fixée, plus une planète est massive plus elle est facile à détecter" ?

Auteur: Nathan Hara

exerciceVitesses radiales

Difficulté :   

Question 1)
  1. L'effet Doppler existe-t-il seulement pour la lumière ou pour tous les types d'ondes ?
  2. Est-il dû au déplacement de la source, du receveur, ou à leur vitesse relative ?

Auteur: Nathan Hara

exerciceAstrométrie

Difficulté :   

Question 1)

Une seconde d'arc est égale à un degré divisé par 3600. Une micro seconde d'arc (µas) est un millionième d'une seconde d'arc.

  1. Exprimer une micro seconde d'arc en radians
  2. On considère un bâton de jonglage à extrémités enflammées de 50cm. A quelle distance doit se trouver le jongleur pour que les deux extrémités apparaissent à une une microseconde d'arc l'une de l'autre dans notre champ de vision ? Comparer avec les ordres de grandeurs des mouvements donnés page précédente.

Notez que si on observait uniquement l'effet de la planète si petit soit-il, on aurait toujours accès à toute l'information. Malheureusement, de nombreuses autre sources perturbent le signal, comme on va le voir dans les pages suivantes.


Que mesure-t-on ?

Le principe de ces techniques de détection est simple, mais pour obtenir la précision désirée il faut prendre en compte une grande quantité d'effets affectant les observations. Les mesures sont issues in fine de capteurs CCD, situés au plan focal d'un télescope ou en sortie d'un spectrographe, respectivement dans les cas de l'astrométrie et de la mesure de vitesses radiales. Ces capteurs fonctionnent par effet photoélectrique: lorsqu'un photon les percute, un électron est émis (si le photon a une énergie supérieure à une certaine limite). Ils sont exposés à la lumière pendant un certain temps appelé temps d'intégration. Le nombre d'électrons reçus pendant ce temps est ensuite compté pixel par pixel. Finalement, on obtient un tableau de nombre: le nombre de photons reçus par pixel de la caméra CCD. A chaque mesure est attachée une erreur, calculée selon une méthode explicitée par l'observateur. On effectue ensuite une série d'opérations mathématiques sur les mesures obtenues pour en extraire l'information souhaitée.

Avant d'arriver sur ces capteurs, les photons passent par les instruments, par l'atmosphère, par le milieu interstellaire. De plus, le mécanisme d'émission des photons par les étoiles est complexe: même si l'étoile était fixe par rapport à l'observateur, son spectre et sa position sembleraient variables. Comme les instruments ne permettent pas de résoudre angulairement l'étoile (elle n'apparait que sur un pixel), on mesure la lumière moyenne de sa photosphère, c'est à dire la fine partie de son enveloppe dont la lumière nous parvient. L'astrométrie est sensible à son photocentre. Enfin, il est possible que la lumière reçue provienne partiellement d'une autre source céleste située à proximité de l'étoile, ou du Soleil.

Chacune de ces étapes affecte le signal reçu, de sorte que l'information recherchée n'en représente qu'une petite partie. Par exemple, la vitese radiale apparente d'une étoile est de l'ordre de quelques dizaines de km/s, les techniques actuelles permettent de réduire le bruit instrumental à un peu moins de 0.3-0.5 m/s, qui est aussi l'ordre de grandeur de l'erreur due à une étoile de type solaire. Le signal d'une planète tellurique est de l'ordre de 0.5 m/s, c'est à dire moins que l'ordre de grandeur du bruit. Pour chercher des signaux de plus en plus faibles, il faut améliorer à la fois la modélisation du signal, des instruments, et des méthodes de traitement de données.

Représentation du trajet de la lumière
trajet_lumiere.png
En mauve, les sources de lumière et en bleu les milieux traversés.

Signal et bruit

Idéalement, on voudrait directement avoir accès aux orbites et aux masses exactes des planètes autour d'une étoile donnée. C'est jusqu'à présent impossible, et probablement pour longtemps ! Les techniques dont il est question ici visent à mesurer la position ou la vitesse de l'étoile, ce sont lessignaux recherchés. Cependant, comme on l'a vu page précédente, la quantité effectivement mesurée contient non seulement le signal mais aussi de nombreux processus aléatoires qu'on appelle bruits. Notre problématique est d'extraire les paramètres du signal (les paramètres des orbites) dans des mesures entachées de bruits.

Pour savoir si un signal sera détectable à priori, on calcule le rapport signal sur bruit qui est le rapport de "la puissance du signal" sur "la puissance du bruit". Ce rapport est fondamental. Le sens précis de cette expression varie selon le contexte mais typiquement, si un signal x \in \mathbb{R} et un bruit b \in R forment une mesure y = x + b, le rapport signal sur bruit est \frac{x}{b}. Plus ce rapport est grand, plus la mesure est précise.

Supposons que l'on veuille estimer une variation de position angulaire ou de vitesse (resp. \Delta x et \Delta V) d'une étoile de type solaire à 10 parsec autour de laquelle une planète de type jupiter orbite. On a \Delta x  \approx 50 \; \mu as et \Delta V \approx 12 \;m/s Les mesures sont contaminées par des variations aléatoires d'amplitudes x_b \approx 20 \muas (précision de la mission Gaia, mission astrométrique la plus précise) et V_b \approx 0.5 m/s (ordre de grandeur pour les meilleurs spectrographes actuels) . Le rapport signal sur bruit est de l'ordre de \frac{\Delta x}{x_b} = \frac{50}{20} = 2.5 et \frac{\Delta V}{V_b} = \frac{12}{0.5} = 24. La technique par vitesse radiale est pour l'instant plus précise.

Lorsqu'on mesure une quantité modélisée par une variable alétoire (par exemple le nombre de photons reçus pendant une seconde), le rapport signal sur bruit peut être défini comme le rapport de la moyenne et de l'écart-type.

Attention: il ne faut pas confondre l'amplitude d'un effet indésirable et le bruit qui lui est associé. Par exemple, le mouvement de la Terre dans le système solaire induit une vitesse apparente de plusieurs dizaines de km par secondes. Cependant, sa position est connue avec une très bonne précision, de sorte que l'incertitude liée à la soustraction du mouvement de la Terre est de l'ordre d'1 m/s. Remarque: On distingue en général la précision et l'exactitude. On peut disposer d'un instrument très précis mais comme d'autres effets perturbent la mesure, la mesure donne une valeur inexacte de ce que l'on cherche à mesurer. Dans l'exemple précédent, si on ne soustrait pas la vitesse de la Terre, l'instrument peut être aussi précis qu'on veut on aura un signal parasite entre 1000 et 60000 fois plus gros que celui qu'on cherche à mesurer.


Un problème d'estimation

La problématique de la détection par vitesse radiale et astrométrie est la suivante: quelles sont les orbites et les masses des planètes compagnons de l'étoile cible ? Comme les mesures sont entachées de bruit, on ne peut pas donner des paramètres orbitaux exacts. On estime aussi la "confiance" dans les valeurs des paramètres, souvent donnée sous forme de probabilités. On est aussi amené à se demander si toutes les planètes ont été détectées, et si les détections annoncées sont vraisemblables. En particulier, on étudie la stabilité du système trouvé.

La détection de planètes extrasolaires, comme d'autres problématiques de détection peut être subdivisé comme suit:

Ce cours se focalisera sur les trois premières problématiques, car la quatrième est transverse à toutes les techniques d'observation et fait l'objet d'un cours à part entière.


Exercices

exerciceModélisation

Difficulté :   

Question 1)
  1. Quelles sont les précisions annoncées des spectrographes européens ELODIE, HARPS et de celui à venir ESPRESSO ?
  2. Les observateurs attendent que le Soleil soit couché depuis plusieurs dizaines de minutes avant de commencer leurs observations, pourquoi ?
  3. Quel désavantages a-t-on à observer une étoile proche de la Lune ?
  4. Pourquoi observer en altitude ?


Effets à prendre en compte

Les observations traitées sont des mesures de position sur le plan focal d'un télescope et des mesures de spectres lumineux; respectivement pour l'astrométrie et les vitesses radiales. Faire l'hypothèse que les mesures ne sont que le résultat du mouvement d'une étoile parfaitement homogène donnerait des résultats invraisemblables. La fonction f de la page précédente prend en général en compte plusieurs effets présentés ici. Compte tenu du format du cours, seuls certains d'entre eux seront développés dans la suite.

Intensité globale
etoile3.png
L'intensité dépend de la composition, de la température T et de la vitesse \overrightarrow{v} en chaque point du disque apparent de l'étoile
Effet de la rotation de l'étoile sur le spectre
star.png
La lumière provenant de la moitié de l'étoile ayant un mouvement vers l'observateur est décalé vers les hautes fréquences (vers le bleu). L'autre moitié est décalée vers les basses fréquences (vers le rouge). Dans l'hypothèse où l'étoile est sphérique, et a une luminosité identique partout sur sa surface, le décalage vers le rouge et celui vers le bleu ne fait qu'élargir les raies spectrales. Si une tache est présente, ici sur la partie bleue, la symétrie est brisée et le déficit de lumière entraine un décalage du spectre vers le rouge.

Effets à prendre en compte (2)


Quantifier l'incertitude

Pour pouvoir annoncer qu'une planète a été découverte, il faut avoir une certaine confiance dans le résultat. Cependant, comme on vient de le voir, les mesures sont contaminées par de nombreuses sources qui peuvent être aléatoires. La détection d'exoplanète, comme toutes les problématiques de détection en astronomie, donne l'occasion de présenter des modélisations de phénomènes aléatoires. Introduire ces outils permettra en particulier de définir proprement ce que sont les barres d'erreurs. On donnera un sens à une phrase comme: la période d'une orbite estimée est 100 jours, plus ou moins 10 jours à trois sigmas.

Le cadre mathématique utilisé pour les prendre en compte est la théorie des statistiques. Les quantités physiques dont le comportement est imprévisible sont modélisées par des variables aléatoires qui prennent une certaine valeur à chaque mesure. Etant donné que cette notion intervient dans:

On donnera une description fonctionnelle, permettant de comprendre le cours sans avoir besoin de rentrer dans les détails des statistiques. Le lecteur intéressé pourra se référer à un ouvrage spécialisé, par exemple le cours de Didier Pelat (en libre accès), cité dans la bibliographie.

Une variable alétoire X peut être vue comme un programme informatique donnant une valeur réelle à chaque fois qu'on lui demande. La valeur retournée dépendra de la distribution de probabilité de cette variable aléatoire, notée f(x). Par exemple, si on veut modéliser le lancer d'une pièce de monnaie, chaque lancé correspond à une requête au programme qui retournera "face" ou "pile" avec une probabilité 1/2. Dans le cas de distributions continues, X prendra une valeur entre x_1 et x_2 avec une probabilité \int_{x_1}^{x_2} f(x) dx. La distribution la plus utilisée est la gaussienne (parfois appelée courbe en cloche), elle vérifie f(x) = \frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x-\mu)^2}{\sigma^2}}\mu est sa moyenne et \sigma^2 est sa variance. L'analyse des données repose sur l'hypothèse que nous observations des réalisations d'une variable aléatoire. Comme si réaliser une expérience consistait à demander à un ordinateur de sortir une valeur (la mesure) avec une certaine loi de probabilité.

Les variables aléatoires ont deux caractéristiques particulièrement importantes: leur moyenne et leur variance, définie respectivement comme \mu = \int_{-\infty}^\infty xf(x)dx et \sigma^2 = \int_{-\infty}^\infty (x-\mu)^2f(x)dx. La racine carére de la variance est appelée l'écart-type. Cette quantité donne "l'écart-typique" à la moyenne des réalisations. Dans la plupart des cas et en particulier dans le cas gaussien, l'écart-type a une interprétation univoque: il quantifie les déviations à la moyenne. Plus il est petit, plus les valeurs éloignées de la moyenne seront improbables. Dans la limite ou l'écart-type tend vers 0, on aura une variable aléatoire certaine, qui prend la valeur \mu avec une probabilité 1. En physique, on manipule souvent des incertitudes, qui sont implicitement modélisées comme des écart-types de variables aléatoires. Si un observateur dit "j'ai mesuré une vitesse radiale de y = 30.28781 km/s avec une incertitude de  0.00115 km/s", implicitement on suppose qu'il existe une variable aléatoire dont la moyenne correspond à la "vraie" valeur de la vitesse radiale et dont l'écart-type vaut  0.00115 km/s.

Remarque: nous utilisons une terminologie vague, pour des définitions précises voir les références.


Exercices

Auteur: Nathan Hara

exerciceModélisation des vitesses radiales

Difficulté :   

Question 1)

Citer des éléments à prendre en compte dans la modélisation des mesures de vitesses radiales ou astrométriques (on ne demande pas une liste très précise, encore moins exhaustive).

exerciceModélisations

Difficulté : ☆☆  

Question 1)

La démarche consistant à écrire un problème direct comportant une partie déterministe et une partie aléatoire n'est pas propre à la détection d'exoplanète. En majorité - si ce n'est en totalité - les détections reposent sur la même démarche. Dans chaque item de la liste suivante, on donne un phénomène à observer et un moyen d'observation. Dans chaque cas, lister des effets déterministes et/ou aléatoires à prendre en compte dans le modèle. Par exemple: "Mesurer une tension avec un voltmètre" peut se modéliser par u = u_v + b, où u est la tension mesurée, u_v la tension vraie et b un bruit gaussien dû aux fluctuations intrinsèques de la tension et aux erreurs de mesure. On peut aussi supposer que le voltmètre réalise en réalité une moyenne de tensions sur un certain intervalle de temps.

  1. Un lancé de dé
  2. Le point d'impact d'un tir ballistique (projectile sans système de propulsion propre) mesuré au gps
  3. Des tendances de ventes de vêtement dans un magasin à partir du livre des comptes tenu par un employé
  4. La mesure de position des corps du système solaire (attention ils ne peuvent pas être modélisés par des sources ponctuelles).


Comprendre

Auteur: Nathan Hara & Jacques Laskar

Modélisation - Problème direct


Présentation du modèle

Dans cette section on répond à la question suivante: pour un système planétaire donné, quelles seront les observations ? Dans la section précédente on a introduit la fonction f: \theta \in \mathbf{R}^n,t \in \mathbf{R}^m , \epsilon \in X^p \rightarrow y \in \mathbf{R}^m, où X désigne un espace de variables aléatoires, qui donne des observations y en fonction d'instants d'observation t, d'erreurs alétoires \epsilon et de paramètre du modèle \theta incluant masse de la planète, de l'étoile, paramètres de l'orbites, etc. qui seront précisés. En l'occurrence, l'erreur est bien représentée par un "bruit additif", c'est à dire les observations y sont de la forme y=f(\theta,t) + \epsilon, où f désigne une fonction modélisant la physique du phénomène observée, celle qui donnerait les observations "parfaites", sans aucune source d'erreur aléatoire. L'erreur \epsilon modélise tous les phénomènes aléatoires intervenant dans les mesures. Selon la distinction adoptée ici, les paramètres du modèle peuvent inclure une source indésirable mais non aléatoire.

L'objet de ce chapitre est de construire cette fonction f_p avec une modélisation physique. La modélisation la plus précise, utilisant tout ce que l'on sait de la physique serait ici inutilement complexe, car compte tenu des erreurs de mesures la différence avec certains modèles plus simples serait si faible qu'il serait impossible de la détecter avec un niveau de confiance acceptable. Le niveau de précision du modèle présenté ici est couramment utilisé par les observateurs.

Remarque: En pratique, les algorithmes d'estimation de paramètres sont des algorithmes d'optimisation, qui nécessitent tous de donner un ou plusieurs points de départs pour la recherche. Lorsque des modèles plus complexes sont utilisés, les estimations précises peuvent être utilisées comme tels.

On présentera d'abord une modélisation physique de l'objet étudié, puis d'autres effets physiques à prendre en compte. Les bruits instrumentaux seront traités dans le chapitre suivant. Les effets physiques "indépendants de l'observateur" qui seront pris en compte sont:

Ensuite, on modélise "comment" la lumière émise par l'étoile nous parvient, ce qui amènera à présenter:


Problème à deux corps

Auteur: Nathan Hara & Jacques Laskar

Problème à deux corps newtonien

Equation de Newton

Les planètes et l'étoile ont un certain volume. Cependant, on peut montrer que lorsque la distance entre deux corps en intéraction gravitationnelle augmente, leur comportement se rapproche de plus en plus de celui de deux points matériels. On néglige aussi les effets relativistes, de sorte que l'on est ramené à la modélisation de l'intéraction de deux points matériels, dont la résolution va suivre. Considérons deux points matériels P (planète) et S (pour "star" de sorte à éviter un conflit de notation avec l'anomalie excentrique E) de masses respectives m et M et O l'origine d'un repère Galiléen. Le principe fondamental de la dynamique s'écrit: m \frac{d^2\overrightarrow{OP}}{dt^2} = -GmM \frac{\overrightarrow{S P}}{S P^3}G est la constante universelle de gravitation.. En posant \overrightarrow{r} = \overrightarrow{SP} et \mu = G(M+m) on obtient:

\frac{d^2 \overrightarrow{r}}{dt^2} = -G(m+M) \frac{ \overrightarrow{r}}{r^3} = -\mu \frac{\overrightarrow{r}}{r^3}

On va montrer que la solution de cette équation décrit une conique plane, une ellipse dans le cas des planètes liées à une étoile. On suppose que le système est isolé, on peut donc choisir comme origine du repère le barycentre du système, ce qui permet d'obtenir facilement \overrightarrow{OP} et \overrightarrow{OS} par la relation m\overrightarrow{OP} + M\overrightarrow{OS} = \overrightarrow{0}.

On suppose que le système est isolé, donc le mouvement du barycentre du système {Etoile+planètes} est rectiligne uniforme dans un référentiel galiléen (par exemple le référentiel barycentrique du système solaire).

Quantités conservées

L'équation de Newton est une équation différentielle de degré deux sur des vecteurs de \mathbf{R}^3. Pour la résoudre il faut trouver six quantités conservées au cours du mouvement (ou intégrales premières du mouvement) indépendantes. En l'occurrence on peut facilement montrer que deux vecteurs sont conservés au cours du mouvement (ce qui fait deux fois trois composantes, on a bien six scalaires conservés). Notons \overrightarrow{r}} = r \overrightarrow{u}, où \overrightarrow{u} est un vecteur unitaire (et donc r est la norme de \overrightarrow{r}) et \dot{\overrightarrow{a}} la dérivée par rapport au temps d'un vecteur \overrightarrow{a}. On a la conservation du moment cinétique par unité de masse \overrightarrow{G} = \overrightarrow{r} \wedge \dot{\overrightarrow{r}} et du vecteur excentricité \overrightarrow{P} = \frac{ \dot{\overrightarrow{r}} \wedge \overrightarrow{G} }{\mu} - \overrightarrow{u} au cours du mouvement c'est à dire leur dérivée temporelle est nulle

En effet, soit \overrightarrow{r}(t) une solution de l'équation de Newton. Alors \frac{d \overrightarrow{G}}{dt}(t) = \frac{d( \overrightarrow{r}(t) \wedge \dot{\overrightarrow{r}(t)})}{dt} = \dot{\overightarrow{r}}(t) \wedge \dot{\overightarrow{r}}(t) + \overightarrow{r}(t) \wedge \ddot{\overightarrow{r}(t)} =0 car d'après l'équation de Newton, \ddot{\overrightarrow{r} est colinéaire à \overrightarrow{r}. D'autre part, \frac{d\overrightarrow{P}}{dt}(t) = \frac{\ddot{\overrightarrow{r}}(t)  \wedge \overrightarrow{G}(t) }{\mu} - \dot{\overrightarrow{u}}(t) , or

\ddot{\overrightarrow{r}} \wedge \overrightarrow{G} = - \frac{\mu}{r^3} \overrightarrow{r} \wedge (\overrightarrow{r} \wedge \dot{\overrightarrow{r}}) = -  \frac{\mu}{r^3} \overrightarrow{r} \wedge (\overrightarrow{r} \wedge r \dot{\overrightarrow{u}}) = -  \frac{\mu}{r^3}  r \overrightarrow{u} \wedge (r \overrightarrow{u} \wedge r \dot{\overrightarrow{u}}) = \mu \dot{\overrightarrow{u}}

Donc \frac{d\overrightarrow{P}}{dt} = \overrightarrow{0} .


Géométrie de l'orbite

Les quantités conservées définies page précédente permettent de donner une description géométrique de l'évolution de \overrightarrow{r}.

On déduit de la conservation du moment cinétique que le mouvement est plan. En effet, \overrightarrow{r}\cdot\overrightarrow{G} = \overrightarrow{r} \cdot (\overrightarrow{r} \wedge \dot{ \overrightarrow{r}) } et comme \overrightarrow{r} \cdot (\overrightarrow{r} \wedge \dot{ \overrightarrow{r}) } est un produit mixte, il est invariant par permutation circulaire: \overrightarrow{r} \cdot (\overrightarrow{r} \wedge \dot{ \overrightarrow{r}) } =  \dot{\overrightarrow{r}} \cdot (\overrightarrow{r} \wedge \overrightarrow{r}) } = \overrightarrow{0} car le produit vectoriel de deux vecteurs colinéaires est nul. Le vecteur \overrightarrow{r} est orthogonal à \overrightarrow{G} à tout instant, autrement dit le mouvement est dans un plan orthogonal à \overrightarrow{G}.

Notons v l'angle entre \overrightarrow{r} et \overrightarrow{P} et posons e = \|\overrightarrow{P} \| . Alors comme \overrightarrow{u} est unitaire, \overrightarrow{P} \cdot \overrightarrow{u} = e \cos v d'autre part en remplaçant \overrightarrow{P} par sa définition, on a \overrightarrow{P} \cdot \overrightarrow{u} = \frac{\overrightrarrow{r} \cdot ( \dot{\overrightarrow{r}} \wedge \overrightarrow{G} )}{r \mu} -1 et comme \overrightarrow{r} \cdot ( \dot{\overrightarrow{r}} \wedge \overrightarrow{G} ) est un produit mixte, \overrightarrow{r} \cdot ( \dot{\overrightarrow{r}} \wedge \overrightarrow{G} ) = \overrightarrow{G} \cdot ( \overrightarrow{r}   \wedge \dot{\overrightarrow{r}} ) = \overrightarrow{G} \cdot \overrightarrow{G} = G^2. où G est la norme de \overrightarrow{G}. On obtient alors r en fonction de v:

r(v) = \frac{p}{1+e \cos v}

p  = \frac{G^2}{\mu} , qui est l'équation polaire d'une conique du plan. Cette équation donne une paramétrisation de la solution en fonction de v, appelée anomalie vraie. Cependant, nous voulons exprimer la solution en fonction du temps, l'objet de la page suivante est d'exhiber une relation entre v et le temps. On sait que lorsque e < 1, il s'agit de l'équation d'une ellipse. On peut montrer géométriquement que p = a(1-e^2)a est le demi-grand axe de l'ellipse. Si e = 1 ou e>1, la trajectoire est respectivement parabolique ou hyperbolique. Dans ces deux cas le mouvement n'est pas borné, il concernerait une planète en phase d'éjection, événement dont l'observation est très improbable et indiscernable d'une planète à très longue période ou du mouvement propre sur les données actuelles.

L'orbite est dans un plan perpendiculaire à \overrightarrow{G}, et le vecteur \overrightarrow{P} est parallèle à \overrightarrow{FA}. Notons\overrightarrow{I}= \frac{\overrightarrow{P}}{\|\overrightarrow{P} \|} et \overrightarrow{K}= \frac{\overrightarrow{G}}{\|\overrightarrow{G} \|}. On introduit un vecteur \overrightarrow{J}de sorte que (\overrightarrow{I}, \overrightarrow{J},  \overrightarrow{K}) forme une base orthonormale.

Géométrie du mouvement elliptique
Geometrie_orbite2.png
Le mouvement est dans le plan (\overrightarrow{P}, \overrightarrow{Y})

Loi des aires

Nous avons montré que la solution au problème des deux corps est plane, et peut s'exprimer en fonction de l'anomalie vraie v, angle entre le vecteur excentricité et le vecteur \overrightarrow{r}.

r(v) = \frac{a(1-e^2)}{1+e \cos v}

Afin d'exprimer r en fonction du temps on va introduire successivement deux variables, M et E appelées respectivement 'anomalie moyenne et 'anomalie excentrique.

Loi des Aires

Avec les notations précédentes, \overrightarrow{u}(v) = \cos v \overrightarrow{I} + \sin v \overrightarrow{J}, donc\dot{\overrightarrow{u}}(v) = -\sin v \overrightarrow{I} + \cos v \overrightarrow{J} en remplaçant dans, \overrightarrow{G} = r \overrightarrow{u} \wedge (\dot{r}\overrightarrow{u}} + r \dot{\overrightarrow{u}}) on obtient:

r^2 \frac{dv}{dt}=G

Cette équation s'appelle la Loi des aires et signifie que \overrightarrow{r} balaie les aires à vitesse constant G. En particulier l'aire totale de l'ellipse est parcourue en un certain temps T fixe: le mouvement est périodique. L'aire de l'ellipse vaut:

\pi a b = \pi a^2 \sqrt{1-e^2} = \int_{0}^{2\pi} \frac{1}{2} r^2 dv = \int_{0}^T \frac{G}{2}dt = \frac{T}{2} \sqrt{\mu a (1-e^2)}

On retrouve bien la troisième loi de Kepler : n^2 a^3 = \mu avec n = \frac{2 \pi}{T}. On définit alors l'anomalie moyenne par M = n(t-t_0)t_0 est le temps de passage au périastre (A sur la figure), qui est proportionnelle à l'aire FAC (voir figure).


Exercices

exerciceConservation de l'énergie

Difficulté : ☆☆  

Question 1)

Pour établir l'équation du mouvement, les conservations du moment cinétique et du vecteur eccentricité suffisent. On a une autre intégrale du mouvement: l'énergie. Considérons deux points matériels S et P de masses respectives M et m. On pose \overrightarrow{r} = \overrightarrow{SP} , r = \|\overrightarrow{r}\| et \mu = \mathcal{G}(m+M) \mathcal{G} est la constante universelle de gravitation.

  1. Montrer que \frac{d^2\overrightarrow{r}}{dt^2} = -\mu \frac{\overrightarrow{r}}{r^3}
  2. Calculer l'énergie potentielle associée à la force de gravitation
  3. On note v = \left\| \frac{d \overrightarrow{r}}{dt}  \right\|. Déduire du théorème de l'énergie mécanique que \frac{1}{2} v^2 - \frac{\mu}{r} est une quantité constante au cours du mouvement
  4. Quel est le point de l'orbite où la vitesse de l'étoile est la plus élevée ? la moins élevée ?


Equation de Kepler

Equation de Kepler

L'équation de Kepler est une relation entre l'anomalie excentrique et l'anomalie moyenne, cette page présente un moyen de l'établir. L'aire \mathcal{A}(FAC) est proportionnelle à l'anomalie moyenne M.

\mathcal{A} (AFC) = \frac{M}{2 \pi} \pi a^2 \sqrt{1-e^2} = \frac{1}{2} a^2 \sqrt{1-e^2} M

L'ellipse de la trajectoire est obtenue par une affinité sur l'axe \overrightarrow{Y} de rapport \frac{b}{a} = \sqrt{1-e^2}. Donc

\mathcal{A}(AFC') = \frac{\mathcal{A}(AFC)}{\sqrt{1-e^2}} = \frac{a^2 M}{2}

Par ailleurs en notant E l'angle \widehat{AOC'}

\mathcal{A}(AOC') = \frac{1}{2} a^2 E = \mathcal{A}(FOC') + \mathcal{A}(AFC')

L'aire du triangle FOC' s'obtient facilement car HC' = HC / \sqrt{1-e^2}

\mathcal{A}(FOC') = \frac{1}{2} a^2e \sin E

On a finalement l'équation de Kepler

E - e\sin E = M

Cette équation est "transcendante", en conqéquence il n'existe pas d'expression analytique de E en fonction de M. Cependant, on peut développer E en puissances de M.

Anomalies
anomalies2.png
Représentation de l'anomalie vraie v, excentrique E et moyenne M.

Solutions en fonction du temps

Il reste à trouver une relation entre E et v, ce qui s'obtient aisément en exprimant la position (X,Y) de C dans le plan (\overrightarrow{I}, \overrightarrow{J}):

\left\{   \begin{array}{l l l}  X =&  r \cos v =& a(\cos E - e)  \\  Y =&  r \sin v =& a \sqrt{1-e^2} \sin E\end{array}

On en déduit les relations utiles:\begin{array}{l l}  \cos v = \frac{\cos E - e}{1 - e \cos E},  \quad & \sin v = \frac{\sqrt{1-e^2} \sin E}{1 - e \cos E}  \end{array}

A ce point, rappelons que l'objectif est d'exprimer la position et la vitesse de l'étoile comme des observables. En exprimant M en fonction de t puis E en fonction deM on a la position du corps à un instant quelconque. En ce qui concerne l'astrométrie, on peut s'arrêter aux équations ci-dessus et simplement faire un changement de référentiel, c'ést à dire exprimer la projection de X(t)\overrightarrow{I} + Y(t)\overrightarrow{J} sur la sphère céleste et choisir un jeu de paramètres \theta à ajuster. Pour les vitesses radiales nous avons besoin de \frac{dX}{dt} = \frac{dX}{dE} \frac{dE}{dM} \frac{dM}{dt}. En dérivant l'équation de Kepler par rapport à M on obtient:

\frac{dE}{dM} = \frac{a}{r}

D'où:

\left\{   \begin{array}{l l l}  \dot{X} =&  -na\frac{\sin E}{1-e \cos E} &= -\frac{na}{\sqrt{1-e^2}} \sin v  \\  \dot{Y} =&  na\sqrt{1-e^2}\frac{\cos E}{1-e \cos E} &= \frac{na}{\sqrt{1-e^2}} (e+\cos v) \end{array}

En pratique, il n'est pas nécessaire de calculer v en fonction de E. Les expressions ci-dessus suffisent. Pour mémoire, en remplaçant \cos v dans la formule trigonométrique  \tan^2 \frac{v}{2} = \frac{1-\cos v}{1+\cos v} , on obtient:

\tan \frac{v}{2} = \sqrt{\frac{1+e}{1-e}} \tan \frac{E}{2}


Changement de référentiel

Les observations sont disponibles dans un référentiel (\overrightarrow{i}, \overrightarrow{j}, \overrightarrow{k})\overrightarrow{k} est la direction d'observation et (\overrightarrow{i}, \overrightarrow{j}) sont choisis de sorte que le repère est orthonormé direct. Le repère (\overrightarrow{I}, \overrightarrow{J}, \overrightarrow{K}) est lui aussi orthormé direct. La matrice de passage du repère orbital au repère d'observation est donc une rotation, que l'on décompose en trois rotations dont les angles ont des noms usuels.

\left( \begin{array}{cc} x & \dot{x} \\ y & \dot{y} \\ z & \dot{z}  \end{array}  \right) = \mathcal{R}_3(\Omega) \mathcal{R}_1(i) \mathcal{R}_3(\omega)   \left( \begin{array}{cc} X & \dot{X} \\  Y & \dot{Y} \\ Z & \dot{Z}  \end{array}  \right)

Où:

\mathcal{R}_1(\theta) = \left( \begin{array}{ccc} 1 & 0 & 0 \\ 0 & \cos \theta & -\sin \theta \\ 0 & \sin \theta & \cos \theta \end{array} \right) \quad ; \quad \mathcal{R}_3(\theta) = \left( \begin{array}{ccc} \cos \theta & -\sin \theta & 0 \\ \sin \theta & \cos \theta &  0 \\ 0 & 0 &  1 \end{array} \right)

Soit B le barycentre du système {planète+étoile}, on note \mathcal{R}_3(\Omega) \mathcal{R}_1(i) \mathcal{R}_3(\omega) = \left( \begin{array}{ccc}  B &  G  & \star  \\ A &  F & \star  \\ C & D & \star  \end{array} \right)A, B, F, G sont appelées les constantes de Thiele-Innes. On conserve la notation classique pour ces constantes, qui sautent quelques lettres de l'alphabet pour une raison inconnue des auteurs. La notation C,D n'est en revanche qu'une convention pour ce cours et ne se trouve pas spécialement dans la littérature. On ne donne pas de nom particulier aux éléments de la dernière colonne de la matrice car étant donné que Z=0, ils n'apparaissent jamais dans les calculs

Paramètres d'un mouvement à deux corps newtonien
500px-Orbit1.svg.png
Le plan de référence est ici le plan d'observation.

Paramètres orbitaux classiques

On peut caractériser l'orbite par les éléments suivants:

Ces éléments donnent la géométrie de l'orbite. Pour déterminer la position de la planète à un instant t donné, il faut de plus connaître l'instant de son passage au périastre t_p. On peut alors calculer M = 2\pi \frac{t-t_p}{P} connaisant e on peut calculer l'anomalie excentrique E par l'équation de Kepler, puis l'anomalie vraie v. On en déduit la position sur l'ellipse par l'équation donnée page "Loi des aires", r(v) = \frac{a(1-e^2)}{1+e \cos v} . Enfin, la position sur l'orbite est donnée par les rotations explicitées ci-dessus.


Conclusion pour le problème à deux corps

Dans un référentiel galiléen quelconque de centre O, le mouvement de l'étoile S en fonction du temps peut s'écrire:

\begin{array}{ccc}\overrightarrow{OS}(t) &= \left( \begin{array}{c} x(t) \\ y(t) \\ z(t)   \end{array}\right) &= \overrightarrow{OB}_0 + \alpha t \overrightarrow{u} + \overrightarrow{BS}(t) \\ \dot{\overrightarrow{OS}}(t) &= \left( \begin{array}{c} \dot{x}(t) \\ \dot{y}(t) \\ \dot{z} (t)  \end{array}\right) &= \alpha  \overrightarrow{u} + \dot{\overrightarrow{BS}}(t) \end{array}

\overrightarrow{OB}_0 est la position du barycentre B du système {Etoile, Planète} à t=0, \overrightarrow{u} est la direction du mouvement de B et \alpha son module.\overrightarrow{BS}(t) = - \frac{m}{m+M} \overrightarrow{r} \overrightarrow{r} vérifiel'équation de Newton \frac{d^2 \overrightarrow{r}}{dt^2} =  -\mu \frac{\overrightarrow{r}}{r^3} , qui est une équation différentielle de degré deux sur l'espace. Lorsque \mu est fixé et la position et la vitesse à t=0, (\overrightarrow{r}_0, \dot{\overrightarrow{r}}_0) sont connus, la position et la vitesse sont données par le flot: \begin{array}{cccc } \Phi_{\mu}:& \mathbb{R} \times \mathbb{R}^3 \times \mathbb{R}^3 & \rightarrow &  \mathbb{R}^3 \times \mathbb{R}^3 \\   & (t,\overrightarrow{r}_0, \dot{\overrightarrow{r}}_0)& \rightarrow &(\overrightarrow{r}(t), \dot{\overrightarrow{r}}(t))\end{array} . En d'autres termes, les sept paramètres (\mu, X_0, Y_0, Z_0, \dot{X}_0, \dot{Y}_0,\dot{Z}_0) définissent une orbite de manière univoque. On peut faire un changement de variables pour décrire l'orbite par un autre jeu de sept paramètres, par exemple a, e, P, \omega, i, \Omega et t_p, qui sont les paramètres classiques présentés dans la section précédente. La plupart des auteurs les utilisent pour ajuster le mouvement des planètes, mais ils ont l'inconvénient d'être très sensibles aux erreurs pour de faibles excentricités et inclinaisons. Pour palier à ce problème on définit:

Ces éléments sont des fonctions continues de l'inclinaison et de l'excentricité.


Exercices

Auteur: Nathan Hara

exerciceBonnes et mauvaises configurations d'observation

Difficulté : ☆☆  

Question 1)

On définit un repère (x,y,z) où la direction z est selon la droite observateur - étoile. Avec les notations des pages précédentes, pour quelles valeurs de l'inclinaison  i les observations de vitesses radiales ne donnent aucune information sur le système ? lequelles rendent la configuration optimale ? Même question pour les angles i et \Omega en astrométrie.

Auteur: Nathan Hara

exerciceQu'est-ce que les vitesses radiales permettent de mesurer ?

Difficulté : ☆☆☆  

Question 1)

On définit un repère (x,y,z) où la direction z est selon la droite observateur - étoile. On note \left(  \begin{array}{c} \dot{X} \\ \dot{Y} \\ 0 \end{array} \right) les composantes du mouvement dans le plan orbital. Calculer la composante du mouvement de l'étoile selon la direction d'observation. On mettra les observations sous la forme K ( \cos(\omega+\nu) + e\cos(\omega)), où K est une constante à déterminer. Quels paramètres de l'orbite peut-on observer par vitesse radiale ? Montrer en particulier qu'on ne peut pas déterminer la masse exacte de la planète.


Modèle de la trajectoire

Les expressions établies jusqu'ici permettent de paramétrer le mouvement d'une étoile autour de laquelle une planète orbite, en faisant l'hypothèse que les deux corps sont ponctuels, forment un système isolé. Nous allons utiliser ces expressions pour donner un modèle général, lorsque n_p planètes orbitent autour de l'étoile.

En notant \overrightarrow{r}_0 et M respectivement la position et la masse de l'étoile et \overrightarrow{r_k}, m_k, k = \mathbf{1}..n_p les positions et masses des n_p planètes , les équations de la mécanique (classique) dans le référentiel barycentrique de ce système sont:

\begin{array}{cccccc} \ddot{\overrightarrow{r}_0} & = &-G\sum\limits_{k=1}^{n_p} m_k \frac{\overrightarrow{r_0}-\overrightarrow{r_k}}{\|\overrightarrow{r_0}-\overrightarrow{r_k}\|^3} & &=& -GM\left(\sum\limits_{k=1}^{n_p} \frac{m_k}{M} \frac{\overrightarrow{r_0}-\overrightarrow{r_k}}{\|\overrightarrow{r_0}-\overrightarrow{r_k}\|^3 \right)                \\              \vdots &  & & & &   \\        \ddot{\overrightarrow{r}_j} & = &-GM\frac{\overrightarrow{r_j}-\overrightarrow{r_0}}{\|\overrightarrow{r_j}-\overrightarrow{r_0}\|^3}& -G\sum\limits_{k=1, k\not=j}^{n_p} m_k \frac{\overrightarrow{r_j}-\overrightarrow{r_k}}{\|\overrightarrow{r_j}-\overrightarrow{r_k}\|^3}& = &-GM \left(\frac{\overrightarrow{r_j}-\overrightarrow{r_0}}{\|\overrightarrow{r_j}-\overrightarrow{r_0}\|^3}  - \sum\limits_{k=1,k\not=j}^{n_p} \frac{m_k}{M} \frac{\overrightarrow{r_j}-\overrightarrow{r_k}}{\|\overrightarrow{r_j}-\overrightarrow{r_k}\|^3}    \right)          \\        \vdots &  & & & &      \\          \ddot{\overrightarrow{r}_{n_p}} & = &-GM\frac{\overrightarrow{r_{n_p}}-\overrightarrow{r_0}}{\|\overrightarrow{r_{n_p}}-\overrightarrow{r_0}\|^3}& -G\sum\limits_{k=1}^{n_p-1} m_k \frac{\overrightarrow{r_{n_p}}-\overrightarrow{r_k}}{\|\overrightarrow{r_{n_p}}-\overrightarrow{r_k}\|^3} &=& -GM \left(\frac{\overrightarrow{r_{n_p}}-\overrightarrow{r_0}}{\|\overrightarrow{r_{n_p}}-\overrightarrow{r_0}\|^3}  - \sum\limits_{k=1}^{n_p-1} \frac{m_k}{M} \frac{\overrightarrow{r_{n_p}}-\overrightarrow{r_k}}{\|\overrightarrow{r_{n_p}}-\overrightarrow{r_k}\|^3}    \right)     \end{array}

En négligeant tous les termes du type \frac{m_k}{M} \frac{\overrightarrow{r_j} - \overrightarrow{r_k}}{\|\overrightarrow{r_j} - \overrightarrow{r_k} \|^3} , c'est à dire l'intéraction entre les planètes, on obtient:

\begin{array}{cccc} \ddot{\overrightarrow{r}_0} & =& -GM\left(\sum\limits_{k=1}^{n_p} \frac{m_k}{M} \frac{\overrightarrow{r_0}-\overrightarrow{r_k}}{\|\overrightarrow{r_0}-\overrightarrow{r_k}\|^3 \right) = -\sum\limits_{k=1}^{n_p} \frac{m_k}{M} \ddot{\overrightarrow{r_k}}               \\              \vdots &  & &    \\        \ddot{\overrightarrow{r}_j} & = &-GM\frac{\overrightarrow{r_j}-\overrightarrow{r_0}}{\|\overrightarrow{r_j}-\overrightarrow{r_0}\|^3}&         \\        \vdots &  & &       \\          \ddot{\overrightarrow{r}_{n_p}} & = &-GM\frac{\overrightarrow{r_{n_p}}-\overrightarrow{r_0}}{\|\overrightarrow{r_{n_p}}-\overrightarrow{r_0}\|^3}&    \end{array}

En résolvant les n_p problèmes à deux corps associés à chacune des planètes, par M \overrightarrow{r}_0 + \sum\limits_{k=1}^{n_p} m_k \overrightarrow{r_k} = \overrightarrow{0} (dont la première équation du système ci-dessus est la dérivée seconde) on obtient le mouvement de l'étoile. Le modèle de trajectoire complet dans un référentiel galiléen est:

\begin{array}{ccccccc}\overrightarrow{OS}(t) &=& \left( \begin{array}{c} x(t) \\ y(t) \\ z(t)   \end{array}\right) &=& \overrightarrow{OB}_0 + \alpha t \overrightarrow{u} + \overrightarrow{BS}(t) & =& \overrightarrow{OB}_0 + \alpha t \overrightarrow{u} - \frac{1}{M}\sum\limits_{k=1}^{n_p} m_k \overrightarrow{r_k} \\              \dot{\overrightarrow{OS}}(t) &= &\left( \begin{array}{c} \dot{x}(t) \\ \dot{y}(t) \\ \dot{z} (t)  \end{array}\right) &=& \alpha  \overrightarrow{u} + \dot{\overrightarrow{BS}}(t)&=& \alpha  \overrightarrow{u} - \frac{1}{M}\sum\limits_{k=1}^{n_p} m_k \dot{\overrightarrow{r_k}}  \end{array}


Trajectoire observée depuis le barycentre du système solaire

Le modèle précédent donne le mouvement de l'étoile observée dans un référentiel galiléen, en particulier le référentiel barycentrique du système solaire (O,\overrightarrow{I},\overrightarrow{J},\overrightarrow{K}), que l'on munit d'un repère de coordonnées sphériques (O, \rho, \alpha, \delta) repérant l'étoile S. Supposons que l'observateur est situé en O. A un instant t il mesure:

On peut facilement montrer avec un développement limité qu'au premier ordre en \frac{\| \overrightarrow{BS} \|}{\| \overrightarrow{OS}\|}, \rho(t) = \rho_B(t)+ \overrightarrow{e_{\rho}} \cdot \overrightarrow{BS}(t), \alpha(t) \cos \delta(t) = \alpha_B(t)\cos \delta(t)+ \frac{1}{\rho_B} \overrightarrow{e_{\alpha}} \cdot \overrightarrow{BS}(t), de même \delta(t) = \delta_B(t)+ \frac{1}{\rho_B} \overrightarrow{e_{\delta}} \cdot \overrightarrow{BS}(t) (à faire en exercice). Supposons que n_p planètes indéxées par k gravitent autour de l'étoile en S et (\overrightarrow{I_k}, \overrightarrow{J_k}, \overrightarrow{K_k}) le repère orbital de la planète k. On projette le mouvement \left( \begin{array}{c}  X_k(t) \\ Y_k(t) \\ 0\end{array} \right) dans le repère orthonormé direct (\overrightarrow{e_{\rho}}, \overrightarrow{e_{\alpha}}, \overrightarrow{e_{\delta}}) associé aux coordonnées sphériques (O, \rho_B, \alpha_B, \delta_B) (voir figure). Avec les notations de la page Changement de référentiel:

\Large \left( \begin{array}{c} \alpha(t) \cos \delta_B \\ \delta(t) \\ \rho(t) \end{array} \right) = \left( \begin{array}{c} \alpha_B(t)\cos \delta_B \\ \delta_B(t) \\ \rho_B(t) \end{array} \right) - \frac{1}{M} \sum\limits_{k=1}^{n_p} m_k \left( \begin{array}{ccc} \frac{A_k}{\rho} & \frac{F_k}{\rho} & \star \\ \frac{B_k}{\rho} & \frac{G_k}{\rho} & \star \\ C_k & D_k & \star \end{array} \right) \left( \begin{array}{c} X_k(t) \\ Y_k(t) \\ 0 \end{array} \right)

Observation depuis le barycentre du système solaire
referentiel_obs.png
Position de l'étoile en coordonnées sphériques dans le référérentiel barycentrique du système solaire et dans le référentiel translaté au centre de masse de la Terre. Les observations sont disponibles dans le référentiel terrestre, représenté en rouge, qui dépend de l'instant de mesure t.

Trajectoire observée depuis la Terre

Le modèle précédent donne l'évolution de l'étoile dans le repère barycentrique du système solaire (RBSS). Or les observations sont disponibles depuis la Terre. Si T est la position de l'observateur, S l'étoile cible on a \overrightarrow{TS} = \overrightarrow{TO} + \overrightarrow{OS}

La dérivée temporelle des vecteur est toujours définie par rapport à un référentiel. Ici la notation \dot{a} désigne la dérivée temporelle par rapport au RBSS.

La détermination de la position du centre de masse de la Terre par rapport au barycentre du système solaire est un sujet à part entière. La trajectoire d'un corps céleste au cours du temps dans un référentiel donné est appelée une éphéméride. Les principaux laboratoires de calcul des éphémérides sont le JPL (NASA) et l'IMCCE (Observatoire de Paris). Les liens envoient sur les générateurs en lignes d'éphémérides respectifs des deux laboratoires. .

Vitesses radiales

La vitesse de l'observateur T par rapport au barycentre du système solaire peut se décomposer en \dot{\overrightarrow{OT}} = \dot{\overrightarrow{OC}} + \dot{\overrightarrow{CT}} . La partie \overrightarrow{OC} est donné par les éphémérides, comme expliqué plus haut. La correction de la deuxième partie est essentielle: l'observateur parcourt deux fois le rayon terrestre en une nuit, ce qui donne une vitesse d'environ 300 m/s. Si M(t) désigne la matrice de changement de repère entre le référentiel lié à la Terre et le référentiel barycentrique du système solaire, on a \dot{\overrightarrow{CT}} = \dot{M}(t) \overrightarrow{CT}_{R_t}\overrightarrow{CT}_{R_t} désigne la position de l'observateur dans le référentiel terrestre.

La détermination de M est aussi un sujet à part entière, appelé "rotation de la Terre". Les paramètres de rotations officiels sont donnés par le Service de rotation de la Terre au SYRTE (Observatoire de Paris).

Parallaxe (astrométrie)

En ce qui concerne l'astrométrie, il faut exprimer la relation entre les positions mesurées et la position dans le RBSS, ce qui peut se décomposer en deux étapes: passer du référentiel terrestre au RBS translaté au centre de masse de la Terre (passer du référentiel rouge au référentiel noir à droite sur la figure), puis passer du référentiel translaté au RBS. Comme on le verra plus tard, il est aussi possible de se passer de cette étape en prenant un champ contenant des étoiles de référence.

Notons (x,y,z) la position de la Terre dans le RBS. En exprimant \overrightarrow{OS} dans le RBSS de deux manières on obtient une relation entre les coordonnées (\rho_B, \alpha_B, \delta_B) et (\rho_T, \alpha_T, \delta_T) : \begin{array}{lll} \rho_T \cos \delta_T \cos \alpha_T & = & \rho_T \cos \delta_S \cos \alpha_S -x\\           \rho_T \cos \delta_T \sin \alpha_T & = & \rho_T \cos \delta_S \sin \alpha_S - y \\   \rho_T \sin \delta_T & = & \rho_B \sin \delta_B -z\end{array}

Lorsque S est suffisamment loin, ces expressions différenciées au voisinage de (\rho_B, \alpha_B, \delta_B) donnent au premier ordre en \Delta \alpha = \alpha_T - \alpha_B, \Delta \delta = \delta_T - \delta_B et \Delta \rho = \rho_T - \rho_B

\begin{array}{lll}  \Delta \alpha \cos \delta &=& \frac{x}{\rho_B} \sin \alpha - \frac{y}{\rho_B} \cos \alpha  \\  \Delta \delta &=& \left( \frac{x}{\rho_B} \cos \alpha + \frac{y}{\rho_B} \sin \alpha \left) \sin \delta - \frac{z}{\rho_B} \cos \delta \\  \Delta \rho &= &-x \cos \alpha \cos \delta - y\sin \alpha \cos \delta + z \sin \delta \end{array}

On appelle la quantité \varphi = \frac{1}{\rho_B} \approx \frac{1}{\rho} la parallaxe de l'étoile (en général notée \pi ou \varpi, qui sont des symboles déjà utilisés dans le cours). Elle considérée comme constante au cours des observations et est ajustée aux observations en astrométrie.

Remarque: la procédure de changement de référentiel passe par des changements d'échelle de temps (UTC, UT1, TDB...) qui ne seront pas détaillés ici.

Changement de coordonnées
parallaxe.png
Position de l'étoile en coordonnées sphériques dans le référérentiel barycentrique du système solaire et dans le référentiel translaté au centre de masse de la Terre. Les observations sont disponibles dans le référentiel terrestre, représenté en rouge, qui dépend de l'instant de mesure t.

Accélération de perspective et changement de parallaxe (astrométrie)

Accélération de perspective

L'accélération de perspective est un effet purement géométrique, qui tient à la définition du mouvement propre d'une étoile. Le mouvement propre est en effet défini comme \mu = \frac{V\sin \theta}{\rho}V est la vitesse du système observé, \rho la distance entre l'observateur et le système, \theta est l'angle entre la ligne de visée et la vitesse du système observé. Nous supposons que les mesures astrométriques sont sur un plan. Cependant, on mesure la projection du mouvement sur une sphère, donc \theta n'est pas constant au cours du temps. En dérivant par rapport au temps, comme V est constant:

\frac{d \mu }{dt} = - \frac{V}{\rho^2} \sin \theta \frac{d\rho}{dt}+\frac{V}{\rho} \cos \theta \frac{d\theta}{dt}

On voit sur le triangle OSP que \frac{d\theta}{dt} = - \mu et V \cos\theta =V_r=\frac{d\rho}{dt}. D'où:

\frac{d\mu}{dt} = - \frac{\mu}{\rho} \frac{d\rho}{dt} - \frac{\mu}{\rho} V_r = -\frac{2\mu}{\rho} V_r

En pratique on ajuste un terme quadratique \eta, où le mouvement angulaire sur la sphère céleste est donné par \mu (t) = \mu_0 t + \eta t^2.

Variation de parallaxe

La variation de parallaxe vaut: \dot{\varphi}= -\frac{1}{\rho^2} \frac{d\rho}{dt} = -\frac{1}{\rho^2} V_r= - \varphi^2 V_r . Comme elle est du deuxième ordre en \varphi, elle n'est en général pas prise en compte.

Changement de coordonnées
acceleration_perspective.png
Définition de \theta

Etoile

Auteur: Nathan Hara & Jacques Laskar

Etoile

L'ajustement des paramètres orbitaux permet de connaître \mu = G(m+M) ou bien \mu \sin i dans le cas des vitesses radiales. Il est impossible de distinguer les masses m etM séparément a priori. Cependant, on peut mesurer la masse de l'étoile de sorte à lever l'indetermination.

La modélisation des étoiles permet de distinguer les effets sur le spectre de la variation de leur flux lumineux de la présence de compagnons planétaires. Ces variations sont modélisées par des variables aléatoires suivant une certaine loi de probabilité, dont l'amplitude varie de plusieurs ordres de grandeur selon le type d'étoile. Plus l'étoile est active, plus l'amplitude du mouvement dû à la planète doit être grande pour distinguer la planète du bruit. En particulier certains types d'étoiles sont trop actives pour pouvoir détecter des potentielles super-Terres compagnon.

La description physique des étoiles est complexe car de nombreux phénomènes, tous interdépendants, ont lieu: convection, radiation, magnétisme... Les modèles utilisés en détection par vitesses radiales comprennent trois phénomènes

L'impact de ces effets sur les mesures n'est pas simple à quantifier. Selon le type d'étoile et les instants d'observations, l'effet peut être très variable. Certains auteurs estiment les incertitudes par des simulations numérique, d'autres par des modèles théoriques. Nous donnons une description qualitative de ces phénomènes et une modélisation possible, mais il faut garder à l'esprit que c'est un sujet de recherche ouvert. Dans le cas des vitesses radiales, ces bruits sont classiquement modélisées par un processus stochastique d'une certaine densité spectrale de puissance, notion importante en statistique, qui est définie dans cette page.


Masse de l'étoile

La mesure de la masse de l'étoile peut se faire de deux manières

Dans le premier cas, si la distance à l'étoile est connue (par exemple par mesure de parallaxe), on peut mesurer sa luminosité intrinsèque L (si on ne connaît pas la distance on ne mesure évidemment que la luminosité apparente). Par son spectre, on peut mesurer sa température effective T_{eff}. Des modèles d'intérieurs stellaires permettent ensuite d'évaluer la masse. Cette estimation peut être rafinée avec un modèle d'atmosphère stellaire. On peut alors avoir la gravité à la surface de l'étoile g. Comme L \approx T_{eff}^4 R^2 et g \approx \frac{M}{R^2}, on peut avoir une estimation de la masse.

Dans le cas des étoiles binaires (systèmes de deux étoiles), le spectre présente des raies des deux étoiles. Le mouvement de ces raies se fait à la même fréquence, mais dans des directions opposées (lorsqu'une étoile approche l'autre s'éloigne). La période de ces mouvements est liée à la masse du système par l'équation de Kepler. L'amplitude relative de ces mouvements permet de déterminer la masse des deux étoiles séparément. Comme dans le cas de la détermination des orbites des planètes, la masse n'est connue qu'à un faceteur \sin i près. Pour lever cette indetermination, il faut déterminer l'inclinaison de l'orbite par rapport à l'observateur i. Si on observe des eclipses (une binaire passe devant l'autre), i \approx 0. Si le système n'est pas dans cette configuration, on peut séparer angulairement les deux étoiles par des techniques d'interférométrie.


Processus stochastique et Densité spectrale de puissance

Processus stochastique

La notion de densité spectrale de puissance (DSP) n'est pas simple à définir, cependant très utilisée dans la littérature de traitement du signal. Nous donnons une définition mathématique pour qu'il n'y ait pas d'ambiguités mais compte tenu de la sophistication des notions introduites, le lecteur pourra se référer à la description qualitative suivante.

La densité spectrale de puissance est une propriété relative à plusieurs variables aléatoires. Les familles de variables aléatoires peuvent par exemple représenter des mesures sur lesquelles on a une incertitude. A chaque instant de mesure on associe une variable alétoire qui a une certaine densité de probabilité. En physique théorique ou en économie, on rencontre des processus stochastiques continus - typiquement le mouvement brownien, qui représente des mouvements d'atomes ou des fluctuations de prix. Formellement, un processus stochastique est une famille de variables aléatoires indexées par un ensemble totalement ordonné T, toutes définies sur le même espace de probabilité (\forall t \in T, X_t \in (\Omega,\mathcal{F},\mathbb{P}) ). Dans ce cours on aura seulement besoin de T=\mathbb{R} ou \mathbb{N}. On note \mathbb{E} l'espérance mathématique.

Dans le cas général, la densité de probabilité de la variable aléatoire X_{t} (pour t \in \mathbb{R}) dépend des valeurs prises à d'autres "instants" par les autres variables aléatoires. En particulier on peut s'intéresser à une éventuelle probabilité de périodicité. Par exemple si on modélise un nombre de ventes de vêtement par jour, on verra des ventes plus importantes au moment des soldes (à peu près tous les six mois). La densité spectrale de puissance est un outil qui permet de visualiser ce genre de périodicité. Dans la section suivante, on voit que si on prend une famille de variables aléatoires certaines, c'est à dire que X_t vaut une certaine valeur réelle x(t) avec la probabilité 1, la DSP en une fréquence \omega est égale à |\hat{x}(\omega)|^2, où \hat{x} est la transformée de Fourier de x. Si maintenant X_t est une variable alétoire, la DSP sera la "transformée de Fourier typique" d'une réalisation de X_t.

Pour définir cette notion mathématiquement, on doit d'abord introduire les notions de convergences et intégrales en moyenne quadratique. Pour plus de précision le lecteur peut se référer au cours de Timo Koski à KTH.

Intégrale en moyenne quadratique (Mean Square Integral)

Rappelons d'abord que si Y_1, ..., Y_n sont des variables aléatoires et \phi: \mathbb{R}^n\rightarrow \mathbb{R}^m une fonction mesurable alors \phi(Y_1,...,Y_n) est une variable aléatoire. En particulier, si \lambda est un scalaire, \lambda Y_1 et Y_1 + Y_2 +...+Y_n sont des variables aléatoires. Pour un rappel sur les variables aléatoires, voir le cours de Didier Pelat.

Soit (\Omega,\mathcal{F},\mathbb{P}) un espace de probabilités, on dit que la suite de variables aléatoires (Y_n)_{n \in \mathbb{N}} telle que E\{Y_n\} < + \infty, définies sur cet espace converge en moyenne quadratique si et seulement si:

\lim\limits_{n \rightarrow \infty} \mathbb{E}\{|Y_n-Y |^2\}=0

Soit (X_t)_{\mathbf{t \in \mathbb{R}}} un processus stochastique continu (T=\mathbb{R}) tel que chacune des variables aléatoires X_t a une espérance finie (E\{X_t\} < + \infty). L'intégrale en moyenne quadratique du processus (X_t)_{t \in T} sur l'intervalle [a,b] est définie comme la limite en moyenne quadratique (lorsqu'elle existe) de:

\sum\limits_{k=1}^n X_{t_k} (t_k-t_{k-1}})

Pour a=t_0 < t_1 <... <t_n=b et \lim\limts_{n\rightarrow\infty}\max (t_k-t_{k-1}) = 0. On la note alors \int_b^b X_t dt.

On définit alors la densité spectrale de puissance comme:

P_X(\omega) = \lim\limits_{T\rightarrow \infty} \mathbb{E} \{|\hat{x}_T(\omega)|^2\}

\hat{x}_T(\omega) = \frac{1}{\sqrt{T}} \int_0^T X_t e^{-i \omega t} dt

Cette définition un peu complexe peut être vue comme une généralisation de la transformée de Fourier à des processus stochastiques. En effet, lorsque le processus X_t est telle que X_t = x(t) avec une probabilité 1, l'intégrale en moyenne quadratique se comporte comme l'intérale de Riemann, alors P(\omega) est le carré du module de la transformée de Fourier de la fonction réelle d'une variable réelle x(t). Dans le cas où les X_t sont aléatoire, P est le carré de la transformée de Fourier "en moyenne" des réalisations de X_t. Par exemple si X_t modélise une tension mesurée au cours du temps dans une expérience d'électronique réalisée un grand nombre de fois, donnant n profils de tension u_k(t) à l'expérience k (des réalisations du processus stochastique U_t), la moyenne des carrés du module des transformées de Fourier des u_k(t) notée \tilde{P}_n(\omega) sera approximativement égal à P_U(\omega). Si le nombre d'expérience n tend vers l'infini \tilde{P_n} \rightarrow P_U en norme 2.

Dans le cas d'un processus stationnaire discret (T= \mathbb{Z}), on peut directement définir \hat{x}_n(\omega)=\frac{1}{\sqrt{2n+1}} \sum\limits_{k=-n}^n X_ke^{-i\omega t_k} et P_X(\omega) = \lim\limits_{n\rightarrow \infty} \mathbb{E} \{|\hat{x}_n(\omega)|^2\}.

Processus stationnaires au sens large

La densité spectrale de puissance a une définition plus simple lorsque le processus est stationnaire, c'est à dire lorsque le processus (X_t)_{t\in T} vérifié:

Les processus stationnaires modélisent des phénomènes qui ont une certaine invariance dans le temps, en particulier la covariance ne dépend pas de t de manière absolue, mais de manière relative à un autre instant. Dans ce cas, la densité spectrale de puissance est égale au carré du module de la transformée de Fourier de la fonction R. L'équivalence avec la définition de la densité spectrale de puissance donnée plus haut est établie par le théorème de Wiener-Khinchin.


Granulation

Le phénomène de granulation est lié à la convection du gaz dans l'étoile. La lumière rayonnée par le gaz chaud remontant à la surface va vers l'observateur, la longueur d'onde reçue est donc décalée vers le bleu. En rayonnant, le gaz se refroidit, puis repart vers le centre de l'étoile. Etant moins chaud, il émet moins de lumière, si bien que la lumière est globalement décalée vers le bleu. Ce phénomène est variable dans le temps, donc le décalage vers le bleu aussi. Cette variation peut apparaître dans le spectre et créer des fréquences parasites. La nature aléatoire du phénomène fait que même après ajustement, il reste un bruit résiduel. Pour une étoile de type solaire, il est de l'ordre de 0.5 - 1 m/s sur une observation.

La granulation est en général modélisée par un processus stochastique dits de bruits en créneaui (popcorn noise ou burst noise en anglais). Il s'agit de processus stochastiques pouvant prendre deux valeurs, par exemple -1 ou 1 avec une probabilité de changement suivant une loi de Poisson (loi exponentielle). Si à t la valeur passe de 1 à -1, la densité de probabilité pour que la valeur passe à 1 à t+ \Delta t est e^{-\frac{t}{\tau}}\tau est un réel positif. Pour les vitesses radiales, la densité spectrale de puissance de ces bruits peut être modélisée par::

P(\nu) = \frac{4 \sigma ^2 \tau}{1+(2\pi\nu\tau)^2}}

Cette modélisation, due à Harvey (1985) a depuis été revue et d'autres densités spectrales de puissances ont été proposée à partir de simulations 3d de convection au sein d'une étoile. En pratique, le bruit dû à la granulation apparaitra comme un signal périodique de l'ordre de cinq minutes. Cependant, on observe aussi des phénomènes appelés meso-granulation et super-granulation sur des échelles de temps plus longues. La contribution totale de ces bruits est:

P(\nu) = \frac{4 \sigma_g ^2 \tau_g}{1+(2\pi\nu\tau_g)^2}}+\frac{4 \sigma_{mg} ^2 \tau_{mg}}{1+(2\pi\nu\tau_{mg})^2}}+\frac{4 \sigma_{sg} ^2 \tau_{sg}}{1+(2\pi\nu\tau_{sg})^2}}

Où les indices g, mg et sg se réfèrent respectivement à la granulation, la méso granulation et la super-granulation. En anticipant un peu sur le troisième chapitre, lorsque ces bruits sont pris en compte, les valeurs des \sigma et \tau sont ajustés sur le spectre de puissance du signal.


Activité magnétique

La formation d'arcs de champ magnétique à la surface de l'étoile inhibe le mouvement des particules, donc réduit la température et provoque donc des tâches sombres. Cet effet à des effets à court termes (à la fréquence de rotation de l'étoile \approx 1 mois), et à plus long terme à travers des cycles d'activité magnétique.

A court trerme, la tache introduit une dissymétrie entre la partie de l'étoile tournant vers l'observateur, et la partie s'en éloignant, ce qui engendre un décalage du spectre mesuré. D'autre part, la tache engendre un déplacement du photocentre de l'étoile périodique, pouvant être confondu avec la présence d'une planète. Pour éviter ces confusions, on estime la période de rotation de l'étoile par spectroscopie, et on ajuste des sinusoïdes à cette période et ses premières harmoniques.

L'activité magnétique peut se mesurer à travers divers indicateurs, dont on analyse les corrélations.

Toujours selon le modèle de Harvey (1985), la densité spectrale de puissance du bruit de vitesse radiale induit par une tache solaire est:

P(\nu) = \frac{4 \sigma_{am} ^2 \tau_{am}}{1+(2\pi\nu\tau_{am})^2}}

Effet de la rotation de l'étoile sur le spectre
star.png
La lumière provenant de la moitié de l'étoile ayant un mouvement vers l'observateur est décalé vers les hautes fréquences (vers le bleu). L'autre moitié est décalée vers les basses fréquences (vers le rouge). Dans l'hypothèse où l'étoile est sphérique, et a une luminosité identique partout sur sa surface, le décalage vers le rouge et celui vers le bleu ne fait qu'élargir les raies spectrales. Si une tache est présente, ici sur la partie bleue, la symétrie est brisée et le déficit de lumière entraine un décalage du spectre vers le rouge.

Oscillations radiales (vitesses radiales)

Des inhomogénéités de densité dues aux mouvements convectifs font que des ondes mécaniques se propagent au sein des étoiles. Certaines de ces ondes sont radiales, ce qui provoque un mouvement d'ensemble de la photosphère qui a une signature sur le décalage du spectre mesuré. L'étude de ces ondes est un domaine de la physique stellaire appelé "astérosismologie". Etant donné que la théorie est accessible au niveau licence, nous en donnons des principes généraux.

La théorie procède comme suit: on écrit localement 1) l'équation du mouvement linéarisée au premier ordre au voisinage d'un état d'équilibre, 2) la conservation de la masse ou équation de continuité, 3) l'équation de Poisson, liant le potentiel gravitationnel et la densité, 4) Le premier principe de la thermodynamique. On néglige l'effet du champ magnétique. En général, on fait l'hypothèse que le terme de transfert thermique dans le 1er principe est nul.


Perturbations atmosphériques

Vitesses radiales

L'atmosphère peut influencer la mesure de vitesses radiales de deux manières:

La présence de lignes spectrales d'émission ou d'absorption est difficile à corriger. C'est pourquoi on ne considère que des plages de fréquences où l'intensité des raies atmosphériques est inférieure à 1/10000 de l'intensité de la cible. De plus, la réponse de l'atmosphère dépend de la longueur d'onde. Le spectre obtenu est pondéré de sorte à corriger ces inhomogénéités.

Astrométrie

Avant de parvenir au télescope, la lumière issue de l'étoile traverse l'atmosphère. Les turbulences aux hautes altitudes créent des inhomogénéités de densité, donc d'indice optique, qui distordent le front d'onde de la lumière pénétrant dans l'atmosphère. La modélisation classique de ce phénomène passe par l'introduction de "Structure functions" qui modélisent la densité de probabilité des champs de vitesses, densité etc.

Afin de ne pas surcharger le cours, nous ne donnerons qu'un modèle très simple de ce phénomène. Les mouvements de turbulence forment des "cellules" de composition homogène et d'une taille typique d_0. Vue du dessus, l'atmosphère se comporte approximativement comme un tableau de pixels de taille d_0 dont chaque cellule introduit une déviation angulaire du faisceau incident. Cette déviation est de l'ordre de \approx \frac{\lambda}{d_0} . Dans le cas limite où une cellule a un indice 0 et les cellules avoisinantes ont un indice 1 (sont opaques), on retrouve l'ordre de grandeur de la diffraction. Les fronts d'ondes issus de ces différents pixels arrivent au télescope avec des angles différents, donc donnent chacun une image différente appelé "speckle". L'union de ces speckle forme une tache lumineuse élargie de taille environ égale à 1.22\frac{\lambda}{d_0}.


Récapitulation

Les effets expliqués précédemment sont pour la plupart périodiques, donc peuvent être confondus avec le signal d'une planète. Le tableau suivant récapitule ces effets, leurs amplitudes et périodes typiques pour des étoiles de type solaire.

Effets physiques
EffetDescriptionAmplitude (vitesse radiale)Amplitude (astrométrie)Echelle de temps
Mouvement des planètesLe mouvement des planètes autour de l'étoile engendre un mouvement périodique1 cm/s - 200 m/sTerre: 0.3, 0.03 \muas Jupiter: 500, 20 \muas à 1 et 10 parsec resp.de un jour à plusieurs centaines d'années
Mouvement propreMouvement rectiligne uniformeDizaines de kilomètres par seconde10 - 1000 mas pour les étoiles observablesMouvement non périodique
TachesLa présence de taches sombres ou lumineuses dues à l'activité magnétique provoque une disymétris entre la luminosité de la partie bleue et la partie rouge de l'étoile, engendrant un décalage du spectre ou du photocentre.1 m/sAvec ces trois effets, 0.5 - 10 \muUAPériode de rotation de l'étoile (quelques jours)
Activité magnétique (long terme)Le nombre de tâche à la surface de l'étoile peut varier de quelques unes à plusieurs centaines. Par exemple le soleil a une périodicité de 11 ans. L'effet précédent est modulé par ces variations à long terme.10 m/s1 - 10 ans
Granulation Le mouvement convectif à l'intérieur de l'étoile provoque un mouvement du gaz dans la photosphère0.5 - 1 m/sGranulation: quelques minutes, mesogranulation:
Oscillations radiales (p-modes)La propagations d'ondes acoustiques dans le manteau de l'étoile entraîne une oscillation de celui-ci0.5 - 1 m/sinconnu 5 - 10 minutes
Système multipleLa présence d'autres étoiles orbitant autour de l'étoile cible engendre un mouvement décrit par les mêmes équations que celles utilisées pour les planètes. Les autres étoiles étant beaucoup plus massives que des planètes, l'effet est plus important.1 - 30 km/s0.1 - 1 as/an10 - 100 ans
effets observationnels
EffetDescriptionAmplitude (vitesse radiale)Amplitude (astrométrie)Echelle de temps
Mouvement de l'observateur dans le RBSSComme l'observateur est en mouvement dans un référentiel galiléen,30 km/s (après soustraction, on a une erreur\approx 0.5 m/s à cause des incertitudes sur la rotation de la Terre et les éphémérides)0.01 - 0.1 as/anUne année
Perturbations atmosphériquesLa présence de raies spectrales atmosphériques peut perturber les observations par vitesses radiale, et les turbulences dévient les fronts d'ondes, engendrant un déplacement apparent des sources.0.5 m/s1 masQuelques minutes

Instrumentation & Observations


Objectifs

Jusqu'à présent, on a modélisé la lumière qui parvient à un observateur théorique situé au voisinage de la Terre. Dans cette section, on présentera l'aspect concret de l'observation, en particulier les instruments. En astrométrie on mesure la position sur le detecteur CCD sur le plan focal du télescope, pour les vitesses radiales on utilise un spectrographe dont l'entrée est située au point focal du télescope . Il est essentiel de bien comprendre le fonctionnement des instruments pour des raisons évidentes: ils constituent notre seule source d'information et leur étude permet de mieux modéliser les mesures, donc d'exploiter au mieux les données.

Dans le cas de l'astrométrie comme celui des vitesses radiales, deux conditions sont nécessaires pour obtenir des mesures suffisamment significatives:

En astrométrie comme en détection par vitesses radiales on place un dispositif sur le plan focal d'un télescope, respectivement des capteurs CCD et l'entrée d'un spectromètre (ou spectrographe). C'est pourquoi les principes généraux des télescopes seront présentés. On évoquera le fonctionnement des spectrographes utilisés pour les détections par mesures de vitesses radiales.

Spectrographe ELODIE
elodie2.jpg
Cet appareil a permis la détection de 51 Pegasi b en 1995 par Michel Mayor et Didier Queloz à l'Observatoire de Haute Provence
Crédit : Observatoire de Haute Provence

Télescope

Un télescope est un appareil permettant de recueillir un rayonnement eléctromagnétique. Pour observer un rayonneme nt dans le visible ou dans l'infrarouge proche, on utilise des télescopes à miroir parabolique. Pour éviter les ambiguités, on définira le plan focal comme le plan perpendiculaire à l'axe optique (ici l'axe de symétrie du télescope) passant par le foyer, et on fait l'hypothèse que les rayons reçus font un angle faible avec l'axe optique. Dans ces conditions, La relation donnant la distance au point focal de l'image d'un rayon arrivant avec un angle \alpha sur le plan focal est en première approximation FF_1 \approx f\tan \alpha \approx f \alpha, où f est la distance focale. Pour les angles faibles, on peut travailler avec une lentille équivalente au télescope, de même diamètre et distance focale. On va introduire trois notions de bases sur les télescopes: le champ, la résolution angulaire et la vitesse d'acquisition.

Le champ est la portion du ciel observée par le détecteur du télescope. Comme le détecteur est au plan focal, il est égal à \tan \frac{s}{f} \approx \frac{s}{f}

La résolution angulaireest l'angle minimal entre deux sources permettant de les séparer par le système de détection. Cette définition est vague, et Supposons qu'une source ponctuelle émettant à une longueur d'onde \lambda soit placée en un point du plan focal P. A cause du phénomène de diffraction, la lumière ne sera pas émise selon une direction unique, mais son énergie sera répartie sur certains angles centrés sur \alpha = \frac{FP}{f}. Comme la lumière suit le même trajet dans les deux sens, ce détecteur reçoit de la lumière provenant de ces angles.

Le rapport du diamètre et de la distance focale du télescope donne la "vitesse" de l'instrument. En effet, considérons une source circulaire de taille angulaire \alpha, son image sur le plan focal est un cercle d'aire 4\pi(f\alpha)^2. L'intensité observée est proportionnel à l'aire du télescope, donc l'énergie par unité de temps reçue est proportionnelle à \left(\frac{d}{f}\right)^2. On définit l'ouverture du télescope par R = \frac{f}{d} Le rapport signal sur bruit des mesures de CCD est égal à \frac{1}{\mu \Delta t}\mu est le nombre moyen d'électron par unité de temps et \Delta t est le temps d'intégration (voir Bruit de photon). On peut calculer le temps d'intégration minimal pour obtenir un certain signal sur bruit compte tenu de l'ouverture du télescope, de la taille de la source et de son intensité. Plus l'aire et grande, plus la distance focale est petite, et plus l'instrument collecte rapidement le nombre de photons requis.

Cependant, lorsque l'ouverture augmente, la résolution angulaire diminue.

Miroir parabolique
parabole.png
Les rayons perpendiculaires à l'axe de symétrie d'une parabole parviennent au point focal F.Ceux qui arrivent avec un certain angle arrivent légèrement décalés.

CCD

Un détecteur CCD est composé de trois partie: des électrodes en silicium, un isolant en SiO_2 et une jonction de semiconducteurs NP. Les électrodes en polysilicium sont reliées périodoquement par un fil conducteur (toutes les trois électrodes sur la figure) de sorte à créer un profil de potentiel électrique alternant puits et régions plates. Le principe d'un capteur CCD est le suivant (voir figure)

Le contrôle de l'erreur induite par la CCD est primordial et peut s'avérer très complexe. Nous ne rentrerons pas dans ces considérations.

Schéma de principe d'un capteur CCD
ccd.png

Bruit de photon

Le bruit de photon est une limitation fondammentale en astronomie car il est dû à la nature de l'émission de la lumière. En effet, les instants d'émission de deux photons sont indépendants les uns des autres.On peut montrer mathématiquement qu'une suite d'évènement indépendants, sans mémoire et stationnaire est nécessairement un flux de Poisson. Dans notre cas, si on note T le temps d'attente entre deux émission de photon, la probabilité que T soit supérieure à t+s sachant que T>s est e^{-\mu t}\mu est une constante.

Cette constante a une interprétation physique: plus elle est grande, plus e^{-\mu t} diminue rapidement à t donné, c'est à dire plus la probabilité que T soit long diminue. On peut montrer \mu est le nombre d'évènement par unité de temps moyen, proportionnelle à l'intensité. Rappelons que le détecteur capte des photons pendant le temps d'intégration \Delta t. Le nombre de photons reçus N pendant ce temps est une variable aléatoire suivant la loi:

\text{Pr}\{N=n\} = \frac{\mu \Delta t}{n!} e^{-\mu \Delta t}

Qui est appelée loi de Poisson. La moyenne et la variance d'une telle loi sont égales et valent \mu \Delta t. En conséquence, l'écart-type vaut \sqrt{\mu \Delta t} donc le rapport signal sur bruit (Signal-to-Noise Ratio) est:

SNR = \frac{\text{ecart-type}}{moyenne} = \frac{\sqrt{\mu \Delta t}}{\mu \Delta t} = \frac{1}{\sqrt{\mu \Delta t}}


Exercices

Auteur: Nathan Hara

exerciceMagnitude et temps d'observation

Difficulté : ☆☆  

Question 1)

Au deuxième siècle avant J.-C., l'astronome Hipparque a classé cinquante étoile par ordre de brillance en 6 catégories, les plus brillantes occupant la première. L'échelle de magniture apparente moderne est sous la forme m = -2.5 \log_{10} \frac{F}{F_0} F est le flux lumineux reçu et un flux de référence. Le choix de 2.5 et F_0 = 3.52 \times 10^{-23} Wm^{-2} Hz^{-1} fait que les étoiles de classe 1 d'Hipparque aient une magnitude comprise entre 0 et 1, les classes 2 on une magnitude entre 1 et 2 etc. De ce fait, il semble naturel que les objets les moins lumineux visibles à l'oeil nu soient environ de magnitude 6. On considère un télescope de diamètre D, on suppose qu'on observe dans le visible \Delta \lambda = [400,800] nm, et que le flux lumineux reçu ne dépend pas de la longueur d'onde sur cette plage.

  1. Sachant qu'un photon a une énergie h \frac{c}{\lambda}\lambda est la longueur d'onde et c la vitesse de la lumière, montrer que le flux de photon reçus \mu (photons par seconde) est lié au flux F par \mu = \pi \frac{D^2}{4} \frac{\Delta \lambda}{hc}  F
  2. Donner l'expression du temps d'intégration pour obtenir un rapport signal sur bruit r en fonction de la magnitude observée, de D et \Delta \lambda
  3. Le bruit de photon est il plus grand pour les étoiles peu lumineuses ou très lumineuses ?


Effet Doppler

On considère une source d'ondes et un observateur. Selon leur vitesse relative, la fréquence reçue par l'observateur varie: c'est ce qu'on appelle l'effet Doppler. Dans le cadre de la physique classique et d'une onde harmonique (purement sinusoidale), on peut le calculer simplement. En effet, notons x la distance entre la source et l'observateur, c la vitesse de l'onde et. Par définition d'une onde harmonique de pulsation \omega et d'amplitude A, l'amplitude mesurée à x et t vaut

A\cos \left( \omega\left(t-\frac{x}{c}\right) + \phi\right)

\phi donne en particulier la phase en t=x=0. Si la distance x varie avec le temps selon x=x_0+vt, alors en x et t on mesure

A\cos \left( \omega\left(1-\frac{v}{c}\right)t - \omega\frac{x_0}{c} +  \phi\right) = A\cos \left( \omega't + \phi'\right)

Donc pour l'observateur, tout se passe comme s'il recevait une onde de pulsation \omega' = \omega \left(1-\frac{v}{c} \right) ou de longueur d'onde \lambda' =   \frac{1}{1-\frac{v}{c} } \lambda \approx \left(1+\frac{v}{c} \right)\lambda et de phase \phi' =- \omega\frac{x_0}{c} +  \phi.

Cependant, lorsque c est la vitesse de la lumière, la relativité générale donne une description beaucoup plus précise du phénomène. Nous ne présenterons pas le calcul menant à l'expression de l'effet Doppler dans ce cadre mais en donnons l'expression:

\lambda' = \lambda \frac{1 + \frac{v}{c} \cos \theta}{\sqrt{1-\frac{v^2}{c^2}}}

\theta est l'angle entre la direction de la vitesse relative et la ligne de visée observateur-source. Remarquons que lorsque \theta tend vers \pi/2 et v/c tend vers 0, l'expression tend vers l'expression classique.


Spectrographe

L'observation des vitesses radiales nécessite de mesurer des longueurs d'onde très précisément, pour cela on utilise des spectrographe. Les équipes américaines et européennes utilisent des appareils différents, mais dans les deux cas ce sont des spectrographes d'échelle. Le principe d'un tel instrument est d'observer simultanément plusieurs ordres élevés de diffraction à l'aide de deux diffractions successives. La lumière est d'abord diffractée par un premier réseau. Un dispositif, appelé "echelle grating" est placé à un certain angle (blazing angle) du premier réseau de sorte à recevoir des ordres élevés de la première diffraction, qui sont diffractés à nouveau.

Ce dispositif permet "d'étaler" le spectre de sorte qu'une rangée de détecteurs CCD reçoit des longueurs d'ondes très proches, ce qui permet une haute résolution spectrale. En contrepartie, l'énergie est elle aussi répartie, ce qui augmente le temps d'intégration nécessaire pour recevoir suffisamment de lumière pour obtenir un certain rapport signal sur bruit.

D'une mesure à l'autre, à cause de variations internes à l'instrument (température, pression), une longueur d'onde donnée peut se décaler. Comme les mesures doivent pouvoir être comparées entre elles; ce problème doit être résolu efficacement: il faut étalonner l'instrument. Sur ce point, les instruments européens et américains diffèrent. Pour les premiers: ELODIE, CORALIE, HARPS, HARPS-N, l'étalonnage se fait en observant simultanément l'étoile cible est une source dont le spectre est connu. ELODIE observe le ciel, HARPS une lampe thorium-argon calibrée et HARPS-N utilise deux calibrations: un spectre de Fabry-Perot et un "laser frequency comb" (un laser dont le spectre est constitué de raies régulièrement espacées). Les instruments américains font passer la lumière par une cavité contenant de l'iode, dont la position des raies d'absorption est connue. Dans les deux cas on peut comparer Les raies du spectre de référence et celles de l'étoile observée. Si leur déplacement est corrélé (elles se décalent simultanément), il est dû à l'instrument.

La résolution spectrale de ces spectrographes, c'est à dire le rapport R=\frac{\lambda}{\delta \lambda} d'une longeur d'onde \lambda et de la sa variation détectable par le dispositi f \delta \lambda est de l'ordre de 100000. Des simulations numériques (Hatzes & Cochran 1992) ont montré que l'écart type sur la mesure finale de vitesse radiale \sigma_{rv} vérifie:

\sigma_{rv} = k I^{-\frac{1}{2}} {\Lambda}^{-\frac{1}{2}} R^{-1}

I est l'intensité reçue, \Lambda est la plage de fréquences considérées et k est une constante de proportionnalité. Comme certaines longueurs d'ondes jugées contaminées peuvent être exclues de certaines mesures, cette valeur varie d'une mesure à l'autre.

Principe du spectrographe d'échelle
Echelle_Principle.png
Le rayon incident est d'abord diffracté sur une grille standard (std. grating), puis à nouveau diffracté par le réseau d'échelle. Les trois spectres finalement obtenus sont reçus par des capteurs CCD.
Crédit : "Echelle Principle" by Boris Považay (Cardiff University) - Own work. Licensed under CC BY-SA 2.5 via Wikimedia Commons

Cross-correlation Function

Nous avons expliqué que la mesure des vitesses radiales se fait par mesure du déplacement du spectre. Cependant, nous n'avons pas précisé comment ce déplacement était mesuré. Il y a a priori beaucoup d'estimateurs classiques. La méthode majoritairement adoptée repose sur une "cross correlation function" (CCF) ou fonction de corrélation.

Les étoiles ont certains types de spectres que l'on sait reconnaître. Pour une étoile donnée, on définit un "masque" M(\lambda) valant 1 pour \lambda correspondant à une raie d'absorption de l'étoile et 0 ailleurs. Le spectre de l'étoile observée I(\lambda) est multiplié par ce masque décalé d'une valeur \delta \lambda et on mesure CCF(\delta \lambda) = \int_{\lambda_0+\delta \lambda}^{\lambda_1+\delta \lambda} M(\lambda + \delta \lambda) I(\lambda) d \lambda. Où \lambda_0 et \lambda_1 désignent les bornes inférieures et supérieures du spectre observé. Ensuite, une fonction gaussienne Ae^{\frac{(\lambda- \mu_{\lambda})^2}{\sigma^2}} est ajustée sur la CCF. La valeur \mu_\lambda correspondant au minimum de la fonction ajustée est prise comme valeur moyenne du déplacement. L'analyse consiste ensuite à comparer les \mu_\lambda issus d'observations différentes.

La CCF n'est elle même pas symétrique. Ses propriétés d'assymétrie sont analysées, car elles sont significatives d'effets physiques.


Réduction - Problème inverse


Objectif

La modélisation physique du phénomène nous a permis d'obtenir un modèle f(\theta,T)\theta \in \mathbb{R}^n sont les paramètres du modèle et T \in \mathbb{R}^m sont les instants d'observation. De nombreuses sources d'erreurs ont aussi été listées. On se pose maintenant la question suivante: comment estimer les paramètres du modèle compte tenu des observations ?

Après avoir listé diverses sources de signal et de bruits de l'émission de la lumière à la valeur donnée par le déteteur, nous allons maintenant donner une expression finale au modèle. Cette expression n'est pas universelle, et selon l'étoile observée, la précision recherchée, d'autres formulations peuvent être préférables.

Après avoir établi ce modèle, on donnera quelques principes d'analyse statistique et des moyens algorithmiques pour estimer les paramètres du modèle. On verra en particulier que l'analyse "dans le domaine fréquenciel" est particulièrement importante.


Modèle final

Le modèle comportera une partie déterministe et une partie aléatoire. Pour l'astrométrie, la position x(t) = \alpha(t) \cos \delta(t) y(t)) = \delta(t) sur la sphère céleste est

\begin{array}{ccc} x(t) = x_0 + \mu_x t + \eta_x t^2 + \sum\limits_{k=1}^{n_p} B_j X_j(t) + G_j Y_j(t) + \varphi \Pi_x(t)  + S_x(t) + \Delta x_{atm}+  \epsilon_{S_x} + \epsilon_{x,atm} + \epsilon_x\\ y(t)   = y_0 + \mu_y t + \eta_y t^2 + \sum\limits_{k=1}^{n_p}  A_j X_j(t) + F_j Y_j(t) + \varphi \Pi_y(t)  + S_y(t) + \Delta y_{atm} + \epsilon_{S_y}+ \epsilon_{y,atm} + \epsilon_y \end{array}

(x_0,y_0) est la position initiale de l'étoile, \mu_x, \mu_y sont les composantes du mouvement propre \eta_x, \eta_y sont des termes d'accélération de perspective, B_j, G_j, A_j, F_j sont les constantes de Thiele-Innes de la planète j, X_j et Y_j sont ses coordonnées sur son plan orbital, \varphi est la parallaxe, \Pi_x, \Pi_y sont les coefficients parametrant le mouvement de la Terre, Les \epsilon sont les bruits résiduels modélisés par des bruits gaussiens.: \epsilon_{S_x}, \epsilon_{S_y} sont les bruits stellaires, \epsilon_{x,atm}, \epsilon_{y,atm} sont les bruits atmosphériques et \epsilon_x, \epsilon_y représentent des bruits instrumentaux.

V(t) = \dot{\overrightarrow{OT}} + \mu_z + K\left( \cos(v+\omega) +  \cos \omega \right) +   S_z(t) + z_{atm}(t)+ \epsilon_{S} + \epsilon_{mes}

\dot{\overrightarrow{OT} est la vitesse de l'observateur dans le référentiel barycentrique du système solaire, \mu_z est la composante du mouvement propre dans la direction radiale, S_z(t) est le signal stellaire dû à la granulation, aux oscillations et à l'activité, \epsilon_S est le bruit stellaire résiduel et \epsilon_{mes} le bruit associé à la mesure.

Dans les deux cas, les techniques de réduction de données visent à trouver des paramètres qui sont "plausibles", en l'occurrence, qui reproduisent les observations.


Traitement statistique

Rappelons qu'une variable aléatoire peut être vue comme un programme informatique qui délivre des valeurs suivant une certaine distribution de probabilité lorsqu'on lui demande. Le problème que nous posons maintenant est équivalent au suivant. Supposons qu'un ordinateur ait en mémoire des paramètres \theta \in \mathbb{R}^p (nombre de planètes, leurs caractéristiques orbitales, la période de rotation de l'étoile etc.). S'il n'y avait pas de bruit, une mesure à l'instant t_k reviendrait à demander à l'ordinateur d'évaluer une fonction f(\theta,t_k). Nous connaissons t_k et f (c'est l'un des modèles de la page précédente), mais nous ne connaissons pas \theta. Notre but est de le déterminer à partir des mesures y_k = f (\theta,t_k). Ce principe est similaire à la résolution d'une énigme: quelqu'un connaît une information \theta et nous essayons de la deviner en posant une question. Dans le cas sans bruit, celui qui pose l'énigme ne nous induit pas en erreur, mais cela ne veut pas dire que la résolution est facile !

Exemple: on veut trouver les paramètres d'une fonction affine du temps f(a,b,t) = at+c (ici \theta = \left( \begin{array}{c} a \\c \end{array} \right) ). On évalue la valeur de f en t_1, on obtient y_1 = at_1+c : on a deux inconnues pour une équation, on ne peut pas résoudre. Si on a y_2 = at_2 + c, avec t_2 \neq t_1, alors on a a = \frac{y_2-y_1}{t_2-t_1} et c = y_1 - at_1 = y_2 - at_2.

Notre cas est plus compliqué. Les valeurs que nous obtenons sont y_k = f(\theta, t_k) + b_kb_k est la réalisation d'une variable aléatoire \epsilon_k. A l'appel numéro k du programme, l'ordinateur fait appel à un autre programme qui délivre une variable alétoire selon une certaine loi. En l'occurrence, nous supposons cette loi gaussienne. Si nous faisons m mesures, tout se passe comme si un programme principal évaluait la fonction f(\theta, t_k) et m programmes secondaires \epsilon_k, k=1..m retournent chacun une valeur b_k. Si nous pouvions remonter le temps et faire les mesures plusieurs fois aux mêmes instants, on aurait des des vecteurs de mesures y_1 = \left( \begin{array}{c} y_1 \\y_2 \\ \\y_m \end{array} \right) =  f(\theta,T) + b_1, puis y_2 = f(\theta,T) + b_2 etc. (notez qu'ici b_1 et b_2 sont des vecteurs.

Comme nous ne connaissons que la loi suivie par les variables \epsilon_k, ils nous est impossible de connaître les paramètres avec certitude. On leur attache une "erreur", qui quantifie l'incertitude que l'on a sur eux. En reprenant l'exemple précédent on mesure y_1 = at_1 + c +b_1 et y_2 =  at_2 + c +b_2. Si on estime a et c avec les mêmes formules, on fera une erreur \frac{\sqrt{\sigma_1^2 + \sigma_2^2}}{t_1-t_2} sur a et une erreur \sqrt{\left(\frac{t_1}{t_2-t_1} \sigma_2\left)^2 + \right((1-\frac{t_1}{t_2-t_1}) \sigma_1 \left)^2} sur c (admis).


Bruits

Dans le modèle f(\theta,T) + \epsilon, le symbole \epsilon désigne un bruit gaussien. Comme ils apparaissent constamment en détection de planètes extrasolaires et ailleurs, nous allons en donner quelques propriétés.

A une expérience donnée, \epsilon prendra une valeur b imprévisible. La probabilité que la valeur de b soit comprise entre b_1 et b_2 est \int_{b_1}^{b_2} f(x) dxf(x) est la densité de probabilité de \epsilon. Dire que \epsilon est un bruit gaussien veut dire que sa densité est de la forme f(x) = \frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x-\mu)^2}{\sigma^2}}\mu et \sigma sont des réels, qui sont égaux respectivement à la moyenne et à l'écart-type de \epsilon. On note souvent \epsilon \sim g(\mu, \sigma^2), qui signifie "\epsilon suit une loi gaussienne de moyenne \mu et de variance \sigma^2. Dans la plupart des cas, le bruit est de moyenne nulle (c'est le cas ici).

Dans le modèle, des bruits d'origines différentes s'additionnent. Sachant que le résidu de l'activité stellaire que nous n'avons pas ajusté \epsilon_S et le bruit de mesure \epsilon_{mes} suiven une certaine loi, quelle loi suivra \epsilon = \epsilon_{S} + \epsilon_{mes} ? Nous pouvons déjà dire que la moyenne de \epsilon sera égale à la somme des moyennes de \epsilon_S et \epsilon_{mes} car l'espérance est un opérateur linéaire. Peut-on dire plus ? Si ces bruits dépendaient l'un de l'autre, la réponse pourrait être complexe. En l'occurrence, la physique de l'étoile cible et les erreurs instrumentales sont totalement indépendantes. On peut montrer que dans ces conditions, la variance de \epsilon est égale à la somme des variances de \epsilon_S et \epsilon_{mes}. Nous pouvons même aller plus loin car la somme de deux variables gaussiennes indépendante est une variable gaussienne. En résumé, \epsilon \sim g\left(\mu_{S} +\mu_{mes}, \sigma_{S}^2+ \sigma_{mes}^2\right) en l'occurrence \mu_S et \mu_{mes} sont nulles.

Lorsqu'on dispose de plusieurs mesures, à l'expérience numéro k on a un certain bruit b_k réalisation d'une variable \epsilon_k de densité f_k. La plupart du temps, on fait l'hypothèse que les brutis \epsilon_k sont indépendants, c'est à dire que la probabilité d'obtenir le bruit b_k à l'expérience k ne dépend pas des valeurs prises aux expériences précédentes et suivantes. Lorsque ce n'est pas le cas on parle de bruits corrélés. Pour les caractériser, on utilise souvent leur densité spectrale de puissance. Un certain profil de densité spectrale correspond à une "couleur" du bruit.

A retenir: la somme de variables gaussienne indépendantes \epsilon = \sum\limits_{k=1}^n \epsilon_k\epsilon_k \sim g\left( \mu_k, \sigma_k^2) est une variable gaussienne suivant la loi g \left( \sum\limits_{k=1}^n \mu_k ,  \frac{1}{n} \sum\limits_{k=1}^n \sigma_k^2 \right).


Signification statistique

Il esiste plusieurs outils pour s'assurer qu'une détection possible n'est pas due au bruit. L'un des plus utilisé est le test de signification (significance en anglais), qui consiste à calculer la probabilité d'avoir le signal observé "au moins aussi grand" s'il n'y avait en réalité que du bruit. Par exemple, qupposons que l'on veuille mesurer une quantité a qui est perturbée par un bruit gaussien additif b de moyenne nulle et d'écart-type \sigma=1, donnant une mesure y = a+b.

Si il n'y avait en réalité pas de signal (a=0), les mesures seraient uniquement dues au bruit. On imagine deux cas de figures:

Ces valeurs ont une interprétation: si on réalisait exactement le même type de mesure alors qu'il n'y a pas de signal, on observerait |y| \geq 0.1 dans 81.8% des cas et |y| \geq 10 dans 2.06 \times 10^{-7} % des cas.Dans le premier cas, la probabilité d'avoir un signal aussi grand que celui que l'on a mesuré est grande. On ne peut pas assurer qu'un signal a été détecté. Par contre, dans le deuxième cas on serait dans un des deux cas sur un milliard où le signal serait dû au bruit. On peut alors dire qu'on a détecté un signal à 10 \;\sigma, car la valeur de l'écart-type du bruit est 1, sa moyenne est 0, donc on a \frac{y}{\sigma-0} = \frac{10}{1} = 10.

Détecter un signal "à 10 sigmas" est un luxe que l'on peut rarement se payer. Les détections sont annoncées plutôt pour des valeurs de 5 sigmas.

Remarque importante: on calcule la probabilité d'avoir les observations sachant qu'il n'y a pas de signal et non la probabilité d'avoir un signal sachant les observations qui est une quantité qui a davantage de sens. Le calcul de cette dernière quantité se fait dans le cadre du calcul bayésien, outil très puissant qui ne sera pas développé dans ce cours.


Exercices

Auteur: Nathan Hara

exerciceEspérance et variance de la moyenne empirique

Difficulté : ☆☆☆  

Question 1)

On rappelle que l'espérance et la variance d'une variable alétoire X de densité de probabilité f sont données par \mathbb{E}(X) = \int_{-\infty}^{+\infty} xf(x)dx et \text{Var}(X) = \mathbb{E}\left((X-\mathbb{E}(X))^2\right)= \int_{-\infty}^{+\infty} (x-\mathbb{E}(X))^2f(x)dx

  1. Soit X une variable aléatoire et a un réel. Montrer que \mathbb{E}(aX) = a \mathbb{E}(X) et \text{Var}(aX) = a^2 \text{Var}(X)
  2. Soient X et Y deux variables aléatoires indépendantes. Montrer que \mathbb{E}(X+Y) =  \mathbb{E}(X) + \mathbb{E}(Y).
  3. On définit la covariance par \text{Cov}(X,Y) = \mathbb{E}\{ (X-\mathbb{E}(X)) (Y-\mathbb{E}(Y))\}. Montrer que \text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y) + 2 \text{Cov}(X,Y)
  4. Nous allons maintenant voir un cas où la précision d'un estimateur est facilement calculable. On considère m mesures entachées de bruits gaussiens d'une quantité fixe K. Plus précisément, la mesure numéro j est modélisée par une variable aléatoire X_j = K + \epsilon_j\epsilon_j est un bruit gaussien de moyenne nulle et de variance \sigma^2. On suppose que les mesures sont indépendantes, ce qui implique en particulier que \text{Cov}(\epsilon_j,\epsilon_i) = 0 pour i \neq j. Pour obtenir une estimation de K, on fait la moyenne empirique des expériences, c'est à dire M = \frac{X_1 + X_2 +... X_m}{m}. Montrer que \mathbb{E}(M) = K  et \text{Var}(M) =  \frac{\sigma^2}{m}
  5. La précision de l'estimateur M augmente-t-elle avec le nombre de mesures ?


Loi du chi 2

Nous nous sommes toujours ramenés à des modèles du type: modèle déterministe + bruit gaussien. Afin de vérifier que les observations sont compatibles avec le modèle, on étudie les résidus, définis comme "les observation - le modèle ajusté".

La loi du \chi^2 est un outil commode pour étudier le comportement de plusieurs variables gaussiennes. Considérons d'abord une famille de m variables aléatoires gaussiennes indépendantes (\epsilon_k)_{k=1..m}, de moyenne nulle et de variance unité. On forme la quantité \chi^2_m= \epsilon_1^2 + \epsilon_2^2 +  ... + \epsilon_m^2 . Comme les \epsilon_k sont des variables aléatoires, les \epsilon_k^2 le sont aussi. La somme de variables alétoires étant toujours une variable alétoire, \chi^2_m suit une certaine loi de probabilité. Dans l'analogie avec un programme informatique, la variable alétoire \chi^2_m se comporte comme un programme qui appelle m programmes générant une variables gaussiennes, puis additionne leurs carrés. Elle est appelée loi du\chi^2 à m degrés de liberté. On peut montrer qu'en moyenne une variable gaussienne au carré \epsilon^2 a une moyenne de 1. En conséquence, \chi^2_m vaudra typiquement m.

Pourquoi cette loi serait utile pour notre cas ? Si le modèle est bien ajusté, les résidus doivent se comporter comme un bruit gaussien. En supposant que les erreurs sont toutes indépendantes, de moyenne nulle et de variance unité, les résidus r_k = y-f(\theta,t_k}) en sont une réalisation. Donc R^2=\sum\limits_{k=1}^m r_k^2 est une réalisation d'une loi du \chi^2 à m degrés de liberté. Si R^2 est de l'ordre de m, le modèle est cohérent. Sinon, le modèle ou les paramètres ajustés sont à revoir.

En pratique, les erreurs \epsilon__k ne sont évidemment pas de variance unité et parfois pas indépendantes. Par contre on peut à bon droit supposer qu'elles sont de moyenne nulle. Pour se ramener au cas précédent, on calcule non pas une réalisation de \epsilon_1^2+...+\epsilon_m^2 mais de \chi^2_m'=\epsilon^T \Sigma^{-1} \epsilon\epsilon = \left( \begin{array}{c} \epsilon_1 \\ \epsilon_2 \\ \\ \epsilon_m \end{array} \right) , \epsilon^T est sa transposée et \Sigma est la matrice des variances-covariances de \epsilon. Dans le cas où les \epsilon_k sont indépendantes, la matrice des variances-covariances est diagonale, son k-ème terme diagonal étant \frac{1}{\sigma_k^2}, soit l'inverse de la variance de \epsilon_k.


La vraisemblance

Etant donné des paramètres \theta, le modèle global f(\theta,T)+\epsilon est une variable aléatoire: il est somme d'une variable aléatoire valant f(\theta,T) avec une probabilité 1 et d'un vecteur de variables aléatoires gaussienne \epsilon. A ce titre, il a une certaine densité de probabilité que l'on note L(y|\theta). Le symbole | se lisant "sachant". La lettre L vient de Likelihood, qui veut dire vraisemblance en anglais. Il s'agit dans l'idée de la probabilité d'obtenir y = f(\theta,T)+\epsilon pour une valeur de \theta donnée..

La fonction \theta \rightarrow L(y|\theta) est souvent appelée "fonction de vraisemblance". La valeur de \theta maximisant L(y|\theta) est appelé l'estimateur du maximum de vraisemblance. Il a de bonnes propritétés statistiques. En effet, on peut montrer que c'est un estimateur:

Dans notre cas, si les \epsilon_k sont des variables indépendantes, leur densité de probabilité jointe est égale au produit de leurs densité de probabilité. L(y|\theta) = \prod\limits_{k=1}^m g_k(y-f(\theta,t_k))g_k est la densité de probabilité de la variable \epsilon_k. De plus, si ces varibles sont gaussiennes et indépendantes, on a: L(y|\theta) = \prod\limits_{k=1}^m \frac{1}{\sqrt{2\pi}\sigma_k} e^{-\frac{(y-f(\theta,t_k))^2}{\sigma_k^2}} = \frac{1}{(\sqrt{2\pi})^m \prod\limits_{k=1}^m \sigma_k} e^{-\sum\limits_{k=1}^m \frac{(y-f(\theta,t_k))^2}{\sigma_k^2}}}


Méthode des moindres carrés

Pour des bruits gaussiens indépendants, maximiser la vraisemblance, revient à minimiser \theta \rightarrow F(y,\theta)=-ln(L(y|\theta)) =\sum\limits_{k=1}^m \frac{(y-f(\theta,t_k))^2}{\sigma_k^2}} puisque x \rightarrow e^{-x} est une fonction décroissante. La méthode consistant à minimiser F(y,\theta) s'appelle la méthode des moindres carrés. C'est la méthode d'estimation de loin la plus utilisée dans tous les domaines. Elle est parfois utilisée quand les bruits ne sont pas gaussiens, mais il faut garder à l'esprit qu'elle n'a alors plus de propriétés statistiques sympathiques (sauf quand le modèle est linéaire en \theta).

Dans notre cas, les paramètres \theta sont les éléments des orbites, les paramètres du bruit stellaire, du mouvement propre, etc. La fonction F(y,\theta) a donc de nombreux paramètres, et trouver son minimum global est une tâche ardue qui fait l'objet d'une littérature très vaste.

Lorsque le modèle est linéaire en \theta i. e. f(T,\theta) = A \thetaA est une certaine matrice dépendant des instants d'observation T = (t_k)_{k=1..m}, l'ajustement est beaucoup plus simple car il a une solution explicite (voir mini-projet). On essaye de se ramener autant que possible à des ajustements linéaires. La plupart du temps, on estime les paramètre les uns après les autres, puis un ajustement global est réalisé. Une démarche classique consiste à:

Sur la figure, on représente les étapes d'un ajustement d'un signal astrométrique simulé (2 planètes, 45 observations). De gauche à droite et de haut en bas:

Exemple d'ajustement en astrométrie (données simulées)
fit_process.png
Six étapes d'ajustement aux données. Pour représenter la chronologie des mesures, on trace des segments reliant deux points de mesure consécutifs.

Périodogramme

Evaluer les résidus sur une grille d'un modèle à n paramètres, où chacun d'eux peut prendre p valeurs recquiert n^p évaluations, ce qui devient rapidement ingérable numériquement. Les planètes ont un mouvement périodique, donc il est raisonnable de checher des signaux périodiques dans le signal en ne faisant varier que la période du signal recherché. Pour des signaux échantillonnés à intervalles réguliers, on utilise la transformée de Fourier. Le périodogramme est un moyen de checher des signaux périodiques dans des données échantillonnées irrégulièrement. On les notera y. Le périodogramme de Lomb-Scargle d'un signal (y_k)_{k=1..m} échantillonné aux instants (t_j)_{j=1..m} est défini comme suit pour une fréquence quelconque \omega:

P_y(\omega) = \frac{1}{2} \left(  \frac{ \left( \sum\limits_{j=1}^m y_j \cos \omega(t_j-\tau) \right)^2}{ \sum\limits_{j=1}^m \cos^2 \omega(t_j-\tau)}} + \frac{ \left( \sum\limits_{j=1}^m y_j \sin \omega(t_j-\tau) \right)^2}{ \sum\limits_{j=1}^m \sin^2 \omega(t_j-\tau)}} \right) \tau vérifie:

\tan 2 \omega \tau = \frac{\sum\limits_{j=1}^m \sin 2\omega t_j}{\sum\limits_{j=1}^m \cos 2\omega t_j}

Cette expression est équivalente à P_y(\omega) = A^2 +B^2A et B sont les paramètres minimisant \sum\limits_{j=1}^m (y_j-A\cos(\omega t_j) - B\sin(\omega t_j))^2. Le modèle A,B, t \rightarrow A \cos \omega t + B \sin \omega t est linéaire en A, B, on a donc une solution explicite à la minimisation.

Le périodogramme a une propriété très intéressante: si le signal d'entrée est un bruit gaussien \epsilon de variance unité, p_0 une valeur réelle fixée et \omega une fréquence quelconque, la probabilité que P_{\epsilon}(\omega) dépasse p_0 est Pr\{P_\epsilon(\omega)>p_0\} = e^{-p_0}. En d'autres termes, la probabilité qu'une valeur du périodogramme à \omega fixée soit "au moins aussi grand que p_0" par hasard décroît exponentiellement. Supposons que l'on ait un signal y(t) = x(t) + b(t)b(t) est un bruit gaussien de variance unité et nous trouvons un pic de taille p_0, on calcule la probabilité de trouver un pic au moins aussi grand si le signal n'est composé que de bruit: e^{-p_0}. Si cette valeur est petite, on pourra confirmer la détection d'un signal avec une erreur de fausse alarme de e^{-p_0}. Ce procédé n'est autre qu'un test de signification statistique.

La figure montre un exemple de périodogramme. Il s'agit d'un périodogramme d'une des coordonnées d'un signal astrométrique simulé dont on a soustrait le mouvement propre et la parallaxe. En bleu, on représente un périodogramme idéal, sans bruit, avec 10000 observations. Le périodogramme représenté en rouge est lui calculé pour 45 observations. Le pic le plus haut correspond bien à une fréquence réelle. Par contre, le deuxième pic le plus important (à 0.37 rad/s) ne correspond pas à une sinusoïde. C'est ce qu'on appelle un alias de la fréquence principale.

En pratique, la variance du bruit n'est pas unitaire et dépend de l'instant de mesure. On peut corriger ce problème en minimisant un critère pondéré \sum\limits_{j=1}^m \frac{(y_j-A\cos(\omega t_j) - B\sin(\omega t_j))^2}{\sigma_j^2}\sigma_j est la variance du bruit à la mesure j.

Exemple de périodogramme
HIP116745_perio.png
En rouge: périodogramme d'un système simulé à deux planètes après soustraction du mouvement propre et de la parallaxe (signal très peu bruité), pour 45 mesures. En bleu: périodogramme du même système sans bruit et avec 10000 observations.

Se tester

Auteur: Nathan Hara & Jacques Laskar

Questions qualitatives


Mini projet


But

L'objectif de ce mini projet est de réaliser un code permettant de calculer un périodogramme. On commence par établir la formule des moindres carrés dans le cas d'un modèle linéaire.

Moindres carrés linéaires

On se donne des observations y et on considère une matrice réelleA de taille m,n avec m>n et de rang n. On veut calculer \hat{\theta}, minimisant F(\theta)=\sum\limits_{k=1}^m \left(\frac{y_k - A \theta}{\sigma_k}\right)^2. On pose W matrice diagonale dont les éléments diagonaux valent \frac{1}{\sigma_k} et \Sigma = W^2. En termes vectoriels, F(\theta) = \|W(AX-y) \|^2. Comme on veut trouver le minimum de F(\theta) et que cette fonction est différentiable, ce minimum vérifie dF(\theta)dF est la différentielle de F. Montrer que la solution de dF(\theta) = 0 est \hat{\theta} = (A^T \Sigma A)^{-1} A^T \SigmaT désigne la transposition. Montrer que c'est un minimum global. (On pourra utiliser le fait que \|W(AX-y) \|^2 = (y-AX)^T\Sigma (y-AX).

Périodogramme

Nous voulons trouver la sinusoïde qui a la distance minimale aux données y au sens des moindres carrés. En d'autres termes, on veut ajuster \theta_{\omega} = \left( \begin{array}{c} a_{\omega} \\ b_{\omega}  \end{array}  \right) F_\omega(\theta)=\sum\limits_{k=1}^m \left(\frac{y_k - a_{\omega} \cos \omega t_k - b_{\omega} \sin \omega t_k}{\sigma_k}\right)^2 où les t_k sont des instants d'observation. Calculer avec la formule précédente \theta minimisant F_\omega(\theta). On notera P(\omega) = a_{\omega}^2 + b_{\omega}^2

Implémentation

Dans le langage informatique de votre choix, écrire un programme permettant de:


Bibliographie


-------------FIN DU CHAPITRE -------------FIN DU CHAPITRE -------------FIN DU CHAPITRE -------------FIN DU CHAPITRE -------------

ACCES AU PLAN DES CHAPITRES


Transits d'exoplanètes

Auteurs: Emmanuel Lellouch, Jean-Mathias Griessmeier, Quentin Kral

Transits d'exoplanètes

Ce chapitre présente la recherche et l'étude des exoplanètes par la méthode des transits. Il décrit les techniques d'observation, ainsi que les phénomènes observés et les paramètres déduits de ces observations concernant la planète, son environnement, sa structure interne et son atmosphère.

La lecture de ce cours demande quelques connaissances sur les atmopshères planétaires disponibles ici.


Décrire

Auteur: Emmanuel Lellouch

Définitions


Différents mots pour une variété de phénomènes

Vus depuis la Terre, les objets célestes peuvent passer les uns devant les autres, ce qui conduit à l’obscuration partielle ou totale de l'objet le plus lointain. Lorsque deux objets ont une taille apparente différente, le passage du plus petit devant le plus grand est appelé transit . Celui du plus grand devant le plus petit est appelé occultation ou plus improprement éclipse .


Dans le système solaire

Jupiter

Phénomènes mutuels des satellites de Jupiter
jup11.jpg

Dans le système solaire, les transits les plus courants sont ceux des satellites galiléens devant Jupiter, ainsi que leurs transits, occultations et éclipses mutuels. Dans le cas de Jupiter, lorsque la planète est proche de son équinoxe (tous les 5.5 ans environ), on peut observer les phénomènes mutuels de ses satellites galiléens, parmi lesquels on distingue entre transits, occultations et éclipses.

Mercure et Vénus

Transit de Vénus
VenusTransit2012_He.jpg
Transit de Vénus de 2012 observé dans une bande H alpha, qui montre les tâches solaires et le filaments.
Crédit : C. Hetlage, APOD

Moins fréquents mais plus connus sont les transits de Mercure (13 ou 14 fois par siècle) et Vénus (2 fois, séparées de 8 ans, tous les 243 ans) devant le Soleil.

Le Soleil et la Lune

En principe, le terme éclipse (littéralement : privation de lumière) devrait être réservé aux situations dans lesquelles un corps passe dans l’ombre d’un autre et non derrière lui. Il est ainsi employé correctement lorsqu’on parle d’une éclipse de Lune – la Lune passant dans l’ombre de la Terre – mais improprement lorsqu’on parle d’une éclipse de Soleil, ce phénomène devant en toute rigueur être appelé occultation du Soleil par la Lune .

Le système solaire extérieur

Les planètes et petits corps du système solaire extérieur, très peu lumineux, passent assez souvent devant des étoiles du fond de ciel plus brillantes qu'eux. Ces occultations d'étoiles, comme les "ombres chinoises" révèlent des informations inaccessibles autrement.

Quelques-uns des résultats obtenus grâce à ces phénomènes sont décrits ci-dessous.


Hors du système solaire

hst-hd209458.png
hst-hd209458.png
Transit de la planète HD 209458 b, observé par le Télecope Spatial
Crédit : NASA

En sciences exoplanétaires, la méthode des transits consiste à mesurer les timings et l’ensemble des phénomènes observables lors du passage apparent d’une planète devant (figure ci-jointe- et derrière son étoile-hôte, lorsque ceux-ci se produisent en raison d’une orientation favorable de l’orbite planétaire (nous parlerons ci-après d’une planète transitante). Comme on le verra en détail, ces observations fournissent des informations irremplaçables sur la taille de la planète, ses caractéristiques orbitales, la structure et la composition de son atmosphère, voire la présence éventuelle de planètes supplémentaires dans le système.

Le passage de la planète derrière l’étoile (stricto sensu son occultation) est dans la littérature le plus souvent désigné par « transit secondaire » voire « éclipse secondaire », ou «anti-transit». Dans ce qui suit, on utilisera les termes transit (ou transit primaire) et éclipse secondaire pour le passage d’une planète devant et derrière l’étoile. L’observation de la planète hors transit, c’est-à dire dans la période de temps située entre le transit et l'éclipse secondaire fournit elle aussi des renseignements très intéressants sur la planète.


Des phénomènes riches d'enseignements

Roemer
Roemer.jpg
Gravure de l'article de Rømer dans le JOURNAL DES SCAVANS de l'orbite de Io (en haut) observée de la Terre (en bas). L'article rapporte les 8 années d'observation et la conclusion que la lumière ne se propage pas instantanément.
Crédit : BNF-Gallica
Chariklo
chariklo.png
L'enregistrement du passage de l'astéroïde Chariklo devant une étoile a révélé la présente de deux anneaux.
Crédit : L. Maquet

Dans différentes branches de l’astrophysique, l’observation de ces phénomènes de masquage ont donné historiquement des résultats scientifiques majeurs. Il y a exactement 400 ans, la mesure du timing des éclipses de Io par Jupiter a conduit le Danois Ole Rømer à la première estimation de la vitesse de la lumière (figure ci-jointe).

L’observation des transits de Vénus depuis différents points de la Terre a permis de calibrer les distances dans le système solaire (c’est-à-dire de mesurer l’unité astronomique) en employant la méthode des parallaxes. Elle a aussi fourni les premières indications sur la présence d’une atmosphère autour de Vénus (transit de 1761).

Les observations des éclipses de Soleil, qui permettent d’isoler la chromosphère, ont fourni de très nombreux résultats, parmi lesquels on se bornera à citer ici la découverte de l’hélium (1868), et la confirmation de la prédiction d’Einstein sur la déflection gravitationnelle de la lumière (1919) en comparant la distance apparente entre des étoiles selon que le Soleil était absent du champ ou présent (i.e. pendant une éclipse de Soleil).

Même si on se limite au système solaire, ces phénomènes continuent à fournir des informations majeures. La mesure des positions précises des satellites de Jupiter grâce aux phénomènes mutuels a permis de reconstituer leur mouvement orbital avec une précision suffisante pour en déduire le taux de dissipation d’énergie lié aux forces de marée dans l’intérieur de Io.

Dans des situations géométriquement semblables à celle des exoplanètes, la spectroscopie de Mercure et Vénus lors des transits récents devant le Soleil, et de Io en transit devant Jupiter, ont fourni de nouvelles information sur la composition et la structure de leurs atmosphères.

Un outil puissant d’étude des objets du système solaire lointain (objets trans-neptuniens) est fourni par la méthode de l’occultation stellaire : elle permet, par mesure du temps d’occultation – c’est-à-dire le temps de disparition de l’étoile derrière l’objet – la détermination de leur taille avec une précision (de l’ordre du kilomètre) inégalable par d’autres techniques. Les systèmes d'anneaux d'Uranus, de Neptune, du Centaure Chariklo (figure ci-jointe) et du transneptunien Haumea ont été découverts grâce à de telles occultations stellaires. Cette même technique permet de mesurer et de suivre l’évolution temporelle de la pression à la surface d’un objet comme Pluton.


Paramètres planétaires accessibles


Paramètres planétaires

L'observation des transits donne accès à des informations sur


Taille de la planète

Rayon

Géométrie des transits
transit-fig1.png
Figure 1 : Géométrie de l’orbite d’une planète transitante. Nous utilisons ici le terme éclipse secondaire pour désigner le passage de la planète derrière l’étoile, i.e. l’occultation.
Crédit : A traduire

La figure ci-jointe montre schématiquement la géométrie d’observation d’une exoplanète transitante. L’observable la plus directe est la mesure de la variation de flux pendant le transit primaire et l'éclipse secondaire. Hors transit, le flux mesuré correspond à la somme du flux de l’étoile Phi_e et celui de la planète Phi_p. Pendant l'éclipse secondaire, le flux mesuré est restreint à Phi_e.

Pendant le transit primaire, une fois que la planète est entièrement devant le disque de l’étoile, une fraction de la surface de l'étoile est cachée, delta=k^2=(R_p/R_e)^2, où R_e et R_p sont respectivement le rayon de l'étoile et de la planète. Le flux de lumière de l'étoile est réduit d'une fraction δ. Comme la planète est devant l’étoile, elle nous présente sa face non-éclairée, donc sa contribution au flux observé est nulle. En conséquence, le rapport du flux mesuré pendant le transit primaire à celui mesuré pendant l'éclipse secondaire (ou en pratique à celui mesuré à n’importe quel moment hors du transit) donne directement le rapport du rayon de la planète à celui de l’étoile.

exerciceTransit de planètes du système solaire

Question 1)

Calculez la baisse de luminosité du Soleil dû à un transit de Jupiter, de la Terre.

Les petites étoiles favorisent la détection de transits

L'exercice ci-dessus montre que le transit de Jupiter devant le Soleil conduit à une baisse de luminosité de celui-ci de 1.05%. Pour la Terre passant devant le Soleil, l’assombrissement relatif n’est que de 0.0084%.

La perte de flux mesurée pendant l'éclipse secondaire dépend elle non seulement du rapport k=R_(pl)/R_(et) , mais également du rapport de l’intensité lumineuse spécifique (i.e. pour une surface donnée) émise par les deux objets. Comme on le verra plus loin, il dépend de de la longueur d’onde, et selon celle-ci, des températures de la planète et de l’étoile, ou de l’albédo de la planète.

L’expression de la perte de flux au moment du transit montre que la détection d’un transit d’une exoplanète de rayon donné autour d’une étoile naine (de type M) est plus favorable qu’autour d’une étoile de type solaire ou d’une étoile géante. Par exemple, l’étoile Kepler- 42 a un rayon égal à 0.17 rayon solaire (120 000 km). Elle abrite 3 planètes, dont la plus petite (Kepler-42 d), a un rayon de 0.57 rayon terrestre, ce qui donne un signal photométrique de l’ordre de 0.1%, plus de dix fois plus fort que la Terre devant le Soleil.


Orbite : Période et excentricité

La grande puissance de la méthode des transits résulte de la reproductibilité du phénomène. Un système transitant peut être observé autant de fois que l’on souhaite, avec à chaque fois les mêmes caractéristiques en termes de timing et de profondeur de transit, ce qui permet l’accumulation de la précision sur ces deux paramètres. La précision sur la mesure des instants de transits est riche d’enseignements.

Dans le cas d’une orbite circulaire de période P, un transit et l'éclipse secondaire adjacente sont séparés temporellement de P/2. Ce n’est plus le cas pour une orbite elliptique, et la mesure de ces séparations temporelles (transit-éclipse et éclipse-transit) donne une information sur l’excentricité de l’orbite; plus précisément, elle contraint le produit e cos (ω), où e est l’excentricité et ω l’argument du périastre. La mesure des durées relatives du transit et de l'éclipse secondaire fournissent aussi des contraintes sur ces paramètres, mais avec moins de précision, eu égard à la courte durée des transits par rapport à leur périodicité.

Au-delà même de la caractérisation statistique des orbites planétaires, l’intérêt physique de ces mesures d’excentricité est grand. Ainsi, pour les planètes proches de leur étoile, les effets de marée associés aux orbites elliptiques produisent un chauffage interne qu’il est possible d’estimer, fournissant des contraintes sur la structure thermique des objets.

Par ailleurs, s’agissant de la connaissance de la période orbitale et des instants de transit et d’éclipse, la méthode des transits est presque toujours plus précise que la méthode des vitesses radiales. Pour autant, ces paramètres interviennent dans l’interprétation des courbes de vitesse radiale (ce sont 3 des 6 paramètres libres associés à cette méthode), donc leur connaissance indépendante via les transits a un grand intérêt pour l’amélioration de la précision sur les autres.


Orbite : Orientation

Orientation de l'orbite
transit-fig2.png
Figure 2 : Transit d’une exoplanète en présence de rotation stellaire. La planète masque d’abord des régions émettant vers le bleu, puis vers le rouge. La dernière ligne montre l’évolution de la vitesse radiale mesurée pour l’étoile pour différentes orientations de l’orbite planétaire. Dans les trois situations montrées, la durée du transit est la même de sorte que la simple observation photométrique du transit ne pourrait les distinguer.
Crédit : A traduire

Une exoplanète qui transite devant son étoile possède une orientation favorable pour la spectroscopie des vitesses radiales : L'étoile et la planète tournent autour de leur centre de gravité. Au moment du transit planétaire, l'étoile est à son point le plus éloigné de la Terre (i.e. l'observateur) et sa vitesse Doppler s'annule.

S’y rajoute un effet subtil : en raison de sa rotation propre, le rayonnement d’une partie de l’étoile est décalé vers le bleu, l’autre vers le rouge (Fig. 2). Si la planète a une orbite prograde (dans le même sens que la rotation stellaire), elle masque d’abord des régions de l’étoile émettant un rayonnement décalé vers le bleu (zones grisées sur la Fig. 2), puis vers le rouge (zones claires). En conséquence, par rapport à sa valeur mesurée au centre du transit, la vitesse radiale globale de l’étoile est d’abord décalée vers le rouge, puis vers le bleu. C’est ce que l’on appelle l’effet Rossiter- McLaughlin. L’effet est loin d’être faible: en raison des fortes vitesses de rotation stellaires (typiquement 2 km/s pour le Soleil), il peut se chiffrer en quelques dizaines de mètre par seconde – soit souvent plus que la vitesse Doppler de l’étoile liée à la planète.

L’évolution du décalage Doppler de l’étoile pendant le transit permet alors non seulement de confirmer l’existence du transit, mais aussi de déterminer l’orientation de l’orbite planétaire, à savoir l’angle entre le plan orbital et l’axe de rotation de l’étoile (angle appelé obliquité de l’étoile).

Cette méthode a mis en évidence de nombreux cas de tels désalignements spin-orbite, voire d’orbites planétaires rétrogrades. L’origine de ces désalignements reste mal comprise, mais est sans doute liée à des phénomènes d’interaction, magnétique entre la jeune étoile et le disque proto-stellaire, ou gravitationnelle avec des compagnons stellaires au moment de la formation, qui auraient pu faire « basculer » l’axe de rotation stellaire. Une autre hypothèse serait que l’axe de rotation de l’étoile représente bien la direction perpendiculaire au plan du disque primordial, et que c’est le système planétaire dont le plan orbital a changé depuis sa formation.


Orbites perturbées

Orbites non kepleriennes et planètes additionnelles

TTV
ttv-forgan.png
TTV de l'étoile KOI 872 (Kepler-46)
Crédit : D. Forgan
Kepler-88
kepler-88b.png
La planète Kepler-88b transite devant l'étoile Kepler-88. La planète Kepler-88c a été décourverte par les perturbations induites sur les instants des transits.
Crédit : A. Santerne

De manière encore plus fine, la précision extraordinaire qui peut être atteinte sur les instants de transits peut révéler des cas d’orbites non-képleriennes. Ces situations peuvent résulter d’effets relativistes, de forces de marée liées à l’étoile, ou de perturbations associées à des forces gravitationnelles dues à des objets supplémentaires dans le système (deuxième étoile, planète additionnelle, etc.). Elles se manifestent par des variations sur les timings des transits primaire et secondaire, soit sur le long terme, ce qui peut indiquer une précession de l’orbite, soit à plus court terme, dans le cas de perturbations par des planètes non nécessairement transitantes dans le système.

Les planètes sur des orbites résonantes, c’est-à-dire présentant des commensurabilités de leurs périodes – produisent des variations particulièrement grandes des instants des temps de transit (figure ci-jointe). Cette effet est appelé TTV (transit time variation). L’ « inversion » des données de TTV en termes de propriétés (masse et orbite) des planètes perturbatrices est souvent « dégénérée » (i.e. n’a pas de solution unique), mais dans certains cas, une solution non-ambigüe peut être obtenue. Le plus souvent, l’ordre de grandeur des TTV est une très faible fraction de la période orbitale.

Un cas remarquable est celui de l’exoplanète Kepler-88b, une planète de 9 masses terrestres, qui présente des TTV de 12h d’amplitude, pour une période orbitale de 11 jours. Il a été prédit qu’ils étaient causés par une planète perturbatrice non-transitante de 0.7 masses de Jupiter, qui est ensuite été détectée par vélocimétrie radiale !


Un système extraordinaire : TRAPPIST-1

Transit triple de planètes de TRAPPIST-1
trappist-1.png
Courbe de lumière pour un transit triple des planètes TRAPPIST-1c, TRAPPIST-1e, et TRAPPIST-1f. La configuration des planètes (jaune, rouge, vert) à trois instants particuliers est indiquée en bas.
Crédit : Gillon et al. 2017.
TRAPPIST-1 versus Jupiter
trappist-2.png
Taille comparée du système de 7 planètes TRAPPIST-1 avec le système des lunes galiléennes de Jupiter et le système solaire interne.
Crédit : tréduire

Tout récemment (22 février 2017), un système exceptionnel de 7 planètes, toutes transitantes, a été découvert autour d’une étoile naine (rayon = 0.11 rayons solaires, masse= 0.08 masses solaires) ultra-froide (2550 K) appelée TRAPPIST-1 et située à 40 années-lumière. Les périodes orbitales (de 1.5 à 20 jours) sont telles que plusieurs de ces planètes peuvent transiter en même temps, et même s’occulter mutuellement pendant le transit, ce qui conduit à des courbes lumières d’une superbe complexité (Fig. ci-jointe).

Les tailles (Rp = 0.75 à 1.1 rayons terrestres) et masses (0.85 à 1.38 masses terrestres, mesurées par la méthode des TTV) indiquent clairement des planètes telluriques et trois d’entre elles pourraient avoir une température compatible avec l’eau liquide. Le système dans son ensemble (0.063 UA pour la planète la plus externe) tiendrait aisément dans l’orbite de Mercure, et apparaît comme un cas intermédiaire entre le système des satellites galiléens de Jupiter et celui du système solaire interne (Fig. ci-jointe).


Atmosphère: composition et dynamique - I

Structure verticale - transit primaire

Dans ce qui précède, nous n’avons parlé de d’observations photométriques des transits – c’est-à-dire dans une seule bande de longueur d’onde (outre la description de l’effet Rossiter-McLaughlin). Par ailleurs, nous avons implicitement supposé que la planète a un « bord net », de sorte qu’on pouvait parler de son « rayon » sans ambiguÏté. La réalité est plus floue. Les planètes géantes n’ont pas de surface solide bien définie, et même une planète tellurique peut posséder une atmosphère, qui influence la manière dont la lumière stellaire est absorbée pendant le transit. Concrètement, l’absorption préférentielle de la lumière à certaines longueurs d’onde par les gaz et/ou aérosols/nuages rend le « rayon d’absorption » de la planète plus grand à ces longueurs d’onde. Du coup, la mesure spectroscopique du transit, c’est-à-dire la variation de la profondeur d’absorption du transit en fonction de la longueur d’onde, permet d’obtenir des informations sur la composition de l’atmosphère, voire sa dynamique. Nous verrons plus loin les équations générales régissant ces principes. Notons que cette spectroscopie de transmission peut être effectuée dans tout l’infrarouge et jusqu’à l’ultraviolet, ce qui permet en principe de sonder une vaste gamme verticale de niveaux dans l’atmosphère, allant des troposphères (pression de plusieurs bars) jusqu’aux thermosphères/exosphères (nanobar).


Atmosphère: composition et dynamique - II

Structure verticale-transit secondaire

De même, il est extrêmement intéressant d’observer par spectroscopie l'éclipse secondaire. Comme on l’a vu, la différence entre le flux mesuré juste avant ou après le passage de la planète derrière l’étoile et celui mesuré pendant l'éclipse secondaire donne le rayonnement provenant de la planète elle-même (pour être précis, du côté éclairé de la planète). Selon le domaine de longueur d’onde, ce rayonnement planétaire peut-être de nature stellaire réfléchie ou thermique.

La première composante, qui domine dans le visible et le proche infrarouge, correspond à la lumière de l’étoile réfléchie par la planète. Le rayon étant approximativement connu par l’observation du transit, l’intensité de ce rayonnement réfléchi fournit l’albédo de la planète. Ce dernier résulte de la compétition entre les propriétés réfléchissantes/diffusantes et absorbantes de l’atmosphère (voire de sa surface). Pour une planète avec une atmosphère épaisse, les variations spectrales de l’albédo sont dues aux variations de ses propriétés de diffusion (par les gaz et/ou les nuages atmosphériques) avec la longueur d’onde, mais peuvent aussi faire intervenir la composition gazeuse (des espèces atomiques comme le sodium ou le potassium ont des raies d’absorption très fortes dans le visible). Comme on verra, la grande difficulté de la mise en œuvre de cette technique résulte dans la très faible intensité du signal planétaire à extraire.

Le domaine thermique, lui, correspond au rayonnement propre de l’atmosphère de la planète. Celui-ci dépend à la fois de la structure thermique verticale (la variation de la température avec la pression dans l’atmosphère de la planète) et des profils verticaux d’abondance des gaz – qui définissent le profil vertical de l’opacité atmosphérique. En termes de composition atmosphérique, la mesure du spectre thermique apparaît donc complémentaire de celle du spectre en transmission mesuré pendant le transit. Cette complémentarité reflète notamment le fait que les deux méthodes ne sondent pas les mêmes régions atmosphériques : le transit est sensible à la composition du limbe de la planète – i.e. les régions où la lumière stellaire est rasante (« terminateurs ») alors que l’émission thermique sonde le côté jour de la planète.

Par ailleurs, à une longueur d'onde donnée, le transit sonde des régions plus ténues de l'atmosphère que l'émission thermique.


Atmosphère: composition et dynamique - III

Chimie de l'atmosphère

A ce jour (janvier 2017), la spectroscopie des transits a permis de détecter un petit nombre d’espèces chimiques dans certaines exoplanètes (~20 objets en tout), parmi lesquelles les molécules H2O, CO2, CO, CH4, et les espèces atomiques H, C, O, Na, K. De manière très générale, l’intérêt de ces mesures est double, permettant (i) d’en déduire la composition élémentaire (par exemple le rapport C/O), qui donne des contraintes sur les processus de formation de ces objets (ii) de caractériser les processus physiques (photochimie, condensation, thermochimie à l’équilibre ou hors-équilibre, transport vertical, échappement atmosphérique...) qui gouvernent les atmosphères. L’étude des spectres exoplanétaires renseigne aussi sur la présence de nuages dans leurs atmosphères, dans la mesure où des nuages diffusants ou absorbants à haute altitude masquent les absorptions moléculaires attendues.


Atmosphère: composition et dynamique - IV

Courbe de phase

Transits et courbe de phase de HD189733 b
transit-fig3.png
Figure 3 : Transit, éclipse secondaire, et courbe de phase de la planète HD 189733 b, observés à une longueur d’onde de 8μm avec le télescope spatial infrarouge Spitzer. Les courbes sont normalisées au flux stellaire (1.000 pendant l'éclipse secondaire). Le transit (à la phase 0.0) fait environ 2.1% de profondeur, ce qui indique un rapport des rayons R_p/R_e de 1.0%. L'éclipse secondaire (phase 0.5) indique que le côté jour de la planète émet 0.3% du rayonnement stellaire à cette longueur d’onde, impliquant une température d’environ 1210 K. La figure du bas (zoom vertical de celle du haut) montre la courbe de phase. Après modélisation, celle-ci indique que la température du côté nuit est d’environ 970 K, « seulement » 240 K plus froid que sur le côté jour, ce qui implique une forte redistribution de la chaleur par la dynamique atmosphérique. D’après Knutson et al. 2007.
Crédit : à traduire

La figure montre qu’au cours de sa révolution autour de l’étoile, une exoplanète présente différentes phases : côté nuit au moment du transit, côté jour juste avant/après l'éclipse secondaire, et à l’instar de la Lune, des phases de croissant/quartier tout au long de l’orbite.

Le suivi de l’émission thermique avec la position de la planète sur son orbite – et ceci est vrai même pour une planète ne transitant pas – permet ainsi de mesurer les variations spatiales – en l’occurrence les variations avec l’heure locale pour une orbite circulaire – des propriétés atmosphériques. Ces courbes de phase renseignent principalement sur la variabilité diurne des températures atmosphériques. Par exemple, on pourrait s’attendre à ce que les Jupiter chauds, qui, dus aux effets de marée, sont en rotation synchrone autour de leur étoile, présentent des écarts de températures gigantesques entre les côtés éclairé et sombre. Ce n’est en fait souvent pas le cas (voir exemple sur la figure ci-jointe), ce qui implique une forte redistribution de la chaleur par des vents atmosphériques. Il est également généralement observé que le maximum de température ne se produit pas au midi local, mais est décalé vers les zones « de l’après-midi », ce qui s’explique par des effets d’inertie thermique.

Une méthode complémentaire consiste à résoudre temporellement l'éclipse secondaire dans le domaine thermique : la disparition progressive derrière l’étoile de la planète permet de déterminer successivement les températures de « tranches de planète » correspondant à des heures locales différentes, et ainsi d’établir une carte de températures.

La spectroscopie des transits donne enfin potentiellement un accès direct à la vitesse des vents atmosphériques. En effet si une molécule est détectée par spectroscopie du transit, la mesure précise de la longueur d’onde des raies planétaires peut éventuellement indiquer des décalages spectraux diagnostics de vitesses de vent. Ainsi, un décalage vers le bleu des raies de CO dans le cas de HD209458b a été interprété comme la signature de vents jour-nuit de l’ordre de 2 km/s. Des complications liées à la connaissance précise de l’orbite de la planète peuvent toutefois survenir. Dans un cas, il a aussi été possible de mesurer la période de rotation propre d’une exoplanète (β-Pictoris b) à partir de la largeur des raies de CO.


Environnement planétaire accessible


Transit de satellites

Nous n’avons ci-dessus parlé que de transits de planètes devant des étoiles. Le phénomène peut être généralisé au transit d’autres objets de nature planétaires, tels que : satellites, astéroïdes/comètes, anneaux. Un satellite d’une exoplanète transitante doit généralement lui-même transiter et peut donc en être détecté directement par une allure particulière des courbes ingress/egress. Même si le satellite est trop petit pour être observé directement, un autre effet potentiellement détectable serait la mesure de TTV, dues au fait que la position de la planète oscille autour du centre de masse planète-satellite. Les données de transit de la planète Kepler-1625 b ont montré la premiètre trace de présence d'un exo-satellite, appelé Kepler-1625 b I


Transit de comètes

En revanche, on connaît deux cas de systèmes exoplanétaires avec transits de comètes. Le plus célèbre et le premier découvert est celui du disque de débris de l’étoile β-Pictoris, dont le spectre présente des raies atomiques (Ca II par exemple) variables temporellement, qui sont interprétées comme la signature de comètes en évaporation passant devant l’étoile. L’analyse statistique de ces signatures prouve qu’il existe deux familles de comètes différant par leur type d’orbite. A noter que le système de β-Pictoris possède également une planète géante (β-Pictoris b), découverte par imagerie directe, d’environ 7 masses de Jupiter, de période 22 ans. La recherche de son éventuel transit n'a, pour le moment rien donné.

Des transits de comètes devant une étoile (transit par le noyau cométaire et pas signature spectrale du nuage comme dans le cas de β-Pictoris) ont été détectés par Kepler en 2017.


Transit d'anneaux

Transit d'anneaux
transit-fig4.png
Figur 4 : Modèle et courbe de transit du système SWASP-J1407. La planète (point au centre) est détectée par vitesse radiale mais ne transite pas. Elle est en revanche entourée d’anneaux géants qui transitent devant l’étoile en 56 jours. La bande verte indique le parcours de l’étoile relatif aux anneaux pendant le transit. Les anneaux présentent un « vide » aux 2/3 environ de leur extension, ce qui pourrait indiquer l’existence d’une lune.
Crédit : à traduire

Enfin, on a découvert le cas exceptionnel d’une exoplanète qui semble entourée d’anneaux (1SWASP J1407 b ; compte tenu de sa masse, environ 20 masses de Jupiter, il pourrait s’agir d’une naine brune). Ces anneaux, dont l’existence est attestée par leur transit devant l’étoile (Fig. 4), constituent un système géant (rayon ~90 millions de km, soit 200 fois les anneaux de Saturne) et pourraient abriter une masse totale d’environ 1 masse terrestre. Un modèle invoquant 37 anneaux distincts permet de reproduire la courbe du transit, qui dure 56 jours. A noter que le modèle présente une zone vide d’anneaux à environ les 2/3 du rayon total, peut-être la conséquence d’une lune de ~1 masse terrestre.


Comprendre

Auteur: E. Lellouch

Des événements rares


Probabilité de transit

L’une des limitations les plus importantes de la méthode est la faible probabilité qu’une exoplanète donnée passe devant ou derrière son étoile-hôte. Il faut en effet pour cela que l’observateur se trouve pratiquement dans le plan orbital de la planète (orbite vue « par la tranche »).

Considérons une planète découverte par vitesse radiale et dont l’orientation de l’orbite est inconnue. Pour qu’elle transite devant son étoile, en notant i l’inclinaison entre la normale au plan orbital et la ligne de visée, il faut que l’on ait la relation : cos(i)<(R_e+R_p)/a, où R_e et R_p sont les rayons de l'étoile et de la planète, a est la distance projetée entre l’étoile et planète au moment où celle-ci est au plus proche de l’observateur. Compte tenu que la planète est toujours beaucoup plus petite que l’étoile, et en se limitant pour simplifier au cas d’une orbite circulaire de demi-grand axe a, on peut montrer que la probabilité de transit et celle d'éclipse secondaire sont toutes deux égales à p=R_e/a. Ceci prouve le résultat intuitif que la probabilité de transit est plus grande pour les planètes les plus proches de leur étoile.


Recherche au hasard

exerciceDétectabilité des planètes par transit

Quelle est la probabilité, pour un extraterrestre, de détecter par transit,

Question 1)

- la Terre ? - Jupiter? - une planète à 0.05 UA d’une étoile de type solaire?

Cette probabilité peut se traduire en termes du nombre moyen d’étoiles qu’il faut observer pour espérer découvrir une exoplanète transitante à un rayon orbital donné. Si on note η la fraction des étoiles possédant une telle planète, ce nombre est de l’ordre de N 1/(p*eta). Par exemple, les « Jupiters chauds » ont une distance type à leur étoile de 0.05 UA, et concernent environ 1 % des étoiles. Ceci donne p 0.1 et N 1000.

Même dans ce cas très favorable (planète proche), on voit que la recherche d’exoplanètes nouvelles par transit nécessite l’observation en aveugle de grands échantillons.

L'exercice ci-dessus montre que la probabilité de détecter la Terre par transit n'est que de 0.45%. Pour Jupiter, la probabilité est de 0.09%. En revanche, pour une planète à 0.05 UA autour d’une étoile de type solaire, la probabilité atteint 9 %. Les probabilités de transit et d'éclipse secondaire peuvent différer lorsque l’orbite planétaire est d’excentricité non-nulle (elliptique) de sorte qu’il est en principe possible d’observer un transit primaire sans transit secondaire et vice-versa.


Temps des transits


Géometrie détaillée d'un transit

Temps
transit-fig5.png
Figure 5 : Géométrie d’un transit. δ est la profondeur du transit, b le paramètre d’impact, T la durée du transit et τ la durée de l’ingress.
Crédit : à traduire

La géométrie d’un transit est représentée sur la Fig. 5.

Appelons t_It_(IV) les 4 « temps de contact », c’est-à-dire les instants auxquels les disques de la planète et de l’étoile sont tangents. L’instant moyen de l’entrée (du disque planétaire devant le disque stellaire) est t_ent=(t_I+t_II)/2; de même l’instant moyen de la sortie (du disque planétaire) est t_sor=(t_III+t_IV)/2. L’intervalle de temps séparant ces deux instants, noté T, est par définition la « durée du transit », alors que tau_ent=t_II-t_I et tau_sor=t_IV-t_III sont respectivement la durée de l’entrée et de la sortie. On note également b le « paramètre d’impact », i.e. la distance minimale – exprimée en fraction de rayon stellaire – entre la position apparente de la planète et le centre de l’étoile.


Durée du transit

Avec ces définitions, en se limitant au cas des orbites circulaires et en faisant les approximations raisonnables suivantes : R_P<<R_e<<a, et b<<1 (transit non-rasant), on peut montrer que la durée du transit est égale à : T = T_0*racine(1-b^2)T_0=R_e*P/(pi*a), P étant la période orbitale.

Par ailleurs, tau_(ent)=tau_(sor)=(T_0*k/racine(1-b^2)), où k=R_p/R_e En combinant l’expression de T_0 ci-dessus avec la 3eme loi de Kepler, et en se ramenant au cas du système solaire, on obtient T_0=13*h*(P/1*an)^(1/3)*(rho_e/rho_sol)^( - 1/3) expression dans laquelle la seconde parenthèse représente le rapport de la densité de l’étoile à celle du Soleil. Ainsi, vu depuis une autre étoile, le transit de la Terre devant le Soleil ne dure que 13 h une fois tous les ans, et celui de Jupiter ne dure que 30 h une fois tous les douze ans, ce qui illustre à nouveau la rareté du phénomène. Bien évidemment, la mesure de la période requiert l’observation d’au moins deux transits.


Mise en oeuvre de la méthode


Différents objectifs scientifiques

Les expressions ci-dessus montrent que les transits sont des événements a priori rares, puisque seule, une faible fraction des exoplanètes transitent, et parmi celles-ci, seulement pendant une faible fraction de leur période orbitale.

Il faut donc distinguer entre les différents objectifs suivants: (i) la recherche d’exoplanètes, qui comme on l’a vu nécessite l’observation de grands échantillons (ii) le suivi photométrique de systèmes planétaires découverts en vélocimétrie radiale pour voir s’ils donnent lieu à des transits (iii) la caractérisation d’exoplanètes transitantes, notamment par spectroscopie.


Equipement

De par sa simplicité, la méthode est en principe accessible avec un équipement modeste, puisqu’au premier ordre il s’agit simplement (sauf pour le troisième objectif) de suivre photométriquement une étoile qui peut être relativement brillante. De fait, le premier transit d’exoplanète (celui de HD209458b, dont l’étoile a une magnitude 8) fut observé depuis le sol, en 2000, à l’aide d’un simple télescope de 25 cm, doté d’une caméra CCD. De nombreux programmes de recherche de transits au sol ont été développés, tels que TrES, XO, HAT, SuperWASP, avec des télescopes de 10 cm qui font des relevés sur des étoiles de magnitude 10 à 12, ou OGLE, avec un télescope de 1 m pour des étoiles de magnitude 14-16. A ce jour (fin 2016), ces relevés depuis le sol ont permis de découvrir environ 250 exoplanètes, notamment avec SuperWASP et HAT.

Comme on l’a vu plus haut, le transit d'une planète géante (resp. tellurique) autour d’une étoile de type solaire produit typiquement un signal photométrique de 1 % (resp. 0.01 %). En raison de la turbulence atmosphérique, les planètes telluriques ne sont pas à la portée des observations au sol, sauf autour des étoiles naines. Ce problème est éliminé par l’emploi d’observations depuis l’espace, qui ont en outre l’avantage de s’affranchir des aléas de la météo et des interruptions jour-nuit. Dans tous les cas, l’extraction des signaux planétaires requiert des techniques élaborées de photométrie de haute précision, excluant au maximum les erreurs systématiques éventuelles. Les projets spatiaux CoRoT et Kepler et leurs résultats sont décrits ci-après.


Difficultés de la méthode


Variabilité stellaire

La description faite plus haut de la perte de flux pendant un transit suppose que le flux stellaire est indépendant de la position sur l’étoile et constant dans le temps. Dans la réalité, le rayonnement stellaire est généralement caractérisé par un assombrissement centre-bord, lié au fait que le rayonnement au limbe provient d’un niveau plus élevé, et par conséquent plus froid, dans l’atmosphère de l’étoile, que celui au centre. En conséquence, l’atténuation du rayonnement de l’étoile lors d’un transit planétaire n’est pas purement géométrique.

Aux longueurs d’onde où l’assombrissement centre-bord est important, les courbes de lumière apparaissent ainsi plus « piquées » (c’est-à-dire moins plates) près de leur centre, puisque la planète masque alors une zone de rayonnement plus intense.

De manière plus générale, les étoiles présentent des hétérogénéités locales de flux, associées notamment aux tâches stellaires liées à l’activité de l’étoile. Leur masquage pendant le transit peut conduire à des irrégularités dans le profil d’atténuation de l’étoile, ce qui compliquera la détermination du rayon planétaire. Ces problèmes sont particulièrement sérieux dans le cas des étoiles géantes et sous-géantes. L’activité stellaire, qui induit une variation temporelle du flux total émis par l’étoile, peut aussi conduire à des courbes de lumières non parfaitement reproductibles dans le temps.


Faux positifs

Faux positifs
transit-fig6.png
Figure 6 :Transit d’une exoplanète devant son étoile (a), et trois types de « faux positifs » : (b) Transit d’une naine brune ou d’une étoile de très faible masse (c) transit d’une binaire à éclipse en présence d’une étoile brillante dans un système triple (d) transit rasant d’une binaire à éclipse. Au premier ordre, toutes ces situations donnent des courbes de lumières semblables.
Crédit : à traduire

Une faible atténuation temporaire et reproductible du flux stellaire peut sembler être la signature non-ambiguë d’un passage planétaire. Pourtant, il existe d’autres situations pouvant conduire au même type de signal (Fig. 6), telles que :

  1. le transit rasant d’une étoile dans un système binaire à éclipses

  2. le cas d’un système triple incluant une étoile brillante et une binaire à éclipses peu lumineuse : dans ce cas, l’effet du transit « normal » dans la binaire à éclipses est fortement dilué par la présence de l’étoile brillante, ce qui donne au phénomène l’apparence d’un transit planétaire de faible profondeur. Une variante de cette situation est le cas où la binaire à éclipse et l’étoile brillante ne font pas partie d’un système triple, mais se trouvent dans un alignement de circonstance.

  3. Enfin, même dans les cas où on peut établir qu’il s’agit bien du transit d’un objet unique devant l’étoile étudiée, il faut encore prouver que l’objet en transit est bien une planète : en effet, les étoiles de faible masse (<10% de la masse du Soleil) et les naines brunes ont des rayons comparables à celles d’une planète géante comme Jupiter, et ne s’en distinguent que par leur masse bien plus élevée.


Débusquer les faux positifs

Il y a différentes manière de débusquer ces « faux positifs ». Ainsi les cas des transits rasants peuvent être identifiés par leur forme plus piquée (en « V ») que celle des transits planétaires (en « U »). Par ailleurs, comme on l’a vu plus haut, la durée du transit donne une mesure de la densité de l’étoile-hôte ; une solution aberrante (c’est-à-dire incohérente avec celle que l’on peut estimer à partir de la température de l’étoile) indiquera qu’il ne s’agit pas d’un transit planétaire. Enfin, pour distinguer entre une véritable planète et un objet sous-stellaire de même rayon, le seul moyen est de déterminer la masse de l’objet par vélocimétrie radiale. L’étude (et l’élimination) des faux positifs est fondamental pour les études statistiques de population planétaire. Ce taux s’avère important et fortement dépendant des types de planètes. Par exemple, dans le cas des données Kepler, il est de l’ordre de 10 à 20 % globalement, mais peut atteindre 35-55% pour les planètes géantes, plus difficiles à distinguer des étoiles de faible masse et naines brunes. En revanche, le taux de faux positifs dans le cas des systèmes multi-planétaires (en particulier dans le cas des systèmes à TTV, voir ci-dessus) est faible.


Complémentarité des méthodes


Limites de la méthode des transits

L’observation photométrique du transit ne fournit que le rapport du rayon de la planète à celui de l’étoile, pas le rayon absolu de la planète. Par ailleurs, sauf dans les cas où des perturbations gravitationnelles entrent en jeu (TTV), les transits en eux-mêmes ne contraignent pas les masses planétaires.


Complémentarité des méthodes de transit et de vélocimétrie

En revanche, l’avantage majeur des transits est que les exoplanètes détectées par cette méthode le sont également en principe par vitesse radiale, puisque l’inclinaison de l’orbite i est alors favorable et bien connue (proche de 90°). L’amplitude du signal Doppler K_e sur l’étoile est relié à la masse planétaire par : M_p/(M_p+M_e)^(2/3)=((K_e*racine(1-e^2))/sin(i))*(P/2*pi*G)^(1/3) où M_p et M_e sont la masse planétaire et stellaire, e l’excentricité, P la période, et G la constante universelle de gravitation. L’avantage ici est qu’on peut écrire sin(i)=1.


Importance des données stellaire

Densité des exoplanètes
gillon2017.png
Diagramme masse-rayon des planètes TRAPPIST-1, comparées aux planètes telluriques du Système Solaire et quelques autres exoplanètes. Sont montrées aussi les courbes theoriques pour des planètes de différentes compositions
Crédit : Gillon et al. 2017

A nouveau, une limitation est que M_e n’est pas connue. Il faut donc combiner les mesures de transit et de vitesse radiale avec des informations indépendantes sur l’étoile, typiquement obtenues via les modèles d’évolution stellaire, qui donnent des relations entre âge, luminosité, rayon, masse et composition.

Par ailleurs, comme indiqué en 2.2, la profondeur du transit k^2=(R_p/R_e)^2, la durée du transit T et la durée de l’ingress/egress contraignent le rapport R_e/aet le paramètre d’impact b, ce qui permet de « calibrer » le rayon planétaire en absolu. Si les propriétés stellaires sont suffisamment bien connues, on peut donc obtenir des valeurs absolues du rayon et de la masse planétaire, donc de sa densité, ce qui a évidemment une importance énorme pour contraindre la nature (gazeuse, glacée, rocheuse) et la structure interne de la planète.

Finalement, en combinant la relation ci-dessous avec la 3e loi de Kepler, on peut déterminer la gravité planétaire g_p=G*M_p/R_p^2 indépendamment des propriétés de l’étoile : g_p=((2*pi)/P)*(racine(1-e^2)*K_e)/(R_p/a)^2*sin(i) La connaissance de g_p est nécessaire pour l’élaboration de modèles d’atmosphères.


Spectroscopie des transits et courbes de phase


Spectroscopie du transit

Spectre en transmission de HD 209458 b
transit-fig7.png
Figure 7 : Le spectre en transmission de HD 209458b, exprimé en termes de profondeur du transit. La partie visible (<1 micron) suggère l’effet de la diffusion Rayleigh et de l’absorption par le sodium à 0.58 micron. La présence de la vapeur d’eau est clairement visible à 1.4 microns (Deming et al. 2013).
Crédit : à traduire

Comme exposé plus haut, le principe de la spectroscopie du transit est de mesurer des variations spectrales de la profondeur du transit comme diagnostic de composition atmosphérique. A une longueur d’onde où l’atmosphère absorbe, le rayon "effectif" de la planète est augmenté d’une quantité alpha*H, où H est la hauteur d’échelle de l’atmosphère et α est généralement un nombre de l’ordre de quelques unités. La profondeur du transit δ est donc augmentée de : Delta*delta=((R_p+alpha*H)/R_e)^2-(Rp/R_e)^22*R_p*alpha*H/R_e^2=2*alpha*delta(H/R_p)

Cette relation montre fondamentalement que l’effet est d’autant plus grand que H est grande, i.e. que l’atmosphère est chaude, de faible masse moléculaire, et que la gravité est faible. Par exemple, pour un Jupiter chaud (T~=unité(1300;K), g=unité(25;g*s^(-2)), masse moléculaire = 2 amu (H_2), R_p=unité(70000;km)), on obtient H~=unité(210;km), ce qui fait Delta*delta/delta=0.02 en adoptant alpha=3. Pour une "Terre" (T~=unité(300;K), g=unité(10;m*s^(-2)), masse moléculaire = 28 amu (N_2), R_p=unité(6000;km)), on trouve H=unité(9;km) et Delta*delta/delta=0.008, en prenant toujours alpha=3.

Dans les deux cas, l’ordre de grandeur est donc une augmentation relative de la profondeur du transit de l’ordre de 1% de sa valeur. Pour la planète tellurique, compte tenu que le transit géométrique est déjà inférieur à 0.01%, le signal spectral Delta*delta est donc inférieur à 10^(-6), ce qui illustre l’extrême difficulté de ce type de mesures.

Echelle de hauteur

La spectroscopie du transit primaire permet d’estimer l’échelle de hauteur atmosphérique. Imaginons d’abord que le coefficient d’absorption intrinsèque de l’atmosphère varie avec la longueur d’onde λ, mais pas avec le niveau d’altitude dans l’atmosphère. Si on note sigma(lambda) la section efficace d’absorption à la longueur d’onde λ, l’opacité en visée verticale est tau(lambda;z)=sigma(lambda)*n(z)*H, où n(z) est la concentration de l’espèce absorbante à l’altitude z. Comme le transit sonde les couches au limbe, l’opacité le long de la ligne de visée est multipliée par le facteur géométrique d’augmentation du parcours racine(2*pi*R_p/H) , et vaut donc : tau(lambda;z)~=sigma(lambda)*n(z)*racine(2*pi*R_p*H) On peut montrer que le rayon planétaire effectif à la longueur d’onde λ est égal au rayon de la surface augmenté de la hauteur z(lambda) pour laquelle l’opacité en visée horizontale vaut environ 0.56 : R_(eff)=R_p+z(tau=0.56) Comme n(z) est relié à la concentration n_0 à la surface, selon n(z)=n_0*exp(-z/H), on peut en déduire z(lambda)=H*ln(sigma(lambda)*(n_0/(0.56))*racine(2*pi*R_p*H)) ce qui confirme que l’augmentation du rayon effectif est essentiellement proportionnelle à H (le terme dans le ln variant lentement avec H).

Cette expression montre que la variation du rayon effectif avec la longueur d’onde suit : d*z/d*lambda ~=H*(d*ln(sigma)/d*lambda) Si l’on connaît le mécanisme physique responsable de l’absorption (par exemple, la diffusion Rayleigh où σ varie comme une puissance de λ), la mesure de la variation du rayon effectif avec la longueur d’onde fournit directement la hauteur d’échelle de l’atmosphère H, donc une estimation de sa composition principale si la température peut être estimée indépendamment.

Le raisonnement précédent est valable en première approximation lorsque l’opacité atmosphérique est le fait des brumes, mais l’est moins pour une absorption par les gaz, car celle-ci dépend intrinsèquement fortement de la pression. Ce développement analytique doit donc être remplacé par des modèles numériques. Il n’en reste pas moins vrai que le spectre en transmission montre la planète « plus grosse » dans les bandes d’absorption gazeuse qu’en dehors de ces bandes, et qu’il est alors possible de contraindre la composition chimique (Fig. 7).

Les premières découvertes d’espèces chimiques dans les spectres d’exoplanètes en transmission datent des années 2002-2003 avec la détection d’espèces atomiques (Na, H, et plus tard K, C, O) dans le spectre visible. Le cas de l’hydrogène atomique est particulier car il donne lieu à des transits extrêmement profonds (15%), causés par des atmosphères d’hydrogène très étendues et en échappement rapide. Dans l’infrarouge, dû à la grande difficulté d’extraire les spectres, des controverses ont eu lieu sur la réalité et surtout la quantification des signatures spectrales en termes de paramètres atmosphériques. Il semble toutefois qu’un nombre important de ces spectres montrent les signatures spectrales de H2O, celles de CH4, CO2, et CO étant également présentes sur quelques objets. Une caractéristique très fréquente est le rôle des brumes ou nuages de haute altitude, qui contribuent à l’émission dans le spectre visible et tendent à masquer les signatures des gaz dans l’infrarouge.


Spectroscopie de l'éclipse secondaire

Comme on l’a vu plus haut, l’observation de l'éclipse secondaire permet en principe de déterminer par différence la quantité de radiation que nous envoie une exoplanètes, que ce soit sous forme de lumière stellaire réfléchie ou de rayonnement thermique propre. La difficulté est ici le contraste de luminosité entre la planète et l’étoile.

La profondeur de l'éclipse secondaire s'écrit :delta_ecl ~=k^2 *(I_p/I_e) où I_p et I_e sont les intensités (par élément de surface) émises par la planète et l’étoile et k est le rapport des rayons R_p/R_e.

Dans la composante stellaire réfléchie, juste avant l'éclipse secondaire, la planète – qui présente alors sa face entièrement éclairée – reçoit une fraction (R_e/a)^2du rayonnement I_e de l’étoile, et en réémet une fraction A(lambda)*(R_e/a)^2 où A(lambda)est appelé l’albédo géométrique. Ceci correspond donc à une profondeur de l'éclipse secondaire égale à : A(lambda)*(R_p/a)^2.

Comme A(lambda)<1(et peut être <<1) et que a>R_e(et normalement a>>R_e), ceci implique le résultat intuitif que l'éclipse secondaire est (beaucoup) moins profonde que le transit primaire. Pour un albédo caractéristique de 10%, la profondeur de l'éclipse secondaire dans la composante stellaire réfléchie est de ~10^(-5) pour un Jupiter chaud à 0.05 UA (contre 0,01 pour le transit). Pour une Terre à 1 UA de même albédo, elle vaudrait 2*10^(-10) ! Si elles sont complètement hors de portée dans ce dernier cas, les mesures d’albédo sont possibles pour des Jupiters chauds (voir plus loin les résultats de Kepler) mais requièrent une haute précision photométrique et l’accumulation de nombreuses mesures.

Le contraste devient progressivement moins défavorable dans la composante thermique. Dans ce cas, le rapport I_p/I_e s’écrit comme le rapport des fonctions de Planck aux températures caractéristiques de la planète T_pet de l’étoile T_e. Dans la limite des grandes longueurs d’onde, il tend vers le rapport T_p/T_e. Pour un Jupiter chaud (T_p~unité(1000-1500;K)) autour d’une étoile de type solaire, ce terme n’est plus pénalisant que d’un facteur ~1/6 à ~1/4). Ceci explique l’allure des courbes d'éclipse les plus favorables (cf. Fig. 3). Dans ce cas, il devient envisageable d’effectuer la spectroscopie de l’émission thermique.


Emission thermique de la planète

L’interprétation d’un spectre d’exoplanète dans le domaine thermique est très comparable à celle d’un objet du système solaire. Les paramètres libres sont essentiellement la structure thermique verticale, et les profils de composition qui stipulent la distribution verticale des gaz et des nuages. De manière générale, le rayonnement mesuré satisfait à l’équation dite du transfert radiatif, qui peut s’écrire (en négligeant les phénomènes de diffusion, et en supposant l’atmosphère suffisamment épaisse pour que la surface ne soit pas sondée) : I(lambda)=intégrale((B_lambda)(T(tau))*d(exp(-tau));tau) où I_lambda est l’intensité lumineuse sortante à la longueur d'onde λ, τ est l’opacité verticale intégrée sur la ligne de visée à cette même longueur d'onde, et B_lambda*((T(tau)))est la fonction de Planck à la température T(tau)du niveau atmosphérique d’opacité tau, et où l’intégrale porte sur l’ensemble de l’atmosphère. Essentiellement, l’information sur le profil de température est contenue dans la fonction de Planck, alors que le profil vertical d’opacité contraint la composition chimique.


Comment résoudre l'équation de transfert radiatif

GCM
gcm.png
Résultat d'un GCM
Crédit : M. Turbet, F. Forget

Une méthode dite d’inversion permet en principe de remonter aux deux paramètres, mais il est généralement impossible d’obtenir une solution unique ou même précise, compte tenu de la connaissance préalable très pauvre que l’on a des objets (contrairement aux atmosphères du Système Solaire), et le plus souvent de la qualité très modeste des spectres exoplanétaires (faibles résolution spectrale et signal-sur-bruit). Des contraintes supplémentaires peuvent être injectées pour aider à l’interprétation des spectres. Ainsi, on peut chercher des solutions physiquement cohérentes entre les profils de composition et de température, compte tenu des équilibres chimiques et de condensation entre les différents gaz et les nuages. Une autre complication est qu’on s’attend à ce que les profils atmosphériques présentent des variations horizontales considérables sur la planète (variations jour/nuit notamment), qui ne peuvent évidemment pas être appréhendées à partir d’un spectre planétaire unique.

Une approche alternative moderne est de construire des modèles atmosphériques auto-cohérents à 3 dimensions à l’aide d’outils de type MCG (modèles de circulation générale, GCM en anglais), puis de les tester en regard des observations. Il est aussi fructueux de combiner la mesure de l’émission thermique avec celle du spectre en transmission au moment du transit (cette dernière étant très sensible à la composition atmosphérique mais beaucoup moins aux détails du profil de température), tout en étant conscient que les deux mesures ne sondent pas les mêmes régions de la planète ; à nouveau le passage par un MCG peut s’avérer très utile.

Malgré tout, le plus souvent, au-delà de la présence avérée de certains gaz – H2O essentiellement – les interprétations du spectre d’un objet donné peuvent être diverses, avec des divergences sur les abondances gazeuses (parfois par des ordres de grandeurs), et sur la forme des profils de température – notamment la présence ou non de couches d’inversion (stratosphères).


Courbes de phase

La mesure de la courbe de phase est également une mesure de l’émission thermique d’une exoplanète, mais le focus est alors sur la variation photométrique de cette émission avec la position de la planète sur son orbite. Celle-ci renseigne sur les variations de la température « moyenne » (stricto sensu, la température au niveau d’émission dans l’atmosphère) le long de l’orbite. En général, comme indiqué plus haut, on a ainsi accès aux variations diurnes de température. Dans le cas d’une orbite de forte excentricité, les températures dépendent surtout de la distance à l’étoile, i.e. l’écart au périastre. Dans les deux cas, cela de permet de mesurer la constante de temps radiative de l’atmosphère, i.e. le temps caractéristique de réponse aux variations d’insolation.

Difficulté de la spectroscopie des exoplanètes

A de très rares exceptions près, la spectroscopie atmosphérique requiert une stabilité et une sensibilité qui ne peuvent être atteinte que par des moyens spatiaux. Dans l’infrarouge proche, les meilleurs spectres d’exoplanète en transit et en éclipse secondaire ont été obtenus par le télescope spatial Hubble (instruments NICMOS, STIS et surtout WFC3, couvrant 0.9 – 1.7 microns). A plus grande longueur d’onde, ces spectres ont été complétés par le spectromètre IRS (couvrant 5-14 microns) du télescope spatial Spitzer, alors que les courbes de phases proviennent le plus souvent du photomètre IRAC dans 4 bandes de longueur d’onde (3.6, 4.5, 5.8, 8.0 micron, cf Fig. 3). Dans un futur proche, les observations avec le télescope spatial JWST s'annoncent très prometteuses.


Les missions Corot et Kepler et leurs résultats


Deux missions de photométrie de haute précision

Nous terminerons par une description de deux missions spatiales dédiées (au moins partiellement) à la recherche et l’étude des transits exoplanétaires, et de leurs principaux résultats.


Corot

Corot
satellite-corot.png
le satellite Corot
Crédit : CNES
Courbe de lumière de Corot-7 b
corot-exo7b.png
Crédit : ESA

CoRoT (COnvection ROtation et Transits planétaires), un programme mené par le CNES en collaboration avec l’ESA, a fonctionné de janvier 2007 à décembre 2012. Ce télescope de 27 cm en orbite géocentrique polaire était équipé de 4 détecteurs CCD couvrant un champ d’environ 3.5°. CoRoT a suivi des milliers d’étoiles de magnitude 11 à 16 avec une sensibilité photométrique d’environ 0.01 %. CoRot a permis la découverte de 31 exoplanètes. Parmi celles-ci, on peut relever les cas particulièrement intéressants suivants :


Kepler

Kepler

Nombre d'exoplanètes
transit-fig8.png
Figure 8 : Nombre d’exo-planètes découvertes par année (jusqu’au 10 mai 2016). En bleu clair et ocre, la contribution de Kepler à ces découvertes.
Crédit : à traduire
Exoplanètes candidates de Kepler
transit-fig9a.png
Figure 9a : Candidats planétaires Kepler (en date du 23/07/2015) dans un diagramme période / rayon.
Crédit : à traduire
Taille des exoplanètes
transit-fig9b.png
Figure 9b : Distribution des exo-planètes confirmées en fonction de leur rayon
Crédit : à traduire
Exoplanètes dans la "zone habitable"
transit-fig10.png
Figure 10 : Les 21 planètes de rayon inférieur à 2 rayons terrestres et se trouvant dans la zone habitable. Elles sont placées dans un diagramme montrant l’énergie qu’elles reçoivent de leur étoile (normalisée à celle reçue par la Terre du Soleil) en fonction de la température de l’étoile. Les zones vertes indiquent l’extension probable de la zone habitable selon une estimation prudente (vert clair) et optimiste (vert foncé).

Kepler, une mission du programme « Discovery » de la NASA, a été lancée en mars 2009 et a fonctionné nominalement jusqu’en mai 2013. Malgré des avaries techniques, elle a pu poursuivre son programme exoplanètes après cette date, sous le nom de mission K2. Avec un télescope de 1.4 m en orbite héliocentrique, sa précision photométrique est de 3x10-5, ce qui permet d’atteindre les planètes sub-telluriques, même si de nombreux transits sont nécessaires pour garantir des détections sans ambiguïté. Avec un champ de 115 degrés carrés, Kepler surveille en permanence 150,000 étoiles, pour la plupart de magnitude 14-16, avec une mesure photométrique toutes les 30 minutes. Un traitement automatisé détecte les «candidats », appelés aussi les Kepler Objects of Interest (KOI), i.e. les signaux pouvant indiquer le transit d’une exoplanète, mais qui doivent ensuite être inspectés/validés pour éliminer les faux positifs.

Les résultats de Kepler sont annoncés sous forme de parution régulière de liste de candidats et de planètes confirmées. Le nombre de planètes Kepler confirmées a dépassé le millier en janvier 2015, et a atteint 2325 en mai 2016 (Fig. 8). La majorité est dans la gamme des « super-Terre » (1 à 2 rayons terrestres) et « mini-Neptune » (2 à 3 rayons terrestres) (Fig. 9a, 9b). A ce jour, le nombre total d’exoplanètes confirmées découvertes par la méthode des transits est de l’ordre de 2700 (correspondant à environ 2000 systèmes planétaires), sur un total de 4000 environ. La méthode des transits est devenue, et de loin, la plus prolifique.

Outre la richesse et les études statistiques que permettent ces découvertes, on peut, comme pour CoRoT, relever quelques cas de planètes ou systèmes Kepler remarquables :


Se tester

Auteur: F. Roques

Se tester

Auteur: J.M. Griessmayer

exerciceHD 189733

Temps :

En 2005, il n'y avait que 160 exoplanètes découvertes, la plupart par la méthode des vitesses radiales. La planète HD 189733 a été découverte par François Bouchy et son équipe au cours d'une campagne de recherche associant le spectrographe à fibres ELODIE et une caméra CDD.

Question 1)

La courbe de lumière de HD 189733 montre plusieurs phénomènes. Expliquer à quels phénomènes physiques chaque phase correspond et quels paramètres de la planète ils permettent d'estimer.

A quoi correspond le flux = 1?

Question 2)

L'appliquette montre les données de vitesse radiale de HD 189733. A l'aide des curseurs, retrouvez les paramètres de la sinusoide.

  • v_rest la vitesse radiale de l'étoile
  • v_0est la vitesse radiale du centre de gravité du système
  • a est la demi-amplitude de la sinusoïde
  • t est le temps en Jours Julien
  • T est la période de révolution de la planète autour de l'étoile
  • phi_0 est la phase

v_r = v_0 + a*sin(2*π*((t-2453610)/T) + φ_0)


Projet


Projet : Découverte de WASP-80

Ce projet a pour but de mettre en application tout votre nouveau savoir théorique pour l'appliquer à un cas pratique. Nous allons prendre des données réelles de transit, chercher si une planète s'y cache, et le cas échéant, déduire les paramètres de la planète associée, tels que son rayon et sa période. Vous comparerez alors vos résultats à ceux qui ont vraiment étaient publiés par l'équipe de recherche qui a traité ces données il y a quelques années.

Nous allons analyser des données provenant de SuperWASP qui est composé de 8 télescopes de 11cm chacun, ce qui permet de couvrir presque 500 degrés carrés sur le ciel (i.e. la surface d'environ 2500 pleines lunes à chaque prise). Il y a en fait un SuperWASP au Nord (La Palma) et un au Sud (Afrique du Sud) pour pouvoir couvrir tout le ciel (plus de détails ici ).

Voici les données historiques qui ont mené à la première détection de la planète autour de l'étoile WASP-80 en 2013. Dans ce fichier, vous trouverez les mesures photométriques de l'étoile WASP-80 (située dans la constellation de l'Aigle) à différentes dates. Les 3 colonnes indiquent respectivement la date du point photométrique (en BJD pour Barycentric Julian Date, qui donne le jour julien correspondant à l'observation), la magnitude de l'étoile mesurée à cette date, et l'erreur associée sur la magnitude.


WAST-80 : Les données

exerciceExercice

Nous allons utiliser python pour ce mini-projet. Vous pouvez aussi utiliser votre langage de prédilection si Python ressemble à des hiéroglyphes pour vous.

Question 1)

Commencez par charger le fichier wasp80data.txt qui contient les observations de WASP-80 et faites un graphe représentant la magnitude en fonction du temps, avec les barres d'erreurs associées à chaque point. En python, cela donne :

import numpy as np

import matplotlib.pyplot as plt

bjd, mag, err = np.loadtxt("wasp80data.txt", delimiter=' ', skiprows=1, unpack=True)

plt.errorbar(bjd,mag,err)

Question 2)

On pourrait travailler avec les magnitudes, mais il est plus commun de travailler directement en flux. En effet, un transit produit une baisse du flux total qui provient de l'étoile alors que ça provoque une augmentation de la magnitude et donc on ne verrait pas une baisse mais une croissance de la magnitude lors d'un transit en magnitude. Vous pourrez essayer plus loin de suivre la même procédure en travaillant sur les magnitudes (pour constater que l'on arrive aux mêmes résultats) mais pour le moment on travaillera en flux.

Reproduire le même graphique que précédemment en unité de flux

Que voyons-nous ? Est-ce ce à quoi l'on s'attend ? Voyons-nous un transit ? Pas vraiment ! Ça ne ressemble pas exactement aux courbes théoriques que l'on a vues dans le cours avec une belle chute de flux quand la planète passe devant son étoile. Pour cela il va falloir travailler un peu les données.

Un œil averti se rendra compte que ces données on été pré-traitées. On voit que la magnitude oscille autour de zéro, la composante de magnitude due à l'étoile a donc été retirée. On voit aussi que les données semblent suivre une ligne horizontale, sans qu'il y ait de variations linéaires ou polynomiales. En réalité, quand on obtient les données brutes, c'est beaucoup moins propre que cela, et il faut retirer les effets qui ne sont pas dûs au transit mais plutôt à l'observation en tant que telle. Il peut y avoir des déviations du signal dues à l'instrumentation (par exemple à cause de variations thermiques), ou même des variations de l’atmosphère au cours de l'observation. Il y a différentes méthodes pour réajuster les données afin de corriger ces variations qui ne sont pas dues au transit. De manière générale et simplifiée, cela revient à trouver une fonction polynomiale qui suit au mieux les variations à long terme et de retirer cette fonction du signal. On appelle cela le detrending. Les données que l'on traite ici ont déjà subi ce detrending et peuvent être maintenant exploitées pour chercher un transit potentiel et trouver les paramètres de la planète le cas échéant.


WASP-80 : Les transits

exerciceLa recherche des transits

Que faut-il faire pour essayer de voir un transit dans ces données ?

Ici, on a la magnitude (ou le flux) du système en fonction du temps. Pour pouvoir voir un transit, et c'est là toute la puissance de cette méthode de détection, il va falloir sommer les différents transits potentiels qu'il y a dans ces données. Pour cela, il faut trouver la bonne période sur laquelle sommer les données, et peut-être qu'alors avec une somme de plusieurs transits, on verra effectivement une courbe de lumière typique avec une baisse de flux quand la planète passe devant son étoile.

Question 1)

On peut essayer par exemple de sommer les signaux sur une période de 2 jours. En python cela donne :

from PyAstronomy.pyasl import foldAt

best_period=2#jours

phases = foldAt(bjd, best_period)

sortIndi = np.argsort(phases)

phases = phases[sortIndi]*best_period

mag = mag[sortIndi]

plt.plot(phases, mag)

Question 2)

On ne voit toujours rien. Idéalement, il faudrait pouvoir faire cela pour un très grand nombre de périodes et visualiser le résultat jusqu'à l'obtention potentielle d'une baisse de flux à un endroit de la courbe (i.e. voir le transit). C'est la méthode que l'on va utiliser, mais bien sûr, il est impossible de visualiser des millions de courbes à l'oeil et il faut trouver un bon indicateur que l'ordinateur puisse tester lui-même pour nous dire quand il y a effectivement une baisse de flux visible et donc un transit.

La méthode la plus couramment utilisée dans le domaine de la recherche est la méthode BLS (pour Box Least Square, développée par Kovacs et al. 2002). L'idée est de dire qu'un transit peut être en première approximation modélisé par une fonction porte (fonction rectangulaire). Un transit est en effet bien plus proche d'une fonction porte que d'un sinus ou cosinus car les variations lors de l'entrée ou de la sortie du transit qui peuvent être non rectangulaires ne représentent qu'une petite partie du signal et le reste du transit est plutôt plat. La décomposition en série de Fourier ne fournirait pas une fréquence donnée dominante mais plutôt un ensemble de fréquences alors que la fonction porte ne requiert qu'un terme pour bien modéliser le signal, d'où l'avantage.

On crée alors un modèle simple de fonction porte avec trois paramètres : sa profondeur, sa longueur (durée du transit) et sa phase (la date où le transit a lieu). On fait ensuite tourner le modèle sur un très grand nombre de périodes. Pour chaque période testée, l'algorithme BLS essaye de trouver les meilleurs paramètres (profondeur, longueur, phase) du modèle pour expliquer les observations. L'algorithme compare le meilleur modèle aux données et estime alors la vraisemblance (en log) du modèle en question (par exemple par une méthode des moindres carrés) et crée un périodogramme qui donne la vraisemblance du modèle en fonction de la période. On peut alors voir si certaines périodes paraissent plus vraisemblables que d'autres. Les pics dans le périodogramme indiquent la présence de planètes en transit ou du bruit non pris en compte dans le pré-traitement (detrending). Il faut faire attention aux faux-positifs avec cette méthode et les repérer est un champ actif de recherche dans lequel nous ne rentrerons pas en détails.

Trouvez la période du transit et sa profondeur dans les données de WASP-80.

Question 3)

Vérifiez ces valeurs en sommant les données initiales sur la période trouvée et en affichant le flux en fonction de la phase (vous pouvez utiliser le code de la question 1 ci-dessus pour sommer les différents transits sur une période donnée). Vous produirez aussi une deuxième courbe où vous moyennerez le signal dans des bins temporels d'environ 15 minutes pour avoir une courbe de transit plus lisse.

En faisant ce travail , on trouve le diagramme de la figure ci-jointe. :

Flux stellaire
projet/flux.png
Crédit : Q. Kral

Maintenant, on reconnaît une courbe de transit typique. On peut même zoomer sur la phase de transit pour obtenir la figure ci-jointe.

Transit
projet/zoom.png
Crédit : Q. Kral

On voit alors que la durée du transit totale est inférieure à 0.1 jours, i.e. <2.4h. Pour obtenir la courbe rouge rebinnée en python, on peut écrire un code ad hoc ou procéder ainsi :

from scipy.stats import binned_statistic

bin_means = binned_statistic(phases, mag, bins=300)

bin_means2 = binned_statistic(phases, phases, bins=300)

plt.plot(bin_means2[0], bin_means[0],color='red',linewidth=5)


WASP-80 : La planète

exerciceWASP-80 : Les paramètres de la planète

Déduisez maintenant le rayon de la planète et son demi-grand axe.

Question 1)

Il faudra d'abord trouver le rayon de l'étoile WASP-80 afin de pouvoir déterminer le rayon de la planète.

Question 2)

Le calcul du rayon de l'étoile que l'on vient de mener n'est qu'un calcul approximatif etTriaud et al. (2013) sont capable d'estimer ce rayon plus précisément à partir de leur jeu de données, ils trouvent R_e=0.57*R_s, que l'on utilisera par la suite pour comparer à leurs résultats.

Maintenant on peut déduire le rayon de la planète. En supposant que l'orbite est circulaire, on peut aussi déduire facilement son rayon orbitale à partir de la 3ème loi de Kepler

Question 3)

On peut maintenant comparer aux valeurs trouvées dans le papier originel de Triaud et al. (2013) (tableau ci-joint). On voit que nos valeurs pour R_(pla), la période et le demi-grand axe sont très proches des valeurs originelles.

Paramètres du système WASP-80
projet/Triaud2.png
article Triaud et al. 2013

On peut aussi comparer les valeurs trouvées avec celles de l'encyclopédie exoplanet.eu.

Comme vu dans le cours, on peut faire une première vérification pour tester pour un faux positif, en comparant la durée du transit théorique avec sa durée réelle que l'on a obtenue à la question 3 de la page précédente.


WASP-80 : Pour aller plus loin

Pour aller plus loin vous pouvez aussi essayer d'obtenir plus d'informations à partir des données, par exemple en utilisant, au lieu de la fonction porte, un vrai modèle de transit à la Mandel & Agol (2002) pour pouvoir déduire le paramètre d'impact et une possible excentricité en prenant en compte les effets d'assombrissement centre au bord (il y a une fonction python qui implémente ce modèle ).

Ce dossier(une fois décompressé, le fichier readme.txt décrit les différents fichiers) donne un ensemble de données qui permettent de faire d'autres analyses de cette planète:

Au boulot !


-------------FIN DU CHAPITRE ------------- -------------FIN DU CHAPITRE ------------- -------------FIN DU CHAPITRE -------------

ACCES AU PLAN DES CHAPITRES


Modèles de Circulation Générale

Auteurs: Thomas Navarro, François Forget

Modèles de circulation générale

L'étude des atmosphères des exoplanètes n'est pas uniquement limitée aux observations. On peut en effet faire des découvertes intéressantes au moyen de modèles qui simulent leur atmosphère. Ces modèles sont des outils informatiques complexes bien que reposant sur des lois physiques simples, issus de décennies de recherche dans la modélisation de l'atmosphère de la Terre, puis des planètes du système solaire.

Avant de suivre ce cours, il est conseillé d'avoir suivi les deux cours précédents sur l'atmosphère : dynamique et température.


Découvrir


Les premières idées de modélisation de l'atmosphère

Commençons par dresser une rapide chronologie de l'histoire des modèles numériques qui, bien que spécifique à l'atmosphère terrestre, nous éclaire sur leur démarche de compréhension de la réalité et qui sera reprise plus tard pour les planètes de notre système solaire, puis pour les exoplanètes.

Tout commence avec les développements de la physique des fluides au XIXe siècle, qui permet l'émergence d'un cadre scientifique et rigoureux pour poser les bases de la physique atmosphérique et la compréhension des mécanismes à l'œuvre dans l'atmosphère. Plus précisément, la formulation des équations primitives atmosphériques par Bjerknes en 1904 montre que l'écoulement de l'air dans l'atmosphère est régi par sept équations à sept inconnues. Dès lors, selon Bjerknes, prédire le devenir de l'atmosphère reviendrait à intégrer dans le temps ces équations en les initialisant avec des données provenant de stations de mesures météorologiques

Le problème décrit pas Bjerknes s'avère complexe : on ne sait pas résoudre ces équations analytiquement en raison de leur forte non-linéarité. En 1922, Richardson tente de surmonter ce problème en découpant une zone géographique d'étude en cellules où il intègre les équations primitives en les discrétisant avec la résolution de différences finies. Pour ce faire, les calculs sont résolus à la main, une tâche qui semblerait aujourd'hui bien fastidieuse.

Bien que son intuition et son ambition soient remarquables, son expérience « d'ordinateur humain » échoue à reproduire les résultats espérés de l'écoulement atmosphérique. En effet, son système d'équation ne prenait pas en compte des termes d'ondes atmosphériques à haute fréquence pourtant présentes à l'initialisation du problème, ce qui a conduit à la divergence de la solution. Son expérience ne sera tentée à nouveau qu'après l'avènement de l'ère informatique dans la seconde moitié du XXe siècle.

Decouvrir/richardson.png
On peut voir sur cette page issue d'un travail de Richardson le découpage de l'atmophère en une grille régulière en Europe de l'Ouest. A chaque case correspond une ville se trouvant au plus proche du centre de la case pour mesurer la pression (cases noires) et le vent (cases blanches).
Crédit : Charney 1951 / Google books

Les premiers modèles numériques

En 1948 et 1949, Charney, Fjørtoft et von Neuman réussirent la première prédiction météorologique à l'aide d'un modèle numérique. Pour ce faire ils utilisèrent uniquement l'équation de vorticité pour une atmosphère barotrope, c'est-à-dire supposée homogène, de densité uniforme et sans mouvement vertical. S'ensuivirent quelques années plus tard le premier service de prédiction météorologique en temps réel au moyen d'un modèle numérique par Rossby en 1954.

Ces expériences suggérèrent que l'intégration des équations primitives ne suffisait pas à modéliser toute l'atmosphère. En effet, ces équations sont l'équation de Navier-Stokes et une équation d'état pour l'air, appliquée sur une sphère en rotation. Charney propose de prendre en compte également les phénomènes physiques à plus petite échelle, tels que la condensation de l'eau, les radiations visibles et infrarouges et les flux turbulents de chaleur et de moment. La prise en compte de ces effets, au moyen de paramétrisations, a été depuis et demeure encore actuellement un sujet de recherche majeur dans la modélisation numérique de l'atmosphère.

Un exemple de prédiction atmosphérique
ecmwf.gif
Les prévisions météorologiques s'appuient sur des résultats de simulations de modèles numériques d'atmosphères. L'exemple ci-dessus illustre une prédiction de vent (couleurs) et de pression de surface (contours).
Crédit : ECMWF

L'utilisation des modèles aujourd'hui

Depuis les années 1950, de très nombreux groupes de recherche ont développé des modèles numériques pouvant simuler l'atmosphère de par le monde. Comme on vient de le voir, leur motivation première provient de la volonté de prédire l'écoulement de l'air, ou autrement dit sa circulation. Le nom donné à de tels modèles est MCG, pour Modèle de Circulation Générale, mais on utilise plus communément l'acronyme anglais GCM. Aujourd'hui les applications des GCMs se sont diversifiées : en plus de la prédiction météorologique, on les utilise pour étudier le climat de la Terre et les effets du changement climatique, les climats passés, présents et futurs d'autres planètes (Mars, Vénus, Jupiter, Saturne, Pluton) ou satellites (Titan, Triton) dotés d'une atmosphère dans le système solaire ainsi que du climat d'exoplanètes.

Les observations que nous possédons aujourd'hui sur les exoplanètes ne suffisent pas encore à contraindre précisémment un GCM. En effet, il faudrait une bonne connaissance de leur orbite, rayon, masse, etc ... et évidemment de leur topographie (pour les planètes telluriques) et composition atmosphérique pour être à même de simuler spécifiquement l'atmosphère d'une exoplanète. Le plus souvent, l'utilisation d'un GCM pour modéliser des atmosphères d'exoplanètes tient dans des études assez générales qui nous renseignent sur le comportement d'une atmosphère avec des hypothèses génériques. Toutefois, on constate qu'un nombre grandissant d'études visent à simuler l'état atmosphérique d'exoplanètes connues de la manière la plus fidèle possible afin d'interpréter au mieux les premières observations de leur atmosphère.

Pour l'étude de la Terre, le terme de GCM peut aussi bien faire référence à un modèle qui simule son atmosphère ou ses océans. Le couplage d'un modèle d'océan et d'atmosphère, avec également d'autres modèles pour la surface (hydrologie, végétation, glace d'eau) conduit à l'apparition d'un modèle qu'on qualifie de Global Climate Model, et dont les initiales restent GCM. Le terme de GCM est ainsi utilisé avec ambiguité et peut désigner un modèle d'atmosphère seul, d'océan seul, ou de l'addition d'un modèle d'atmosphère, d'océan et de surface. Les initiales GCM peuvent indifférement vouloir dire Global Circulation Model ou Global Climate Model, mais on préférera le terme de climat à celui de circulation car bien souvent le but d'un GCM est de connaître le climat d'une exoplanète plutôt que sa circulation à un instant donné.

La planète Mars vue par le téléscope spatial Hubble
Decouvrir/mars4_hst_big.jpg
Ces quatre vues de la planète Mars montrent clairement la présence de nuages d'eau dans son atmosphère. Il est possible, grâce à un GCM, de simuler ces nuages et d'en apprendre plus sur leurs caractéristiques.
Crédit : S. Lee, J. Bell, M. Wolff, HST, Nasa

Comprendre


Qu'est-ce qu'un GCM ?

Un GCM (Global Climate Model) est un modèle numérique dont le but est de simuler l'atmosphère d'un corps planétaire. L'ambition est de pouvoir reproduire toutes les observations instrumentales possibles, par exemple la température, les vents, etc ... Le développement d'un GCM n'est jamais finalisé, et les accords aussi bien que les désaccords avec les observations disponibles poussent à améliorer le modèle, ce qui nous permet au passage d'en apprendre toujours plus sur les processus physiques à l'oeuvre dans le système climatique d'une corps planétaire.

Un GCM est basé sur un nombre limité d'équations, qui permet néanmoins d'atteindre un certain niveau de réalisme et de complexité. Il est fondamental de souligner que grâce à l'hypothèse d'universalité des lois de la physique, on arrive à adapter un GCM construit pour la Terre à d'autres corps dotés d'une atmosphère, moyennant un changement de certains paramètres (orbite, taille, composition, etc...), et l'ajout ou le retrait de certains processus physiques spécifiques au corps étudié. Par la suite, les explications sur la structure d'un GCM restent générales et ne sont pas, sauf mention autre, spécifiques à un corps en particulier.

Cette vidéo de l'Institut Pierre-Simon Laplace explique ce qu'est un GCM terrestre appliqué à la modélisation du climat.


Du modèle physique au modèle numérique

Une équation d'une loi physique comprenant une dérivée temporelle et/ou spatiale décrit l'évolution de variables continues avec le temps et/ou l'espace. On peut vouloir résoudre une telle équation au moyen de ressources informatiques, si par exemple sa résolution analytique est impossible ou si on veut l'intégrer à un ensemble plus complexe d'autres lois physiques. Pour ce faire, on procède à une discrétisation du temps et de l'espace, qui consiste à ne plus considérer les axes temporels ou spatiaux comme continus, mais au contraire comme un ensemble fini de valeurs. Ceci permet la discrétisation d'une équation, qui pourra dès lors être résolue par un ordinateur comme dans l'exemple suivant :

On utilise une grille régulière unidimensionnelle dont l'espacement entre deux points consécutifs est \Delta x, qu'on appelle pas spatial. De même, deux instants consécutifs sont espacés d'une durée \Delta t, qu'on appelle pas de temps. On souhaite discrétiser sur cette grille un champ u(t,x) qui est solution de l'équation d'advection : \frac{\partial u}{\partial t} = - c \frac{\partial u}{\partial x} , avec c ayant la dimension d'une vitesse. Pour procéder, on discrétise la variable u en un champ U sur la grille, dont la valeur au j-ième point de la grille au n-ième instant t est notée U^n_j = u(n\Delta t,j\Delta x).

Une manière de discrétiser l'équation d'advection est de l'écrire: \frac{U^{n+1}_{j}-U^{n}_{j}}{\Delta t} = -c \frac{U^{n}_{j}-U^{n}_{j-1}}{\Delta x} . Cette forme s'appelle un schéma amont.

La manière d'écrire les différentielles peut être différente. Ainsi on aurait pu l'écrire sous la forme d'un schéma centré pour la dimension spatiale : \frac{U^{n+1}_{j}-U^{n}_{j}}{\Delta t} = -c \frac{U^{n}_{j+1}-U^{n}_{j-1}}{2\Delta x}.

Ce qu'il faut retenir de cet exemple est que la discrétisation comporte une part d'arbitraire : il faut faire des choix, qui peuvent avoir des conséquences différentes sur la solution numérique finale.

Une équation discrétisée est donc une approximation de la véritable équation. La première question de la discrétisation est de savoir si, pour reprendre l'exemple précédent, le champ discrétisé (U^n_j) va tendre vers le champ analytique u(t,x) lorsque \Delta t et \Delta x tendent vers zéro. La deuxième question est de savoir à quel point la solution obtenue sera une approximation de la solution analytique. La manière de discrétiser puis utiliser une équation est une discipline en soi et il serait vain de vouloir introduire le sujet ici. Il faut juste garder à l'esprit qu'un GCM est un ensemble d'équations discrétisées, et par conséquent une approximation de la réalité. Cette approximation n'est pas du tout rédhibitoire et n'est pas le principal contributeur d'erreur d'un GCM. Toutefois, la discrétisation impose une règle forte sur le dimensionnement du GCM.

Cette règle, appelée condition de Courant-Friedrich-Lévy, repose sur le nombre de Courant : C = \frac{v \Delta t}{\Delta x} avec v la vitesse maximale, \Delta t le pas de temps et \Delta x le pas d'espace. Cette condition stipule que dans un cas simple ce nombre ne doit pas dépasser 1. Autrement dit, on choisit les pas de temps et d'espace tels qu'aucune particule d'air ne traverse plus d'une parcelle géométrique en un pas de temps. En pratique, l'utilisation de plusieurs équations dans un modèle, ainsi que l'utilisation de techniques de discrétisation plus poussées, font que cette simple condition n'est pas la seule à prendre en compte. Toutefois, cette condition demeure une limite forte et on aura toujours C \le 1 dans un GCM.


Structure d'un GCM

La structure d'un GCM peut se décomposer en "briques" indépendantes qui communiquent entre elles. Du fait de l'universalité de ces équations, la nature de ces briques est la même quel que soit le corps étudié. La structure d'un GCM est en général composée des briques suivantes :

  1. Un "coeur" hydrodynamique
  2. Un transfert radiatif
  3. Une paramétrisation de la convection et de la turbulence à une échelle non résolue par le coeur hydrodynamique
  4. Un modèle thermique pour la surface et la sous-surface
  5. Un modèle d'évolution des nuages et aérosols

Étant donné que l'atmosphère est fortement stratifiée à grande échelle en vertu de l'équilibre hydrostatique, les longueurs caractéristiques horizontales et verticales ne sont pas les mêmes. Ceci permet de découper le GCM en deux parties différentes :

La première, appelée « dynamique », est le coeur hydrodynamique. Dans cette partie on calcule l'écoulement du fluide qu'est l'air autour d'un corps sphérique planétaire. Elle consiste en l'implémentation des équations primitives et calcule la circulation atmosphérique. A un niveau vertical donné, les mouvements sont uniquement horizontaux. Le terme de "coeur" provient du fait que la partie dynamique sert à propager les mouvements à l'échelle horizontale, laquelle échelle domine la circulation globale de l'atmosphère.

La seconde, appelée « physique », rassemble tous les autres processus physiques à l'œuvre dans l'atmosphère sous forme de paramétrisation. Cela correspond donc au moins aux briques 2 à 5, mentionnées ci-dessus. La partie physique est une colonne verticale d'atmosphère : il s'agit d'un même modèle unidimensionnel démultiplié autant de fois qu'il existe de points dans la grille horizontale (donc dynamique) du modèle.

Les colonnes de la partie physique sont indépendantes les unes des autres et ne communiquent que via la partie dynamique par des mises à jour de pression, températures, vents et traceurs. On peut également voir la situation dans le sens inverse : la partie dynamique consiste en des couches sphériques imbriquées les unes dans les autres qui ne communiquent que via la partie physique.

Ce découpage en deux parties permet de faire appel à la partie physique moins souvent qu'à la partie dynamique, car les processus physiques en jeu ont des temps caractéristiques différents et donc des pas de temps d'intégration différents. Typiquement, on utilise la partie physique tous les 10 à 20 utilisations de la partie dynamique.

Structure d'un GCM
Comprendre/interfacedynphy.png
Ce schéma illustre le principe de fonctionnement et l'interface des parties physique et dynamique d'un GCM.
Crédit : LMD

Partie dynamique


Discrétisation horizontale

Un GCM consiste en la discrétisation du temps en des instants régulièrement espacés (typiquement de l'ordre de la minute pour une planète comme la Terre) et en la discrétisation d'un espace tridimensionnel qu'on suppose être une sphère d'épaisseur mince. Il existe deux grandes manières de discrétiser la sphère pour les champs atmosphériques. La première consiste à placer un certain nombre de points pour recouvrir la sphère, dans une méthode qu'on appelle différences finies. La deuxième consiste à discrétiser non pas en coordonnées géométriques, mais en coordonnées spectrales : les champs atmosphériques sont décomposés en harmoniques sphériques et tronqués au-delà d'une certaine harmonique. Dans ce dernier cas, il est nécessaire de faire la transformation des variables atmosphériques de l'espace fréquentiel vers l'espace géométrique avant l'appel à la partie physique et inversement.

En utilisant la méthode des différences finies, on peut trouver plusieurs façons de découper une sphère. Dans le cas d'une grille latitude-longitude, la dimension horizontale est tout simplement découpée en longitudes et latitudes également espacées, ce qui produira un point singulier à chaque pôle. Afin d'éviter ce problème on peut utiliser un découpage dit cube sphère, qui consiste en la projection d'un cube discrétisé sur la sphère, et donnera 8 points singuliers au lieu de deux dans le cas d'une grille latitude-longitude, mais qui seront plus simples à gérer. On peut également s'affranchir de tout point singulier au moyen d'un grille icosahédrique qui utilise des triangles pour couvrir la sphère. On peut imaginer d'autres manières de procéder, mais ces trois là constituent l'immense majorité des GCMs.

Le nombre et l'emplacement des points dans les dimensions horizontale et verticale restent fixés lors de l'exécution du programme informatique. Il est possible d'utiliser une résolution qui s'adapte aux conditions atmosphériques à un moment donné, mais cette particularité est encore (en 2017) peu répandue parmi les GCMs, et induit des complications qui font qu'on considérera que la résolution est fixée pour le reste de ce cours. On utilise le terme de résolution pour parler de la quantité de points utilisés dans la discrétisation spatiale. Ce terme s'utilise aussi dans le cas d'une discrétisation spectrale, et il correspond au nombre de modes employés dans la représentation des champs atmosphériques.

La résolution spatiale d'un GCM va typiquement de quelques centaines de kilomètres jusqu'à quelques milliers de kilomètres. Ce qui se passe en dessous de cette échelle n'est pas directement représenté. S'il s'avère nécessaire de tenir compte d'un processus qui se déroule à une échelle plus petite, une paramétrisation de ce processus est nécessaire, et est généralement intégrée dans la partie physique du modèle.

latlongrid.jpg
Grille latitude-longitude. Les pôles sont des points singuliers qu'il convient de traiter de manière particulière lors de la discrétisation des équations primitives sur cette grille.
Crédit : MITgcm
cubedsphere.png
Grille cube sphère. Chaque face d'un cube, déjà découpée, est projetée sur une sphère de même centre.
Crédit : Bruno Luong
icosahedron.png
Grille icosahédrique. Chaque triangle peut être individuellement redécoupé en plus petits triangles.
Crédit : Sadourny et al. 1969
spectral.gif
Discrétisation spectrale. On décompose chaque champ atmosphérique en harmoniques sphériques. L'avantage est d'éviter tout point singulier, mais il faut sans cesse faire la conversion sur une grille découpée spatialement, comme les trois autres évoquées ici, pour faire le lien avec la colonne physique. On voit ici à quoi correspondent les 21 premiers modes.
Crédit : Benoit Moser. Lesia.

Le cœur dynamique

Le cœur hydrodynamique ou plus simplement partie dynamique d'un GCM consiste en la discrétisation des équations primitives sur la grille horizontale. Le but de la partie dynamique réside essentiellement dans le calcul des vents, de la température, ainsi que du transport des traceurs. En général, plusieurs approximations sont faites dans ces équations qui nous viennent de l'étude de l'atmosphère terrestre, et qui doivent être remises en cause lorsqu 'appliquées à une autre atmosphère :

Ainsi, le cœur hydrodynamique d'une planète autre que la Terre nécessite des adaptations et des généralisations par rapport à ce qui se fait depuis plus d'un demi-siècle dans le domaine de la modélisation terrestre. L'étude des planètes du système solaire a permis de mieux cerner ces généralisations, qui aujourd'hui s'appliquent aux exoplanètes.


Partie physique


Discrétisation verticale

On a vu qu'il existe différents types de discrétisation horizontale dans la partie dynamique. La discrétisation verticale pour la physique peut également varier d'un GCM à l'autre.

En général la dimension verticale, c'est-à-dire du bas vers le haut, fait intervenir la pression comme coordonnée naturelle plutôt que l'altitude. En effet, les dimensions horizontales d'un GCM sont telles que l'équilibre hydrostatique (voir ici) est toujours respecté, les fluctuations de pression autour de cet équilibre ne peuvent pas être représentées à l'échelle d'un GCM. Dès lors, la pression diminue de manière monotone avec l'altitude et constitue un système de coordonnées naturelles, d'autant plus qu'en vertu de l'équilibre hydrostatique, il existe un lien direct entre la pression et la masse d'atmosphère située au-dessus.

Le nombre de niveaux verticaux est de l'ordre de quelques dizaines, typiquement entre 20 au minimum pour représenter la circulation et 100 pour un modèle très résolu s'étendant très haut en altitude. À mesure que l'on monte en altitude, les niveaux sont de plus en plus espacés.

Ainsi, s'il arrive qu'à une altitude donnée la pression varie avec le temps, les niveaux verticaux suivront de fait cette variation. Pour les planètes telluriques, la topographie contrôle en grande partie la pression de surface, et il existe une représentation hybride qui tient compte de la topographie dans les plus basses couches de l'atmosphère, tout en se basant sur les niveaux de pression à plus haute altitude.

La question des limites du domaine représenté ne se pose par pour la grille dynamique, car elle représente une sphère. Pour la physique, l'extension verticale requiert de poser une limite en bas et en haut. La surface sert de limite dans le bas de l'atmosphère, et on impose les flux de masse verticaux en haut et en bas comme étant nuls. Ceci nécessite pour la limite haute la mise en place d'une couche-éponge pour éviter la réflection non réaliste d'ondes atmosphériques sur le plus haut niveau du modèle.

Grille/levels2.png
La discrétisation verticale en niveaux de pression ne tient pas compte de la topographie des planètes telluriques. Dans les plus basses couches de l'atmosphère, on peut utiliser une correction utilisant la pression de surface de manière progressive avec l'altitude .

Transfert radiatif

Le transfert radiatif dans un GCM est une paramétrisation qui vise à calculer l'impact du rayonnement sur l'atmosphère. In fine, le rayonnement donne lieu à des taux de chauffage ou de refroidissement de l'air, qui varient spatialement et temporellement. Le transfert radiatif est un point crucial pour le réalisme d'un GCM. En effet, il est le moteur de la circulation atmosphérique qui, en provoquant des gradients de température à l'échelle globale, va forcer tous les mouvements à grande échelle.

Le taux de chauffage ou de refroidissement atmosphérique provient de l'interaction entre d'une part le rayonnement et d'autre part deux entités :

Pour compliquer les choses, le connaissance du rayonnement lui-même dépend de ces deux entités. En haut de l'atmosphère, le rayonnement provient bien entendu de l'étoile. Dans l'atmosphère, ce rayonnement provient à la fois de l'étoile, en ayant été en partie absorbé ou diffusé par les gaz et les aérosols, et à la fois des gaz et aérosols eux-mêmes par émission thermique.

Il existe trois types de méthodes pour calculer le transfert radiatif à travers des gaz dans un GCM. Elles nécessitent avant tout une bonne connaissance du spectre du mélange de gaz présent dans l'atmosphère. Ce spectre est obtenu au moyen de simulateurs spécifiques, et vaut pour une température, une pression et une composition atmosphérique données. On pourrait d'abord naïvement tenter de calculer la contribution de chaque longueur d'onde au bilan radiatif global, mais c'est en pratique impossible car un tel calcul prendrait trop de temps pour les besoins d'un GCM. Au lieu de cela, il faut faire des simplifications. La plus simple est d'utiliser un modèle par bandes, dans lequel le flux radiatif est moyenné sur différents intervalles de longueurs d'onde. Une amélioration de cette méthode, appelée puissance nettes échangées, consiste à ne pas considérer les flux radiatifs du rayonnement, mais les échanges entre chaque niveau vertical de la colonne physique du GCM. Enfin, la méthode des distributions k-corrélées consiste à classer les lignes d'absorption du spectre par intensité croissante, puis à les interpoler par une fonction analytique. On passe ainsi de données spectrales très précises mais en nombre important et donc difficilement exploitables, à une approximation décrite par quelques paramètres et rapide en utilisation.

Le transfert radiatif des aérosols nécessite de connaître leur taille et leur composition afin de paramétriser leur effet sur la température atmosphérique. On peut employer les techniques précédemment décrites pour les gaz. Une technique largement employée est la division en bandes dans le spectre visible et infrarouge.

Pour aller plus loin, un GCM martien développé par la Nasa fournit une documentation sur le transfert radiatif d'un modèle.

spectre.png
Une portion du spectre en absorption de l'air martien. On ne peut pas utiliser explicitement chaque ligne d'absorption dans le code radiatif. Un tel spectre doit être simplifié.
Crédit : Mischna, Lee, Richardson 2012

Convection et turbulence

Certains processus de mélange de l'air interviennent à des échelles plus petites que celles résolues par la dynamique. Ces processus sont essentiellement la convection, qui peut se structurer en cellules de plusieurs de kilomètres, et la turbulence, qui agit depuis les échelles microscopiques jusqu'à quelques dizaines de mètres.

Une méthode simple pour représenter la convection consiste à utiliser un modèle dit d'ajustement convectif, qui va corriger le profil vertical de température vers un profil adiabatique stable. Autrement dit, on force la température potentielle à être constante là où le profil est instable. Bien que ce soit effectivement ce que la convection produit à grande échelle, un tel modèle ne tient pas compte des ascendances et descendances verticales dans la couche limite planétaire. De nouveaux modèles, appelés flux de masse, donnent une paramétrisation des mouvements d'air dans une parcelle physique de GCM. On peut ainsi tenir compte de la variation de densité de l'air si une espèce condense, ce qui va générer des mouvements verticaux.

La turbulence est le mouvement chaotique de l'air en dehors du régime laminaire. On en tient compte avec une paramétrisation qui donne l'effet des mouvements turbulents à grande échelle. Ceci est particulièrement pertinent pour les mouvements proche du sol, où la différence de température entre la surface chauffée par le soleil et l'atmosphère crée de la turbulence pendant le jour.

convection.jpg
Ce schéma représente les flux de masse convectifs tels que paramétrisés dans un GCM. w : vitesse verticale. Le flux de masse f dépend de l'ascension a (depuis la surface) et e (au dessus), ainsi que de la descendance d.
Crédit : Rio et Hourdin, 2008

Surface et sous-sol

Les planètes telluriques possédent une surface solide ou liquide avec laquelle l'atmosphère est en interaction. Ces interactions se font au travers des flux radiatifs (provenant de l'étoile, de l'atmosphère et de la surface), du transfert de chaleur entre l'air et la surface par convection, et la libération de chaleur par changement de phase d'un solide ou d'un liquide à la surface (typiquement, la condensation de la vapeur d'eau). La surface planétaire joue donc un rôle important dans le forçage de l'atmosphère à sa base.

La diffusion de chaleur dans le sous-sol joue un rôle à la surface, et il est nécessaire d'en tenir compte. Ainsi, de nombreux GCMs possèdent un modèle de sous-sol pour l'équation de diffusion de la chaleur, divisé en niveaux verticaux de plus en plus profonds (jusqu'à typiquement quelques mètres), de la même manière que l'atmosphère est représenté en niveaux verticaux de pression. Chaque niveau vertical a des propriétés qui dépendent des caractéristiques supposées du sous-sol.

Certains corps peu irradiés, comme Pluton et Triton, voient leur atmosphère dominée de manière importante par la surface et le sous-sol. Pour ces exemples, la chaleur stockée dans le sous-sol met plusieurs siècles à être restituée à la surface, ce qui nécessite une initialisation méticuleuse du modèle de sous-sol.

Cette approche de modélisation du sous-sol convient également dans le cas d'un océan liquide. Toutefois, un plus grand réalisme requiert de prendre en compte la circulation océanique, ce qui peut se faire grâce au couplage avec un modèle d'océan dédié.

Un GCM de planète gazeuse ne modélise évidemment pas la surface. Il se contente de représenter l'atmosphère jusqu'à une certaine pression, et utilise un forçage de flux radiatif, tout en imposant les flux verticaux de masse à zéro.

Comprendre/PhoenixIce.jpg
Image du sol martien transmise par la sonde Phoenix. On peut voir que le souffle des tuyères a mis à jour de la glace d'eau enfouie sous le sol. Cette glace est présente sur des portions importantes de Mars et possède une inertie thermique élevée qui doit être prise en compte dans un GCM.
Crédit : Marco di Lorenzo, Kenneth Kremer, Nasa / JPL / UA / Max Planck Institute / Spaceflight

exerciceExercice

Difficulté : ☆☆☆  

L'équation de diffusion de la chaleur unidimensionnelle dans le sous-sol est donnée par C \frac{\partial T}{\partial t} = \frac{\partial}{\partial z} \left[ \lambda \frac{\partial T}{\partial z} \right] avec C la capacité thermique volumique et \lambda la conductivité thermique du matériau. On veut simuler au moyen d'un GCM une planète dont la surface est recouverte d'une épaisse couche de glace.

On prendra pour C une valeur de 2 J.cm-3.K-1 et pour \lambda une valeur de 2.4 W.m-1.K-1, et on supposera les propriétés de la glace constantes et homogènes sur toute la planète.

Question 1)

Sachant que sur cette planète une année dure 150 jours terrestres, quelle doit-être est la profondeur minimale du modèle de sous-sol ?

Question 2)

Comment faut-il espacer les niveaux verticaux du modèle de sous-sol ?


Aérosols et nuages

On a vu à quel point les aérosols jouent un rôle important en raison du transfert radiatif. Au-delà de leur impact sur les températures, leur étude en soi nous permet de mieux comprendre comment certaines espèces sont transportées à grande échelle et se déposent en surface.

Un aérosol est transporté horizontalement par la dynamique en tant que traceur. Dans la partie physique, on cherche à comprendre, en plus de leur effet radiatif, comment ils vont se former et se répartir sur l'axe vertical. Pour cela, on doit disposer d'une modélisation qui nous permette de calculer les tailles des particules des aérosols. Cette taille peut être établie de manière empirique, ou calculée à partir d'équations décrivant les processus de changement de phase.

Ces aérosols peuvent servir de noyaux de condensation (ou CCN) sur lesquels peuvent venir se condenser certaines espèces gazeuses, pour ensuite former des nuages. C'est par exemple le cas avec la formation de nuages d'eau (sous forme de cristaux de glace ou de gouttelettes liquides) sur Terre ou encore de nuages de glace de dioxyde de carbone (CO2) sur Mars. Sur certaines exoplanètes, on a même par exemple observé des nuages de chlorure de potassium ou de sulfure de zinc. Comme nous l'enseigne si bien la Terre, les nuages ont un rôle essentiel sur le bilan radiatif des planètes.

Lors d'un changement de phase (gaz solide/liquide), la libération de chaleur latente doit également être prise en compte. La prise en compte de cet effet est notamment critique pour un GCM terrestre, étant données les grandes quantités d'eau pouvant s'évaporer ou se condenser dans l'atmosphère de notre planète. C'est par exemple un point clé pour comprendre l'échange de chaleur des basses vers les moyennes latitudes terrestres.

En pratique, la discrétisation d'un GCM repose sur des cellules de grande taille, qui représentent l'état moyen de l'atmosphère en leur sein. Pour représenter l'effet radiatif des nuages dans l'atmosphère d'une planète, il faut calculer proprement la fraction nuageuse dans chaque cellule du GCM, c'est-à-dire calculer la proportion (de la surface horizontale) de cette cellule où se trouve les nuages. Il existe un certain nombre de techniques plus ou moins sophistiquées qui permettent de traiter ce problème de recouvrement, mais cela dépasse le cadre de ce cours.

Comprendre/marsclouds.jpg
Des nuages de cristaux d'eau dans l'atmosphère de Mars vus par la sonde Phoenix.
Crédit : Wikipédia
venusclouds.jpg
Ce cliché pris par la sonde Mariner 10 montre l'épaisse couche de nuages composée principalement d'un mélange H2SO4-H2O qui recouvre l'intégralité de Vénus.
Crédit : Nasa

Quelques spécificités

À titre d'exemple, voici quelques spécificités propres à plusieurs corps planétaires, qui sont autant de "briques" à ajouter dans la partie physique :


En pratique

En pratique, un GCM est un programme informatique qui exécute des instructions résumées dans un code écrit dans un certain langage. En général, les modélisateurs optent pour le langage Fortran car il possède de nombreuses librairies mathématiques, est rapide dans l'exécution du programme généré, et on peut miser sur l'héritage de modèles plus anciens qui utilisaient eux aussi le Fortran il y plusieurs décennies. Un GCM cumule au minimum des dizaines de milliers de lignes de code et requiert un investissement conséquent pour être développé et mis à jour.

code.png
Un exemple de code informatique en langage Fortran tel qu'utilisé dans la programmation d'un GCM. On voit ici la portion du programme où on a recours à la brique physique dont les tendances sont transmises à la brique dynamique.
Crédit : LMD

Le temps de simulation est également un paramètre important à prendre en compte : on ne peut pas faire le même type d'étude selon qu'une simulation dure 5 minutes ou 5 mois. Dans le premier cas on peut par exemple envisager un nombre très important de simulations pour explorer la sensibilité du modèle à de multiples paramètres, tandis que dans le second cas la simulation sert de réference qui sera analysée en détail et on évitera à tout prix une erreur en amont, avant l'exécution du modèle. Il serait difficile de donner un chiffre typique sur le temps de simulation, étant donné qu'il dépend des ressources informatiques et de la résolution, du pas de temps, et de la configuration du modèle. Toutefois, afin de donner un ordre de grandeur, on peut avancer un rapport pouvant varier dans la plupart des cas de 100 à 10 000 entre le temps simulé et le temps réel d'exécution d'un GCM.

exerciceExercice

Difficulté :   

Cet exercice a pour but d'estimer la taille d'un fichier de sortie d'une simulation de GCM. Considérons un exemple représentatif : on simule une planète dont le jour solaire est de 24h et l'année dure 100 jours. La grille utilisée est de type latitude-longitude, avec respectivement 48 et 64 points dans ces dimensions, et 20 niveaux verticaux.

Question 1)

Combien de points la grille contient-elle au total ?

Question 2)

On souhaite pourvoir étudier la circulation atmosphérique. Combien de variables utiliseriez-vous ?

Question 3)

Les variables sont écrites dans le fichier de sortie 6 fois par jour pour bien représenter le cycle diurne. Une valeur est représentée au moyen de 4 octets. Quelle est la taille informatique d'un fichier de sortie pour une année de simulation ? Qu'en pensez-vous ?


Utiliser un GCM chez soi

Il existe des dizaines et des dizaines de GCM différents de par le monde, utilisés avec des buts parfois différents. Un moyen simple d'utiliser soi-même un GCM est d'utiliser une version simplifiée, développée à des fins éducatives ou de validation. Leur prise en main est plus simple et plus rapide qu'un GCM classique, bien qu'il faille également y consacrer un certain temps pour installer, utiliser et interpréter le modèle. On peut citer :


Autres types de modèles

De manière plus générale, il existe toute une hiérarchie de modèles numériques de climat qui permettent de simuler l'atmosphère des planètes. Par exemple, les modèles Mésoéchelle ou LES (pour Large Eddy Simulation) et modèles CRM (pour Cloud Resolving Model) permettent de simuler l'atmosphère à des échelles beaucoup plus fines que les GCM, afin de modéliser toutes les processus dynamiques et physiques qui y opèrent (par exemple la convection).

Ces types de modèles (Mésoéchelle, LES, CRM) sont très coûteux en temps de calcul du fait de leur résolutions spatiale et temporelle plus fines qu'un GCM. On les utilise généralement dans une région spécifique de la planète, pour comprendre et quantifier des mécanismes physiques qui ne peuvent pas être résolus par les GCMs. Ces types de modèles sont donc généralement utilisés de manière complémentaire aux GCMs, par exemple pour fournir des paramétrisations physiques de processus sous-maille aux GCMs.


Se tester


QCM 1

Lien ici

qcmQCM

1)  Que signifient les initiales GCM ?




qcmQCM

1)  Pourquoi utilise-t-on un GCM pour simuler l'atmosphère des exoplanètes ?




2)  Usuellement, comment appelle-t-on les deux constituants majeurs d'un GCM ?




QCM 2

qcmQuestion de cours

1)  Pourquoi appelle-t-on plus souvent la partie dynamique que physique ?



2)  L'ordre de grandeur de la résolution horizontale d'un GCM est de :






3)  Quel est la grandeur utilisée pour l'échelle verticale d'un GCM ?




4)  Dans un GCM, le transfert radiatif est :




Exercices

exerciceExercice

Question 1)

Vous oubliez de brancher la physique dans votre GCM de planète tellurique. Que peut-il se passer au niveau des résultats ?

exerciceExercice

Question 1)

Vous avez un modèle de dimension N_longitude x N_latitude et vous passez 2N_longitude x 2N_latitude. Que faut-t-il faire pour respecter la condition CFL ? A priori, par combien sera multiplié le temps de calcul ?

Question 2)

On souhaite simuler avec un GCM une atmosphère de diazote pour une planète d'un rayon de 6000 km. On sait par ailleurs, en considérant le flux radiatif de l'étoile et sa distance à la planète, que la température maximale dans cette atmosphère n'excèdera pas 400 K. On demande à un étudiant d'effectuer une première simulation de cette atmosphère. L'étudiant propose d'utiliser une grille latitude-longitude avec 100 points en longitude et 100 points en latitude et un pas de temps dynamique de 20 minutes. On lui répond que sa simulation échouer. Pourquoi cela ?


Mini Projet


GCM en ligne

Ce mini projet vise à prendre en main un GCM à partir de résultats de simulations et d'une interface dédiée. On se propose pour cela de voir la sensibilité d'un GCM, et tout particulièrement la circulation atmosphérique, à la période de rotation et à la taille d'une planète.

La configuration du modèle est la suivante :

On se propose de voir la sensibilité de ce GCM à la période de rotation et à la taille de la planète. Pour ce faire, on utilise 3 rayons et 6 périodes de rotations différentes, formant donc un total de 18 simulations. Les variables disponibles en sortie sont :

complementPour aller plus loin

Le mini-projet se poursuit avec le cours sur la dynamique atmosphérique.


Analyse des simulations

Pour chaque simulation, 60 pas de temps ont été stockés, avec une écriture de 1m 20s entre deux pas de temps :

exerciceExercice

Question 1)

Calculer le temps nécessaire pour effectuer une simulation.

Question 2)

Le coefficient de super-rotation est le rapport entre le vent zonal et la vitesse du sol due à la rotation de la planète. Comment exprime-t-on ce coefficient en fonction du vent et des caractéristiques de la planète ?

Question 3)

Calculer la taille occupée sur le disque par toutes les simulations.

Question 4)

Le calcul a été effectué grâce à un processeur cadencé à 3.6 GHz. Donner des arguments qui expliquent pourquoi les simulations ont été précalculées avant que vous ne les utilisiez. Quel est l'inconvénient ?

Un rappel newtonien a été utilisé pour simuler la partie physique. Cela consiste, à chaque appel à la physique, à relaxer le champ de température vers une température de référence imposée T_{ref}. On utilise la formulation donnée par Held & Suarez, Bulletin of the American Meteorological Society, vol. 75 , N°10, Octobre 1994. Le terme correctif est :

\left( \frac{\partial T}{\partial t}\right)_{phy} = \left( \frac{\partial T}{\partial t}\right)_{dyn} - k_T(T-T_{ref})

avec k_T un coefficient de rappel dépendant de la latitude \theta et de la coordonnée hybride \sigma = \frac{p}{p_s} (où p est la pression et p_s la pression de surface). La loi pour T_{ref} et k_T est :

T_{ref}(\theta,\sigma) = max \left[ 200, \left( 315 - 60\sin^2\theta -10 \ln (\sigma) \cos^2\theta \right) \sigma^\frac{2}{7}\right]

k_T(\theta,\sigma) = \frac{1}{40} + \frac{9}{40} max \left( 0,\frac{\sigma-0.7}{1-0.7} \right) \cos^4\theta

exerciceExercice

Question 1)

Analyser l'expression de la température de référence T_{ref} : comment varie-t-elle avec la latitude et l'altitude ?

Physiquement, à quoi correspond T_{ref} ?

Question 2)

Analyser l'expression du coefficient de rappel k_T : comment varie-t-il avec la latitude et l'altitude ?

Pourquoi le rappel dépend-il ainsi de la latitude et de l'altitude ?

Question 3)

Comment sont représentés les jours et les saisons dans un GCM utilisant ce rappel newtonien ?

À quoi correspond la variable temporelle ?

Question 4)

Comment est modélisée la surface ?

Question 5)

Selon vous, pour quelles raisons utiliser ce rappel en lieu et place d'une physique plus complète ?


Exploration des données

Il s'agit de prendre en main les données et de se familiariser avec l'exploration de champs de 2 à 6 dimensions.

methodeManuel de l'utilisateur

L'interface de GCM en ligne permet d'afficher une variable du GCM. Chaque variable possède au plus 6 dimensions, tandis qu'une figure comporte 1 à 3 dimension(s) (une dimension suivant l'axe des abscisses obligatoirement, une dimension suivant l'axe des ordonnées, et une dimension temporelle pour le défilement). En effet, un être humain peut difficilement appréhender un jeu de données à plus de 3 dimensions d'un seul coup d'oeil. Pour visualiser une variable il s'agit donc de réduire le nombre de dimensions d'une variable. Pour cela on choisira, sur une à plusieurs dimensions, une valeur ou une moyenne sur un intervalle de valeurs.

DimensionsNombre de valeursValeursRemarquesVariables
TempératureVentsPression de surfaceFlux de masseSuper-rotation
Période de rotation65h - 10h - 24h - 72h - 240h - 2400hChaque valeur correspond à une simulation différenteXXXXX
Rayon de la planète30.5, 1 et 2 rayons terrestresXXXXX
Latitude48-90° à 90°Vu le grand nombre de points, l'interface sélectionne la valeur la plus proche du curseur de la régletteXXXXX
Longitude64-180° à 180°XXXX
Altitude151 bar à 0.5 mbarValeurs suivant une décroissance logarithmiqueXXXX
Temps600 à 60 unitésXXXX

exerciceExercice

Question 1)

Afficher la température et la pression de surface au niveau du sol, puis à d'autres altitudes à un instant donné ou en faisant défiler les instants sur un intervalle de temps. Comment évolue le champ de pression de surface en demandant différentes altitudes ? Pourquoi ?

Question 2)

Afficher un profil vertical de température à l'équateur.

Question 3)

Afficher le champ de température et la pression de surface en moyenne zonale, puis la température et le vent zonal. Que remarquez-vous ? Pourquoi ?

Question 4)

Un diagramme de Hovmöller permet de visualiser la propagation d'ondes, en affichant un champ en fonction du temps et de la longitude ou latitude. Faire un tel diagramme sur le champ de votre choix et estimer la ou les période(s) des ondes présentes.

Question 5)

Afficher la température en fonction de la latitude et de la vitesse de rotation, à une altitude donnée et en moyenne zonale.

Question 6)

Afficher la pression de surface en fonction de la vitesse de rotation et du rayon de la planète.


-------------FIN DU CHAPITRE -------------FIN DU CHAPITRE -------------FIN DU CHAPITRE -------------FIN DU CHAPITRE -------------

ACCES AU PLAN DES CHAPITRES


Exoplanètes : Statistique et probabilités

Auteur: Sylvain Fouquet

Exoplanètes : Statistique et probabilités

Dans la recherche des exoplanètes, une question passionne les astrophysiciens et bien plus encore le reste de l'humanité : y a-t-il de la vie sur une autre planète ? La Terre prouve qu'un certain type de vie basée principalement sur le carbone peut exister. Reste à savoir si les processus ayant permis l'émergence de cette vie sur la Terre ont pu se produire sur une autre planète. La question de la vie extraterrestre ne se pose pas en terme de possibilité mais en terme de sa probabilité, de sa fréquence d'apparition.

La première partie de ce cours utilise les propriétés des exoplanètes pour faire découvrir la statistique, cet outil mathématique indispensable dans les sciences et en particulier en astronomie. La seconde partie du cours généralise et clarifie les notions mathématiques importantes du point de vue des probabilités. La troisième partie met à disposition des séries d'exercices pour tester les connaissances. Enfin la dernière partie est un test des connaissances mêlant statistiques et probabilités, mêlant cours et observations.

Dans la première partie des cours, des valeurs statistiques concernant la population des exoplanètes sont données pour illustrer les concepts présentés. Le nombre d'exoplanètes augmentant très rapidement, les paramètres statistiques évoluent aussi. Les valeurs actualisées peuvent être calculées à partir du catalogue.

Ce cours s'adresse à des étudiants de niveau L1 et plus. Il ne requiert aucune connaissance sur les probabilités ou la statistique.


Statistique des exoplanètes

Auteur: Sylvain Fouquet

Introduction

Planètes du système solaire
Carte_systeme_solaire.jpg
Planètes et planètes naines (encadrées sur fond marron) découvertes dans le système solaire.
Crédit : http://mash.wifeo.com/astronomie.php

Cette première partie du cours s'intéresse à la statistique à travers le cas particulier des exoplanètes. Cet outil mathématique sert à extraire de l'information de grands échantillons de mesures. Les concepts statistiques décrits ici pour les exoplanètes sont généralisables dans d'autres cas. La statistique découle naturellement de questions scientifiques telles que "combien y a-t-il de planètes dans notre galaxie ?" ou encore "quelles masses ont elles ?" ou "quelles sont leurs distances à leurs étoiles hôtes ?". Ces questions sont déterminantes pour comprendre la formation et l'évolution des planètes et pour aider à la recherche d'une vie extraterrestre.

Avant les années 90, la connaissance sur les planètes se limitait aux neuf planètes du système solaire, Mercure, Vénus, la Terre, Mars, Jupiter, Saturne, Uranus, Neptune, Pluton. L'étude des exoplanètes n'existait pas faute d'observation. Il semblait cependant probable que d'autres planètes existaient autour d'autres étoiles que le Soleil, la formation d'une planète ne semblant pas un mécanisme requérant des conditions très spécifiques. Bien qu'Aleksander Wolszczan ait découvert des exoplanètes en septembre 1990 avec le radiotélescope Arecibo autour du pulsar PSR B1257+12 (une étoile en fin de vie, très dense avec une rotation très rapide), la science des exoplanètes a réellement débuté en 1995 avec la découverte de "51 Pegasi b" autour d'une étoile de type solaire par Michel Mayor et Didier Queloz. Plus de dix ans après, près de deux milles exoplanètes ont été découvertes et ce chiffre ne cesse de croître.

En plus des planètes du système solaire, des planètes naines ont été découvertes telles que Cérès. Pluton fut rétrogradée de son rang de planète pour devenir une planète naine.

Avec près de 2000 exoplanètes, des études statistiques permettent de découvrir des propriétés statistiques contraignant les modèles de formation et d'évolution des planètes. Le diagramme de Hubble pour les galaxies et le diagramme Hertzsprung-Russell pour les étoiles sont autant d'outils statistiques fondamentaux pour l'étude des galaxies et des étoiles.

Différentes propriétés sont mesurables pour chaque exoplanète : la masse, le rayon, le type spectral de l'étoile hôte, ... Cette première partie du cours utilise ces grandeurs pour caractériser les exoplanètes et en même temps pour introduire des concepts de statistique qui seront repris d'un point de vue probabiliste dans la seconde partie du cours.


L'échantillon statistique

Définition

Les études statistiques portent sur l'étude d'un échantillon de mesures. Cet échantillon est un ensemble de résultats, de nombres, acquis soit par la répétition d'une même expérience soit par la collection d'observations faites sur le même sujet. Par exemple, le résultat de dix lancers d'un dé, ou de dix dés lancers une fois, forme un échantillon de l'expérience "lancer de dé". Je peux faire la même chose avec des pièces ou des cartes. Moins classique, le résultat d'une pêche peut être vu comme un échantillon statistique des poissons se trouvant là où est le pêcheur. De ce dernier ensemble, la taille des poissons, leurs poids, etc, peuvent être étudiés. Un échantillon se caractérise par son nombre d'éléments. Plus un échantillon est grand, plus son étude est riche et précise.

L'échantillon des exoplanètes

Dans l'étude des exoplanètes, il s'agit de regarder un phénomène qui s'est répété : la formation d'exoplanètes. L'échantillon est donc constitué des exoplanètes découvertes. Actuellement l'échantillon d'exoplanètes connues comporte 1951 (au 8 septembre 2015) exoplanètes situées dans 1235 systèmes exoplanétaires. En effet, certains systèmes planétaires ont plusieurs exoplanètes. Les données utilisées dans ce cours sont fournies par la page internet exoplanet.eu/catalog. De cet échantillon d'exoplanètes, il est possible d'extraire différents échantillons, celui de des masses, des rayons, des eccentricités, etc, puis de les étudier.


Représentativité d'un échantillon

En statistique, le premier souci est la représentativité d'un échantillon. Pour bien comprendre la notion de représentativité, les sondages politiques sont pédagogiques. Durant une élection, un sondage doit donner approximativement le pourcentage de votes qu'obtiendra chaque candidat. Pour ce faire, un échantillon, de 1000 français par exemple, est sondé sur leurs futurs votes. Les sondeurs peuvent alors tirer des conclusions sur l'issue probable du résultat en faisant l'hypothèse que les 60 millions de français vont se comporter comme ces 1000 personnes. Dans ce cas, l'échantillon de 1000 personnes est dit représentatif de la totalité des français. L'échantillon peut cependants être biaisé si le sondeur ne sélectionne que des personnes ayant la carte du premier parti de droite ou bien des personnes lisant uniquement la presse dite de gauche. Il faut donc veiller à corriger le biais s'il est bien connu.

L'obtention d'un échantillon représentatif, sans biais, est une chose facile en théorie mais difficile en pratique. En théorie, il suffit de sélectionner un échantillon de manière aléatoire. Pour les élections, il suffit de tirer un certain nombre de français au hasard. Pour les exoplanètes, cette méthode est impossible pour la simple raison que toutes les exoplanètes de notre galaxie ne sont pas encore connues. Il existe en effet plusieurs biais qui font que certaines exoplanètes peuvent être surreprésentées par rapport à d'autres. Par exemple, les planètes très massives avec un grand rayon et très proches de leurs étoiles auront tendance à être plus facilement détectables et donc à être surreprésentées par rapport aux planètes de type terrestre qui sont petites, peu massives et loin de leurs étoiles hôtes. Toute étude statistique doit alors bien identifier ses biais afin de ne pas tirer de fausses conclusions. Un échantillon d'exoplanètes peut être complet jusqu'à une certaine limite de masse, de taille, de distance au soleil mais pas au-delà. Le travail du statisticien est de trouver cette limite pour tirer des conclusions non biaisées.


Extremum, médiane, quartile

Dans cette section du cours, nous illustrons les principales valeurs statistiques en utilisant la variable "masse" des exoplanètes.

Extremum

Les premières valeurs pour caractériser l'échantillon des masses des exoplanètes sont les valeurs minimale et maximale. Elles sont de 7*10^5 M_J et 47 M_J ; la Terre faisant par comparaison 2,6*10^(-3) M_J. Les masses sont données dans l'unité de la masse de Jupiter, M_J, qui fait 1,90*10^(27) kg ou 317,8 masses terrestres . Ce premier critère statistique montre que la masse des planètes découvertes varie sur près de six ordres de grandeur. Cela ne prouve en aucun cas qu'il n'existe pas de planètes plus ou moins massives.

Médiane

Une autre valeur statistique est la médiane. Cette dernière partage l'échantillon en deux parts égales de telle manière qu'il y a autant de masses inférieures que supérieures à elle. Pour la calculer, il faut tout d'abord trier les masses en ordre croissant. Si le nombre de masses, N, est impair la valeur de la médiane est celle de la (N-1)/2ème masse. Si le nombre de masse est pair, la médiane se calcule par la moyenne de la N/2 et (N+1)/2ème masses. Dans le cas des 1795 exoplanètes découvertes, seules 1032 ont une masse mesurée ; un nombre pair, donc la médiane correspond à la moyenne des masses des exoplanètes numéros 1032/2 = 512 et (1032+1)/2 = 513 qui est la masse 0,96 M_J.

Quartiles

Il est aussi possible de connaître la valeur qui marque le premier quart, nommée premier quartile, (0,197 M_J) ou le dernier quart, nommée dernier quartile (2,75 M_J) de l'échantillon. Pour un échantillon de taille N, le premier quartile se calcule en prenant la valeur N/4, si N est un multiple de 4, ou la valeur de l'entier supérieur. Pour le dernier quartile, c'est la même méthode mais en utilisant 3*N/4. L'écart entre le premier et le dernier quartile est nommé l'écart interquartile.


La boîte à moustaches

Boîte à moustaches
bam_mass.jpeg
Boîte à moustaches schématisant la distribution des masses des 1032 exoplanètes de l'échantillon. L'axe horizontal représente les masses en échelle logarithmique. Ce schéma résume les cinq valeurs statistiques de la distribution de masse des exoplanètes qui sont par ordre croissant : le minimum (à gauche), le premier quartile (la côté gauche du rectangle), la médiane (le trait au centre du rectangle), le troisième quartile (le côté droit du rectangle) et le maximum (à droite).
Crédit : Sylvain Fouquet

Boîte à moustaches

Toutes les informations statistiques décrites précédemment peuvent être résumées graphiquement par un schéma appelé la boîte à moustaches. Ce schéma montre les extrema reliés aux quartiles par des segments de droite (les moustaches) et les quartiles reliés à la médiane par des rectangles. La figure ci-dessus illustre une boîte à moustaches dans le cas des masses des exoplanètes. Cette visualisation graphique permet de décrire rapidement comment sont réparties les valeurs. Si les moustaches sont très grandes, cela signifie que les valeurs sont concentrées autour de la médiane. Au contraire, des rectangles de grande taille montrent une distribution dispersée. Dans le cas de la masse des exoplanètes,cl'écart interquartile, c'est à dire l'écart entre le 1er quartile (0,197 MJ) et le 3ème quartile (2,75 MJ), est de 2,553 MJ. La dispersion des masses des exoplanètes ne semble pas étendue, mais rappelons que, comme l'échantillon est biaisé vers les grandes masses, ce résultat est sûrement à revoir.


Moyenne et écart-type

Moyenne

Une autre méthode pour décrire un échantillon comme celui des masses d'exoplanètes est la détermination de la moyenne et de l'écart-type. La moyenne d'une variable x pour un échantillon de taille N est :

moyenne(x) = (1/N)*somme(x_i; i=1; N)

Pour notre 'échantillon d'exoplanètes, la masse moyenne est 2,762 M_J, très proche de la médiane à 2,75 M_J.

Ecart-type

En plus de la moyenne, il est utile de savoir si les valeurs sont concentrées autour de la moyenne ou bien dispersées. Cette information est fournie par l'écart-type, noté sigma qui se définit par la moyenne des distances à la valeur moyenne. Il faut donc calculer tout d'abord toutes les distances au carré (le carré pour avoir des distances positives), de la moyenne à chaque valeur de l'échantillon, l_i =(moyenne(x)-x_i)^2. La moyenne de l_i donne le carré de sigma:

sigma^2 = (1/N)*somme(l_i; i=0; N) = (1/N)*somme((moyenne(x)-x_i)^2; i=0; N)

L'écart-type de l'échantillon des masses des exoplanètes vaut 4,75 M_J. Cela est presque deux fois plus grand que l'écart interquartile.


Histogrammes

Histogrammes des masses
histo_mass_ss_exo.jpeg
Histogrammes des masses des planètes du système solaire (gauche) et des exoplanètes (droite). L'échelle des masses est en échelle logarithmique par soucis de clarté.
Crédit : Sylvain Fouquet

Histogramme

Les outils statistiques précédents sont pertinents lorsqu'il s'agit de distributions centrées autour d'une valeur. Dans le cas des planètes du système solaire, les masses sont soit petites (de l'ordre de la masse de la Terre), soit plus massives (de l'ordre de la masse de Jupiter). Cette distribution des masses, en plus d'autres propriétés physiques telles que la taille et la composition chimique, est à la base de la distinction entre les planètes gazeuses et les planètes telluriques. Calculer la moyenne ou faire une boîte à moustache de l'échantillon des masses des planètes du système solaire ne permet pas de faire la distinction entre planètes telluriques et gazeuses.

Pour avoir une idée plus juste de la répartition des valeurs d'un échantillon, l'histogramme est un outil statistique plus approprié. Il requiert de calculer le nombre d'éléments de l'échantillon inclus dans des intervalles réguliers entre les extrema. L'avantage de l'histogramme est qu'il présente une vision claire de la distribution de notre échantillon. Mais si une taille des intervalles : (Max - Min)/N est trop petite, il n'y aura qu'un ou bien zéro élément de l'échantillon dans chaque intervalle. A l'inverse si les intervalles sont trop grands, il ne sera plus possible de distinguer les pics dans la distribution. Un bon choix pour le nombre d'intervalles est important. Si, par exemple, on divise le nombre total d'éléments de l'échantillon par N = 10, et que la distribution est uniforme, chaque intervalle devrait avoir à peu près 10 représentants.

Dans le cas du système solaire, la figure de gauche montre qu'il y a deux pics dans la distribution des masses des planètes autour des masses M_T, la masse de la Terre, et M_J, la masse de Jupiter. L'histogramme des masses donne donc plus d'information que simplement une valeur centrale et une dispersion autour de cette valeur. Dans le cas de l'échantillon de toutes les masses connues des exoplanètes (figure de droite), l'histogramme montre que la répartition des exoplanètes a un pic aux alentours de 10^(-0.75)=0,17*M_J. De plus, le nombre d'exoplanètes avoisinant la masse de la Terre semble très faible. Encore une fois, cette propriété provient très probablement du biais observationnel qui privilégie les planètes massives et ne signifie en aucun cas que les planètes telluriques sont rares.


Fonctions de distribution

Fonctions de distributions des masses
stat_mass_ss.jpegstat_mass_exoplanete.jpeg
Histogrammes (gauche) et fonctions de distribution (droite) des masses des planètes du système solaire (haut) et des exoplanètes (bas). L'échelle des masses est en échelle logarithmique par soucis de clarté.
Crédit : Sylvain Fouquet

Pour pallier le problème de la taille des intervalles pour les histogrammes, les statisticiens ont défini la fonction de distribution. Au lieu de calculer le nombre d'occurences dans un intervalle, la fonction de distribution donne le nombre d'occurences inférieures à une valeur. Par souci de comparaison, la fonction de distribution est normalisée, elle est divisée par le nombre total d'éléments de l'échantillon : N. Elle ne peut donc dépasser 1. Dans notre cas, ce nombre est le nombre total d'exoplanètes découvertes : 1032. Le grand avantage comparé à l'histogramme est qu'il n'existe qu'une fonction de distribution pour un échantillon, alors qu'il existe un grand nombre d'histogrammes du fait du choix de la taille de l'intervalle. La fonction de distribution est clairement définie et se trouve donc être très appréciée en théorie des probabilités. La fonction de distribution des masses des exoplanètes fournit, entre autres choses, le nombre d'exoplanètes ayant une masse inférieure à 1 M_J, f(M_J) = 520/1032 = 0.5038, ou à une masse terrestre, f(M_T) = 3/1032 = 0.0029. La figure en bas à droite montre cette fonction.

En dessous de la valeur minimale d'un échantillon, cette fonction est nulle. Au delà de la valeur maximale, elle vaut 1. Cette fonction est à créneaux. En passant d'une valeur de l'échantillon à une valeur plus grande elle augmente de la valeur 1/N du fait de la normalisation. Entre les deux valeurs, elle est constante. Cette fonction est par construction croissante. Les "créneaux" se distinguent bien pour des échantillons avec un faible nombre d'éléments comme avec les masses des planètes du système solaire mais presque plus lorsque ce nombre est grand pour les exoplanètes (voir figures de droite).

Comme à chaque échantillon correspond une unique fonction de distribution, il est pertinent de comparer deux fonctions de distribution. Cette comparaison indique si deux échantillons ont des propriétés similaires ou différentes. Dans le cas des planètes du système solaire comparé aux exoplanètes, il y a beaucoup de différences. Les masses des planètes du système solaire commencent à 10^(-4)*M_J alors que celles des exoplanètes à 10^(-2)*M_J, bien qu'il y ait quelques traces d'exoplanètes en deçà de cette valeur. La pente globale de la fonction de distribution du système solaire semble régulière alors que celle des exoplanètes connaît une augmentation autour de la valeur 0,17 M_J.


Statistique multidimensionnelle

Masse, Rayon, demi-grand axe
masse_radius_semimajor.jpeg
Gauche : Masse des exoplanètes en fonction du rayon (points) avec le cas particulier des planètes du système solaire (étoiles). Droite : demi-grand axe des exoplanètes en fonction de leur masse toujours avec le cas des planètes du système solaire (étoiles).
Crédit : Sylvain Fouquet

Dans ce cours, la masse des exoplanètes a été étudiée de manière indépendante des autres grandeurs des exoplanètes. Cependant, elle peut être étudiée en parallèle d'autres propriétés. Dans ce type d'étude, des corrélations entre grandeurs sont recherchées. Par exemple, si la densité des exoplanètes, rho, était constante, ce qui est faux dans notre système solaire, alors le rayon, R, d'une exoplanète devrait être directement corrélé avec sa masse totale, M, par la loi M = (4/3) * rho*pi*R^(3). Un graphique ayant comme abscisse le rayon au cube et comme ordonnée la masse montrerait une droite qui permettrait de calculer rho, son coefficient directeur. Dans les faits, la densité des exoplanètes n'est pas constante.

En effet, la figure de gauche montre le graphique de la masse des exoplanètes en fonction de leur rayon avec en plus le cas des huit planètes du système solaire. Deux régions plus peuplées ressortent du graphique. La première comporte des planètes de la masse de Jupiter. Dans l'autre région, les exoplanètes ont une masse d'un ordre de grandeur plus petit que Jupiter mais un rayon de 3 à 40 fois supérieur à celui de Jupiter. Les planètes de type Terre, Vénus, Mars ou Mercure sont beaucoup plus rares. Cela est seulement dû aux biais observationnels déjà mentionnés. Ce graphique montre que notre système solaire bien qu'ayant huit planètes ne contient aucune planète du type planète supergéante avec des rayons en moyenne de près de 20 fois le rayon de Jupiter. Il faut aussi se méfier de ces mesures. De telles planètes auraient, et même dépasseraient, la taille du soleil.

La figure de droite illustre le lien entre la distance exoplanète-étoile et la masse des exoplanètes. Là encore, le groupe des masses de Jupiters se distingue. Elles sont très largement aux alentours de 0,05 U.A., bien plus proche que Mercure du Soleil. Ces planètes sont donc des planètes massives collées à leurs étoiles hôtes. Elles sont alors nommées des Jupiter chauds. Encore une fois leur grand nombre apparent est très certainement dû aux observations qui détectent plus facilement ce type de planètes du fait de leurs masses et de la proximité à leurs étoiles hôtes. La grande majorité des autres exoplanètes se situent en dessous d'une U.A. Des ensembles d'exoplanètes forment des traits dans le graphique, par exemple pour la distance de 1 U.A. Cela ne signifie pas qu'il y a de nombreuses planètes se situant à 1 U.A. faisant de cette valeur une valeur exceptionnelle. Cela est sûrement dû à l'algorithme servant à mesurer le demi-grand axe qui favorise cette valeur. Il faut donc se méfier de ces valeurs. Dans ce graphique, davantage que dans le précédent, les planètes du système solaire ne semblent pas en concordance avec celles des exoplanètes. Même Jupiter qui était un cas favorable, se trouve ici avoir des propriétés bien différentes que ses homologues extra-solaires.


Statistique sur les étoiles hôtes I

Relation masse-taille des étoiles hôtes
starmass_starradius.jpg
Relation masse-rayon pour les étoiles hôtes des exoplanètes. La distribution montre que les étoiles hôtes ont des propriétés similaires à celles du soleil avec des masses comprises entre 0,5 et 1,5 masse solaire et des rayons compris entre 1 et 2 rayon solaire.
Crédit : Sylvain Fouquet

Depuis le début de ce cours, seules les propriétés des exoplanètes ont été etudiées. Cependant beaucoup d'informations peuvent être aussi obtenues sur l'étoile hôte autour de laquelle l'exoplanète gravite. En voici les principales : type spectral, masse, rayon, position dans la galaxie ou encore métallicité.

Propriétés des étoiles

Une des premières études statistiques à entreprendre est la caractérisation des étoiles hôtes par leurs masses et leurs tailles. La figure ci-contre montre la relation masse-rayon des étoiles hôtes indiquant que la grande majorité des étoiles ont des masses et des tailles proches de celle du soleil (1 Mo, 1Ro) se situant au centre de la distribution. Cependant, il ne faudrait pas conclure trop hâtivement que seules les étoiles similaires au soleil pourraient abriter des exoplanètes. Notre étoile, le soleil, est une étoile typique parmi les étoiles du disque de la Voie Lactée ; donc lorsque les astrophysiciens cherchent des exoplanètes, ils les cherchent en majorité autour d'étoiles de type solaire. Il y a donc une surreprésentation de ce type stellaire dans l'échantillon des étoiles hôtes. Pour savoir si les exoplanètes peuvent se développer autour d'étoiles ayant des propriétés très différentes de celle du soleil, il faudrait observer un grand nombres d'étoiles de types différents.

L'échantillon actuel des étoiles hôtes ne permet pas une étude poussée pour connaître l'influence de l'environnement d'une étoile hôte sur son nombre d'exoplanètes. Les étoiles proches du soleil, se situant toutes dans le disque plutôt externe de la Voie Lactée, se trouvent dans un milieu peu dense par rapport à des étoiles au centre de la Voie Lactée dans le bulbe. Une étude sur la recherche d'exoplanètes faite dans l'amas globulaire 47 Toucan peut fournir une première indication. La densité de cet amas est bien plus grande que pour les étoiles autour du Soleil. 47 Toucan a de plus des étoiles de faible métallicité, une absence de gaz et des étoiles formées il y près de 12 milliard d'années. Le résultat de cette recherche est de n'avoir trouvé aucune exoplanète alors qu'une même étude faite au voisinage du soleil aurait permis d'en découvrir une vingtaine.

Ce résultat est cohérent avec ce que l'on attend de la formation des planètes. En effet, une étoile pauvre en métaux implique que son environnement est lui-même très probablement pauvre en éléments lourds donc en matériaux pour former une planète. Les amas globulaires sont connus pour être dépourvus de gaz ce qui entraîne l'impossibilité de la formation de planètes gazeuses. De plus un environnement dense n'est pas propice à la formation et à la stabilisation dans le temps d'un disque protoplanétaire autour d'une étoile. Ce disque pourrait avoir tendance à se disperser par interaction gravitationnelle . A l'opposé, il peut être aussi instructif de rechercher des planètes dans des milieux très peu denses comme dans le halo de la Voie Lactée ou dans les galaxies naines proches de la Voie Lactée afin d'être complet.


Statistique sur les étoiles hôtes II

Relation rayon stellaire vs demi-grand axe
starradius_semimajor.jpg
Relation entre le rayon de l'étoile hôte et le demi-grand axe de son exoplanète. La ligne en trait plein montre la limite inférieure pour les demi-grands axes dus à la taille de l'étoile convertie en U.A. La ligne en pointillé montre le double des rayons stellaires.
Crédit : Sylvain Fouquet

Nombre d'éxoplanètes par étoile

Il est pertinent de savoir si le nombre d'exoplanètes dépend de la masse, de la taille ou du type spectral de l'étoile hôte afin, par exemple, de rechercher des exoplanètes autour d'étoiles qui ont davantage de probabilité d'en abriter. La question "Quelle est la probabilité d'avoir une exoplanète autour d'une étoile" devient alors "Quelle est la probabilité d'avoir une exoplanète autour d'une étoile de type solaire, de type géante rouge de type naine blanche, etc". Cette question permet de se familiariser avec le concept de statistiques conditionnelles ou bayésiennes qui sera développé dans la partie du cours dédié à la théorie des probabilités. La question n'est plus seulement de connaître la probabilité d'avoir un résultat mais sa probabilité à condition qu'un autre évènement ait eu lieu.

Demi-grand axe de l'exoplanète en fontion du rayon de l'étoile

Pour illustrer le concept de statistiques bayésiennes, nous exploitons la figure ci-contre présentant le demi-grand axe des exoplanètes en fonction du rayon de leurs étoiles hôtes. Premièrement, il semble qu'une planète doit être assez éloignée de son étoile hôte durant son orbite sous peine de collision et de destruction. Cela interdit donc des demi-grands axes qui sont d'une taille inférieure à celle du rayon de l'étoile hôte. De plus si une planète a une excentricité forte proche de 1 alors un demi-grand axe élevé n'empêche pas une collision lorsque l'exoplanète passe au péricentre. Dans la figure ci-contre, la ligne en trait plein et celle en tirets montrent le demi-grand axe limite dû à la taille de l'étoile et à son double. Toutes les exoplanètes ont un demi-grand axe en dehors de ces limites ; toutefois, elles sont assez proches de leurs étoiles hôtes. En effet, un demi-grand axe d'une taille de seulement dix fois le rayon de l'étoile hôte est une propriété commune. Au contraire, dans notre système solaire, Mercure est déjà à une distance de plus de 80 fois le rayon du soleil. Cette première discussion implique que plus une étoile a un grand rayon plus la probabilité de trouver une exoplanète de faible demi-grand axe sera faible. En d'autres termes, pour le même demi-grand axe une petite étoile aura plus de chance d'avoir une exoplanète qu'une étoile géante. Cela montre que la probabilité de la valeur du demi-grand axe n'est pas indépendante de la taille de l'étoile hôte, elle est conditionnée.

A l'inverse, pour les étoiles de rayon plus grand que 5 rayons solaires, le demi-grand axe des étoiles semble être statistiquement constant : aux alentours de 2 U.A. Il est évident que ce résultat est faussé par le fait que l'échantillon des étoiles géantes est petit et qu'en plus les étoiles éloignées de plusieurs U.A. sont difficiles à détecter. Cependant, supposons pour la pédagogie, ce résultat vrai. Cela implique que quelque soit la taille d'une étoile hôte entre 5 et 10 rayons solaires, son exoplanète a un demi-grand axe de près de 2 U.A. Dans ce cas, la condition sur la taille de l'étoile hôte n'a aucune influence sur la probabilité du demi-grand axe de l'exoplanète. En statistique, on dira que le demi-grand axe d'une exoplanète est indépendant du rayon de son étoile hôte lorsque ce dernier est entre 5 et 10 rayons solaires.


Signal sur Bruit

En astronomie, lorsqu'une image ou un spectre d'un objet du ciel est obtenu, le résultat varie d'une acquisition à l'autres même si la méthode utilisée est identique: même instrument, même temps de pose, etc. Cela est dû au fait que les photons collectés dans les pixels n'arrivent pas tous de manière uniforme. Si les photons d'une étoile arrivaient à une allure constante de 1 photon par milliseconde sur un pixel, alors un temps de pose de 1 seconde fournirait toujours 1000 photons. Cependant, les photons n'arrivent pas de manière ordonnée, ils suivent une loi dite de Poisson (décrite en détails dans la seconde partie du cours). Cela est dû au fait que les atomes des étoiles créant ces photons agissent de manière chaotique. Par conséquent, si on compte le nombre de photons collectés durant un temps d'une seconde sur 1000 images, on se retrouve avec un échantillon de 1000 valeurs. Il est possible de calculer la moyenne de cet échantillon que l'on note N, qui est le signal recherché. L'écart-type, qui est une estimation de son erreur absolue, vaudra alors sqrt(N); ceci est une propriété de la loi de Poisson. Par exemple, si N vaut 10, son erreur absolue vaut sqrt(N) = sqrt(10) = 3,16 . Le rapport entre le signal, 10, et l'erreur appelé bruit, 3,16, vaut alors

S/B = N/sqrt(N) = sqrt(N)

donc 3,16 dans ce cas particulier. Ce rapport s'appelle le rapport Signal sur Bruit, S/B. Dans le cas où le signal N vaut 100 alors le bruit vaut 10 et le signal sur bruit 10. On voit par cet exemple que plus le S/B est grand moins la mesure est entâchée d'erreurs, et vice versa. En astronomie, pour qu'une mesure ait un sens, un S/B d'au moins trois est requis.


Courbe transit

Courbe de transit
RTEmagicC_42749_transit_exoplanete_eso_txdam18806_9dd4e4.JPEG
Deux courbes de transit normalisées montrant le passage d'une exoplanète devant son étoile hôte.
Crédit : ESO

La figure ci-contre illustre, dans le cas plus particulier de la détection des exoplanètes par transit, l'influence du bruit pour détecter une exoplanète. Le graphique supérieur montre un transit assez évident avec une chute puis une remontée de la luminosité . La courbe noire est l'ajustement théorique du flux. Cela représente la courbe sans le bruit, sans la dispersion statistique. Plus réalistes, les points montrent les observations qui sont composées du signal et du bruit. Les courbes sont ici normalisées à 1. Pour le graphique du bas, la décroissance est visible mais plus difficile à modéliser correctement car elle est moins forte. Les deux courbes montrent la présence d'une planète avec des rapports S/B proche de 20. En effet pour un signal de 1 le bruit est de l'ordre de 0,05. Cependant si ce S/B est suffisant pour détecter les deux exoplanètes, il donnera une meilleure précision sur les propriétés (masse, rayon, ...) de l'exoplanète du graphique du haut car le profil de luminosité est plus profond que pour l'exoplanète du graphique du bas.


Probabilités

Auteur: Sylvain Fouquet

Probabilités

Statistique et probabilité sont deux côtés d'une même pièce. Ces deux domaines des mathématiques s'occupent de décrire le résultat d'expériences ou d'observations faisant intervenir le hasard. Par exemple, tirer un bulletin dans une urne, choisir des personnes au hasard dans un groupe, sélectionner des étoiles au hasard dans le ciel, etc, ne peuvent pas se décrire par la mécanique classique, l'hydrodynamique ou encore le magnétisme mais par la statistique et les probabilités. Pourquoi avoir deux noms ? Statistique et probabilité ne sont pas identiques dans la démarche bien que traitant des mêmes sujets. La statistique sert à observer et décrire le monde alors que les probabilités, aussi appelés théorie de la probabilité, tentent de l'expliquer théoriquement, mathématiquement. Ces deux approches se complètent mutuellement comme l'observation physique et le modèle mathématique se complètent.

L'expérience de 100 lancers du même dé servira à illustrer la différence entre statistique et probabilité. Lors de cette expérience, la statistique décrit les propriétés statistiques de ces 100 lancers. Par exemple, la statistique montre que chaque face du dé est presque apparue autant de fois. La valeur moyenne se rapproche de 3,5. De manière complémentaire à cet aspect observationnel, la théorie de la probabilité prouve que si vous avez un dé non pipé, il y a autant de chance de tomber sur une face que sur une autre. Pour un nombre de 100 lancers, la théorie de la probabilité indique quelle est la chance d'obtenir la face 1 par exemple. Les prévisions de la théorie de la probabilité doivent se confirmer dans les résultats observationels de la statistique. Si tel n'est pas le cas pour les lancers de dé, cela veut dire que le dé est pipé et qu'il faut changer les lois de probabilité (passer de la loi "chaque valeur a une chance sur 6 de sortir" à une loi plus compliquée qui va définir le dé pipé), à l'instar d'une expérience mettant en échec une théorie physique.


Les variables aléatoires

L'univers des événements

En probabilité, les variables sont dites aléatoires car pour, une même expérience, la mesure de la même observable sera différente, aléatoire. Par exemple lorsqu'un dé est lancé, l'observable qui est le numéro du dé est aléatoire (à moins qu'il ne soit envoyé par une machine pouvant envoyer le dé à chaque fois exactement de la même façon). Ce qui importe pour une variable aléatoire c'est l'ensemble des valeurs qu'elle peut prendre. Pour un dé, il y a six faces ; le nombre d'événements possibles est six (on suppose que le dé ne peut pas s'arrêter sur une arête). Autre exemple, la variable donnant l'instant du prochain accident de voiture en France peut prendre n'importe quelle valeur à priori entre 0 seconde et l'infini : 1 secondes, 10 minutes, 1 heures, etc. Il y a une infinité de possibilités.

Il existe donc deux types de variables aléatoires : les variables discrètes (lancer de dés) et les variables continues (temps entre deux accidents). Pour les variables discrètes, le nombre d'evénements peut être fini ou infini. Il est toujours infini pour une variable continue. L'ensemble des évènements est appelé l'ensemble univers des évènements. La suite donne quelques exemples détaillés de ces types d'ensembles. En probabilité, les événements sont très souvent associés à des nombres pour pouvoir être traités mathématiquement. Par exemple pour un jeu de cartes, la carte roi de pique peut être associée à la valeur numérique de 25.

Exemples de variables discrètes

L'ensemble univers le plus connu et le plus simple de tous est l'ensemble des évènements d'un jet d'une pièce de monnaie. Il n'y a que deux évènements : {pile ; face} (trois évènements si l'on prend en compte le cas où la pièce reste sur son bord). Par commodité, on utilise l'ensemble {0, 1} en liant pile à 0 et face à 1.

L'autre variable aléatoire très connue est le lancer de dé avec ses six évènements possibles qui sont déjà des nombres : {1, 2, 3, 4, 5, 6}. Il est aussi possible de lancer deux dés à la fois et de sommer leurs résultats. Dans ce cas, cela conduit à un ensemble de 11 évènements {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}.

Des urnes remplies de boules de différentes couleurs sont aussi un exemple très pédagogiques d'ensemble univers. Par exemple, pour une urne remplie de 5 boules qui ne se différencient que par leurs couleurs : 2 noires, 2 blanches et 1 rouge, l'ensemble des évènements si l'on tire une boule est {noire, blanche, rouge}. Si l'on en tire deux, c'est alors {(noire, noire), (noire, blanche), (noire, rouge), (blanche, rouge)}. Encore une fois, il faut associer chaque couleur à un nombre pour pouvoir travailler dessus.

Enfin, pour les joueurs d'argent, et les aficionados de probabilités à variables discrètes, le casino est l'endroit rêvé. Il est possible de trouver là une multitude de jeux avec des ensembles univers allant de la case rouge ou noir à des images sur une machine à sous. Les casinos utilisent bien évidemment aussi les jeux de cartes pour enrichir le nombre d'évènement possibles.

Bref, les variables aléatoires discrètes sont partout dans la société. C'est d'ailleurs souvent à la suite de créations de la société : pièces, dés, cartes, roulette, loto, ...

Exemples de variables continues

Les variables continues se trouvent plus souvent liées à des propriétés physiques de la nature. Un exemple simple peut se trouver dans les prévisions météorologiques : "Quand pleuvra-t-il chez moi ?". La réponse se trouve être entre tout de suite (0 seconde) et jamais (un temps infini). Il y a donc une infinité continue de durées possibles. Il peut se passer plusieurs jours sans pleuvoir alors que parfois moins d'une heure s'écoule entre deux averses. Cet exemple de variable aléatoire est similaire à celui de l'intervalle de temps entre deux accidents de voitures. Plus généralement, il se trouve que certains phénomènes naturels n'arrivent pas de manière régulière. On peut alors introduire la variable aléatoire qui donne le temps entre deux occurences.

Un autre type de variables aléatoires continues sont les incertitudes dues à de faibles changements des conditions initiales. Refaire exactement la même chose un grand nombre de fois donne un résultat similaire mais pas identique. Lancer un poids est un de ces cas. Vous aurez beau faire attention, vous ne lancerez jamais avec exactement la même force, dans la même position et dans les mêmes conditions (vent, atterissage, etc). La conséquence est que le poids ne tombera jamais au même endroit. Il en est de même pour la production de pièces en série qui ne sont jamais tout à fait identiques. Tous ces cas peuvent se traiter avec les variables aléatoires continues.


La fonction de probabilité

En probabilité, après avoir défini l'ensemble univers des évènements, il reste à associer à chaque évènement sa probabilité de se produire via la fonction de probabilité. Cette fonction prend des valeurs entre 0 et 1. La valeur 0 signifie que l'évènement est impossible, la valeur 1 qu'il est certain. Par exemple, dans le cas d'un jet d'une pièce non faussée, l'ensemble des évènements est {pile, face}, ou {0, 1}, et la fonction de probabilité, notée P, donne P(0) = 0,5 et P(1) = 0,5. Cela signifie qu'il y a la même chance de tomber sur pile que sur face. Par contre si la pièce était faussée, il serait possible d'avoir une fonction de probabilité donnant : P(0) = 0,8 et P(1) = 0,2. "pile" aurait alors 4 fois plus de chance de sortir.

Cette loi nous amène à une propriété bien naturelle des probabilités. La probabilité de l'ensemble univers vaut 1 : P(Univers) = 1.

En effet, il est certain que la variable aléatoire sorte un évènement de l'ensemble univers. Dans le cas d'un lancer de dé, P({1, 2, 3, 4, 5, 6}) = 1, car on est sûr d'obtenir comme résultat 1, 2, 3, 4, 5 ou 6. A l'inverse, l'ensemble vide {} a toujours une probabilité nulle : P({}) = 0.


Probabilité sur des sous-ensembles d'événements

Dans le cas, d'un dé non pipé, la fonction de probabilité est pour tous i de 1 à 6, P(i) = 1/6. Il y a en effet autant de chance de tirer un 1, un 2, etc. Cependant quelle est la probabilité de tirer un nombre pair, {2, 4, 6} ? Intuitivement, cette probabilité doit être plus grande que de tirer seulement un 2. Le bon sens et la construction de la théorie des probabilités impliquent qu'elle corresponde à la somme de chacune de leur probabilité. Donc P(pair) = 1/6+1/6+1/6 = 1/2. Il en est de même pour la probabilité de tirer un nombre impair. Ce petit exemple illustre une loi simple de probabilité. La détermination de la probabilité d'un sous-ensemble est égale à la somme de la probabilité de chacun des événements du sous-ensemble.

Voyons comment calculer la probabilité de l'union de deux sous-ensembles. Par exemple au jeu de 52 cartes, la probabilité de tirer n'importe quelle carte est la même et vaut 1/52. Dans ce cas, la probabilité de tirer une carte rouge vaudra 1/52 times 26 = 1/2 car il y a 26 cartes rouges, la moitié du nombre des cartes. La probabilité de tirer une carte noire vaut aussi 1/2, quant à celle de tirer un coeur, elle vaut 1/4 et celle de tirer un roi 1/13. Quelle est alors la probabilité de tirer une carte rouge ou noire ? ou la probabilité de tirer une carte rouge ou de coeur ? ou encore une carte rouge ou un roi ? Pour la première probabilité, intuitivement le résultat est 1 car c'est l'ensemble univers. Cela revient à la somme des probabilités des sous-ensembles : 1/2+1/2. Pour la seconde, la probabilité reste celle de tirer une carte rouge, 1/2, car obligatoirement un coeur est une carte rouge. On n'additionne donc pas les probabilités. Le dernier cas est plus compliqué car deux rois font partie de l'ensemble des cartes rouges mais les deux autres non. Comment faire ? La relation donnant la solution générale est

P(A cup B) = P(A) + P(B) - P(A cap B)

où A et B sont deux sous-ensembles de l'ensemble univers, cup l'union de deux ensembles et cap leur intersection. Vous pouvez vérifier que cela donne bien les résultats des deux premiers exemples. Dans le cas des rois, la probabilité est alors P(rouge cup rois) = P(rouge) + P(rois) - P(rois cap rouge). Il se trouve que l'ensemble {rois cap rouge} n'est formé que des deux rois rouges, donc sa probabilité est 2 times1/52 = 1/26. Le résultat est donc P(rois cup rouge) = 1/2 + 1/13 - 1/26 = 1/2 + 1/26 = 14/26.

Notons que si {A cap B} = {}, donc si A et B sont disjoints, il suffit alors de sommer la probabilité de A et de B pour avoir celle de AcupB car P({}) = 0.


Calcul de la fonction de probabilité

Équipartition

Dans le cas d'un ensemble fini, il est parfois très facile de calculer la fonction de probabilité. Il suffit que tous les événements soient équiprobables, c'est à dire qu'ils aient la même probabilité, notée p. Cela est vrai pour un jet de dé ou de pièce non faussés, ou pour un jeu de cartes bien mélangé. Dans ce cas, la probabilité de tous les évènements, donc de l'ensemble univers, vaut P({E1, E2, E3, ..., En}) = P({E1}) + P({E2})+ P({E3})+ ... + P({En}) = p +p +p +...+p = n times p car tous les ensembles d'évènements sont disjoints, c'est à dire pour tous i et j, {E_i cap E_j} = {}. Or la probabilité de l'ensemble univers vaut par définition 1. Donc np=1 ce qui implique que p=1/n. Cela justifie pourquoi la probabilité pour le lancer d'une pièce vaut 1/2, pour le jet d'un dé vaut 1/6 et pour le tirage d'une carte dans un jeu de 52 cartes vaut 1/52.

application.png

Loi des grands nombres

Lorsqu'il n'y a pas équipartition dans les probabilités, il est moins direct de déduire la loi de probabilité. Une façon simple en théorie mais hélas irréalisable en pratique est la loi des grands nombres. Pour connaître la loi de probabilité, il suffit de mesurer plusieurs fois la valeur d'une variable aléatoire, de compter combien de fois sortent les mêmes valeurs puis de diviser ces nombres par le nombre total d'essais. Ainsi pour connaître la loi d'un dé, il suffit de faire une grand nombre de lancers, 1000 par exemple, et de regarder combien de 1 de 2 de 3, ... et de 6 sont sortis et enfin de diviser ces nombres d'occurences par le nombre total de lancers, 1000 dans ce cas. Cela fournit une valeur proche de la probabilité de chaque évènement mais pas exacte. La théorie mathématique prouve que si le nombre total d'essais est infini (ce qui est évidemment impossible en pratique), on en déduit alors la probabilité exacte pour chaque événement.

application.png

Pour des variables continues où les résultats sont des réels, deux résultats ne peuvent jamais être identiques car la chance d'avoir exactement deux réels identiques est nulle. Ce qui est mesuré est la probabilité d'avoir des valeurs dans un petit intervalle autour d'une valeur donnée. De toute façon, les outils de mesure n'étant pas parfaits, il est impossible de mesurer avec une précision infinie. La largeur des intervalles considérés dépendra donc de la précision des mesures.


Introduction aux théorème de Bayes - Découvrir la bonne urne

Considérons deux urnes, l'une remplie de 9 boules blanches et d'une seule boule noire, appelée A, et l'autre remplie de 9 boules noires et d'une boule blanche, appelée B. Il est interdit de voir leur contenu, on ne peut qu''en extraire une boule. Le problème est de savoir quelle est l'urne A parmi les deux urnes ? Sans faire aucun tirage de boule, la probabilité qu'une urne donnée soit l'urne A est la même pour les deux urnes et vaut donc 0,5, une chance sur deux, car il n'y a que deux événements.

Le problème ici n'est pas de connaître la probabilité de tirer des boules blanches ou noires dans les urnes A ou B mais de savoir depuis quelle urne sont tirées les boules en s'aidant du résultat du tirage d'une urne. Ce sont alors des probabilités conditionnelles : sachant qu'un résultat est vrai, quelle est la probabilité qu'un autre le soit aussi ? Ce problème simple d'urne peut s'extrapoler dans le cas de théories physiques. Imaginons que deux théories (deux urnes) soient en concurrence pour expliquer les mêmes phénomènes statistiques (tirage de boules). En faisant quelques observations (en tirant quelques boules), il est alors possible de montrer qu'une théorie est plus probable qu'une autre. Il est aussi possible que les deux théories se trompent (en tirant une boule rouge d'une des deux urnes).

De plus, avec les probabilités conditionnelles, il est possible d'estimer des grandeurs physiques via la mesure d'autres grandeurs. Un exemple caricatural éclaircira ce principe. Ayant les yeux bandés, je cherche à savoir si j'ai devant moi un norvégien ou un espagnol. Je peux estimer la taille de la personne mais pas voir son passeport. Comme j'ai une pensée très caricaturale, pour moi tous les norvégiens sont grands blonds aux yeux bleux et tous les espagnols sont petits bruns aux yeux marrons. Donc si j'ai devant moi une personne plutôt grande, je dirai que c'est un norvégien. De plus, s'il m'est permis de ne regarder que ses cheveux et qu'ils sont blonds, ma certitude grandit. La taille et la couleur des cheveux que j'ai pu observer servent à estimer avec une certaine probabilité la nationalité d'une personne. Cette méthode repose sur une loi conditionnelle implicite qui est qu'un homme grand aux yeux bleus à une plus forte probabilité d'être norvégien qu'espagnol. Cette démarche est beaucoup utilisée en astrophysique pour déterminer des propriétés inaccessibles par des mesures directes, mais déductibles par d'autres propriétés observables. Cependant, il est important de se souvenir que ce ne sont que des probabilités. D'autre part, cela suppose que les lois conditionnelles supposées a priori soient correctes.


Théorème de Bayes

Venons-en aux formules qui permettent concrètement de résoudre le problème de l'urne. Soient A et B deux expériences. La probabilité de A sachant B vrai, noté P(A|B), est donnée par la loi suivante, dite formule de Bayes établie par le mathématicien et pasteur Thomas Bayes au XVIIIe siècle :

P(A|B) = (P(B|A) times P(A))/P(B)

Il suffit de connaître P(A), P(B) et P(B|A) pour en déduire P(A|B). Ce théorème provient du fait que P(A|B) times P(B) = P(A cap B) et que, de même, P(B|A) times P(A) = P(B cap A) donc que P(A|B) times P(B) = P(B|A) times P(A).

Dans le cas particulier des urnes, si l'on tire une boule blanche quelle est alors la probabilité que ce soit de l'urne A, probabilité notée P(Urne A|Blanche), ou de l'urne B, P(Urne B|Blanche) ? Dans le cas de l'urne A, il faut calculer les trois probabilités P(Blanche|Urne A), P(Urne A) et P(Blanche). La probabilité de tirer une boule blanche dans l'urne A est P(Blanche|Urne A) = 9/10. La probabilité de choisir l'urne A ou B est identique au début de l'expérience et vaut P(Urne A) = P(Urne B) = 0,5. Enfin la probabilité de tirer une boule blanche est P(Urne A)timesP(Blanche|Urne A)+P(Urne B)timesP(Blanche|Urne B) = 0,5times9/10 + 0,5times1/10 = 0,5 car il est possible de tirer une boule blanche depuis l'urne A ou depuis l'urne B, mais pas avec la même probabilité. Ainsi, la probabilité que l'on soit en présence de l'urne A sachant que l'on a tiré une boule blanche est donnée par P(Urne A|Blanche) = P(Blanche|Urne A)timesP(Urne A)/P(Blanche) = 9/10times0,5/0,5 = 9/10. Dans l'autre cas P(Blanche|Urne B) = 1/10. Avec cette observation du tirage d'une boule blanche, on est passé d'une probabilité de 0,5 pour que l'urne étudiée soit l'urne A, à une probabilité de 9/10 pour que l'urne étudiée soit l'urne A.


Grandeurs classiques en probabilité

L'espérance

En théorie des probabilités, l'espérance est la valeur moyenne à laquelle on s'attend pour une variable aléatoire suivant une loi de probabilité donnée. Elle se définit dans le cas d'une variable discrète par la relation suivante : E(x) = somme(x_i*p(x_i); i=1; N). De manière similaire, elle se définit pour une variable continue x : E(x) = intégrale(x*p(x) ; x ; x=l_1 ; l_2)l_1 et l_2 sont les limites inférieures et supérieures que peut prendre la variable x.

Un exemple dans la cas d'une variable discrète est la moyenne au lancer d'un dé. L'espérance est alors E(x) = 1×1/6+2×1/6+3×1/6+4×1/6+5×1/6+6×1/6 = 21/6 = 3,5. Dans le cas d'une variable continue comme la loi uniforme de 0 à 1 (p(x) = 1), l'espérance est intégrale(x*1; x; 0; 1) = 1/2 = 0,5. Moyenne et espérance se ressemblent beaucoup, cependant elle ont une différence. L'espérance est une valeur dans le cadre de la théorie des probabilités associée à une loi de probabilité. La moyenne est, quant à elle, le résultat d'une opération arithmétique sur un échantillon. La moyenne dépend donc de l'échantillon alors que l'espérance est théorique et donc unique pour une loi donnée. La moyenne calculée à partir d'un échantillon doit être proche de l'espérance mais pas forcément identique. Par exemple, lorsqu'un dé est tiré 10 fois et que la moyenne des résultats est faite, le résultat n'est pas forcément l'espérance de 3,5. De plus, si l'on refait 10 lancers la nouvelle moyenne ne sera pas forcément identique à la première. Cependant, d'après la loi des grands nombres, plus le nombre de lancers de dé sera grand, plus la moyenne s'approchera de l'espérance. L'espérance doit être vue comme la limite de la moyenne lorsque l'on fait tendre le nombre d'essais vers l'infini.

Le moment d'ordre deux centré - la variance

La variance ou "moment d'ordre deux centré" est une mesure du carré de la dispersion d'une variable aléatoire autour de son espérance. En d'autres termes, la variance donne une information sur la dispersion de la variable aléatoire autour de l'espérance. Plus la variance est grande plus les valeurs de la variable aléatoire auront de chance d'être loin de l'espérance, et vice versa. Une variance faible donnera une loi de probabilité piquée autour de l'espérance. Pour une variable discrète, la variance se définit comme suit : variance = somme((x-mu)^2*p(x) ; i=0 ; N) avec mu l'espérance. Dans le cas d'une variable continue, variance = intégrale((x-mu)^2*p(x); x; x=l_1 ; l_2). On peut aussi définir la variance en n'utilisant que l'espérance de la variable x et x^2 : variance = E(x^2) - E(x)^2 = E(x^2) - mu^2. La démonstration est demandée en exercice. L'écart-type, souvent noté sigma, est la racine carrée de la variance : sigma^2 = variance. De même que pour le couple espérance-moyenne, le terme variance s'utilise plutôt en probabilité et écart-type en statistique.

Pour le lancer de dé non biaisé, la variance vaut environ 2,91667 et donc l'écart type vaut environ 1,70783. Pour la loi uniforme de 0 à 1, la variance vaut 1/12 0,0833.


Fonctions de distribution

Fonctions de distribution
FD.png
Fonctions de distribution (en haut) et lois de probabilité (en bas) du lancer d'un dé (à gauche) et de la loi uniforme sur [0, 1] (à droite).
Crédit : Sylvain Fouquet

Avant de décrire plusieurs lois de probabilité utiles car très courantes, cette section décrit l'outil majeur qu'est la fonction de distribution et sa dérivée, la loi de probabilité.

Fonction de distribution

Pour une variable aléatoire notée X, la fonction de distribution, notée F, donne la probabilité d'avoir la variable X strictement plus petite que x : F(x) = P(X < x). La fonction F est donc par définition une fonction croissante et bornée par la valeur 1. Cette définition convient aussi bien aux variables discrètes qu'aux variables continues. Il est aisé avec cette fonction de calculer la probabilité d'avoir la variable X entre x_1 et x_2. C'est tout simplement F(x_2) - F(x_1). En conséquence, si la courbe est plate ou avec une pente faible entre deux points x_1 et x_2, cela conduit à une probabilité entre x_1et x_2 faible alors que si la pente est forte la probabilité l'est aussi.

La figure en haut à gauche montre la fonction de distribution d'un dé. Pour x<1, la fonction est nulle, il est en effet impossible qu'un jet de dé puisse sortir un nombre plus petit que 1. De x<=1 à x<2, F est constante et vaut 1/6 qui est la probabilité d'avoir un 1 à un jet de dé. Ensuite entre 2 et 3 exclus, la fonction vaut 2/6 = 1/3 ; cela correspond à la probabilité de sortir un 1 ou un 2. La fonction continue d'augmenter pour plafonner jusqu'à x>6 où elle atteint sa valeur maximale de 1 car il est certain qu'un dé sorte un chiffre plus petit ou égale à 6.

La figure en haut à droite montre la fonction de distribution d'une variable continue. En dessous de 0, sa valeur est nulle au dessus de 1 elle vaut 1. Les valeurs possibles de cette variable sont donc comprises entre 0 et 1 inclus. La pente est une droite ; pour n'importe quel intervalle entre 0 et 1 de même taille la probabilité est donc la même. En conséquence, la probabilité d'avoir une valeur entre [x, x+dx] est identique. Cette fonction de distribution n'est autre que la fonction de distribution de la loi uniforme entre 0 et 1 ; chaque nombre entre 0 et 1 ayant la même chance d'être tiré.

Loi de probabilité

La fonction de distribution est l'outil statistique par excellence en probabilité. Cependant, d'un point de vue pratique, on lui préfère sa dérivée qui est plus parlante : la loi de probabilité. En effet, c'est la pente de la fonction de distribution qui indique si une valeur a une forte probabilité ou pas de survenir. Cela revient en statistique à faire l'histogramme vu aussi dans la première partie de ce cours.

La figure en bas à gauche montre la dérivée de la fonction de distribution pour un lancer de dé. On retrouve le résultat classique qui veut que la probabilité de sortir un 1, 2, 3, 4, 5, ou 6 soit identique et égale à 1/6. La figure en bas à droite fait de même mais avec la loi uniforme entre 0 et 1. La fonction est une courbe plate montrant bien que chaque valeur a une même probabilité.

Par la suite et pour finir cette partie théorique, plusieurs lois de probabilité incontournables sont passées en revue. La liste est évidemment non exhaustive.


Loi binomiale

La loi binomiale
Binomial_distribution.svg.png
Exemples de lois binomiales pour différent nombre de répétition (n) d'une loi à deux évènements et pour différentes probabilités de l'évènement 0 (p). Pour le même nombre de lancers n=20, le pic est à 14 avec un probabilté p = 0,7 et seulement 10 avec p=0,5. Pour n=40 et p=0,5, le pic est à 20, à la moitié du nombre de lancers, car il y autant de chance d'avoir l'évènement 0 que 1. En comparaison de n=20 et p=0,5, lorsque n=40, la fonction a un pic moins haut mais plus reséré, cela est dû au fait que le rapport entre l'espérance et l'écart type tend vers 0 lorsque n tend vers l'infini.
Crédit : Wikipédia

Lois à deux événements

Les lois n'ayant que deux évènements sont les plus simples mais aussi les plus utilisées. L'ensemble univers de ces lois de probabilités n'étant composé que de deux événements, il s'agit d'une variable discrète. Les événements peuvent être représentés par 0 et 1. Par exemple le jet d'une pièce suit ce type de lois : 0 étant par convention "pile" et 1 "face". L'évènement 0 a une probabilité notée p alors que l'événement 1 a une probabilité notée q. Toujours, dans le cas d'une pièce de monnaie, p = q = 1/2. De manière générale, p et q n'ont aucune raison d'être identiques comme dans le cas de la pièce de monnaie. Je peux inventer une expérience où je définis l'évènement 0 si un dé sort la valeur 1 et l'événement 1 si un dé sort 2, 3, 4, 5 ou 6. Dans ce cas p = 1/6 et q=5/6. De manière générale comme 0 et 1 forment l'ensemble univers, alors la probabilité P(0) + P(1) = 1 donc p + q = 1 et q=1-p. Les lois à deux événements ne dépendent donc que d'un paramètre, p.

Loi binomiale

En compléxifiant la loi vue ci-dessus, il est possible de créer la loi binomiale. Cette dernière s'intéresse aux résultats de plusieurs lancers d'une expérience n'ayant que deux événements possibles. Par exemple, lorsqu'une pièce est lancée 20 fois de suite, quelle est la probabilité d'avoir 10 faces ou 3 piles ou même 20 faces de suite ? La loi binomiale dépend donc de deux paramètres : la propabilité p de la loi à deux événements et le nombre de répétition de cette loi, n. Son ensemble univers est constitué de toutes les séries possibles de n répétitions de la loi à deux évènements. Le nombre d'événements vaut donc 2^n car à chaque répétition (n en tout) il y a deux événements possibles. Par exemple, lancer une pièce trois fois donne 2^3=8 évènements possibles. L'ensemble univers est en ce cas : (0, 0, 0), (0, 0, 1), (0, 1, 0), (0, 1, 1), (1, 0, 0), (1, 0, 1), (1, 1, 0), (1, 1, 1). Chaque évènement est donc constitué d'un certain nombre de 0, noté k, et de 1, noté n-k. Par définition la probabilité de 0 vaut p et celle de 1 vaut 1-p. Donc la probabilité d'un évènement est p^(k)*(1-q)^(n-k). L'intérêt dans ce type d'expérience est de savoir combien de fois sort l'évènement 0 ou 1 mais sans se soucier de l'ordre. Les évènements (0, 1, 0) ou (1, 0, 0) sont alors considérés comme identiques. La loi binomiale fournit la probabilité de tirer k évènements 0 sur N lancers. Pour cela, il suffit de remarquer que pour un nombre k d'événements 0 parmi N lancers, il est possible d'effectuer (C^n)_k = factorielle(n)/(factorielle(k)*factorielle(n-k)) permutations. Donc la probabilité recherchée, notée P(k), vaut P(k) = (C^n)_k*p^k * (1-q)^(n-k).

Propriétés de la loi binomiale

Sur N lancers, plus un évènement aura une grande probabilité plus il sortira souvent. Cependant, il est rare qu'il sorte pour chaque lancer. En conséquence, le pic de probabilité de la loi binomiale se situe en E[(N+1)*p], où E est la partie entière. Si p tend vers 1 alors le pic tendra vers N, à l'inverse il tendra vers 0. De plus, l'espérance de la loi binomiale vaut Np et son écart type vaut sqrt(N*p*(1-p)). Dans le cas ou N est très grand, un million par exemple, Le rapport écart-type sur espérance vaut sqrt(N*p*(1-p))/(N*p) = sqrt(1-p)/sqrt(N*p) prop 1/sqrt(N), il tend vers zéro. Si l'on voit l'espérance comme la mesure d'une observation et l'écart type comme son incertitude absolue alors, si N est très grand, l'incertitude relative sur la mesure sera très faible. Par exemple, dans un métal constitué de milliards d'atomes, supposons que les spins de chaque atome puissent être en haut ou en bas avec la même probabilité, p =1/2. Alors le métal n'aura pas de champ magnétique significatif car il aura statistiquement à chaque instant quasiment autant de spins en haut qu'en bas. La différence instantanée entre le nombre d'atomes ayant un spin en haut ou en bas, générateur d'un champ magnétique, sera en ordre de grandeur (1/2)*sqrt(n) = 0.5*sqrt(10^9) ~= 1500 ; ce qui fournira des champs très faibles en comparaison du potentiel que pourraient produire les 10^9 atomes du métal si tous les spins étaient alignés dans le même sens. De plus, ce champ magnétique est très instable dans le temps (on dit qu'il fluctue) et a une moyenne nulle au cours du temps.


La loi de Poisson

Loi de Poisson
Poisson.svg.png
Trois exemples de loi de probabilité derivé de la loi de Poisson pour trois valeurs de lambda : 1, 4 et 10.
Crédit : Wikipédia

Définition

La loi de Poisson, nommée d'après le mathématicien français Siméon Denis Poisson, s'applique à une variable discrète mais pouvant prendre des valeurs arbitrairement grandes. Son ensemble univers peut alors se confondre avec l'ensemble des entiers naturels. La loi de Poisson dépend d'un paramètre noté par usage lambda. La loi de probabilité de la loi de Poisson est P(x) = (lambda^x/fact(x))*e^(-lambda) toujours positive (voir figure). Si x vaut 0, comme lambda^0=1 et factorielle(0) = 1, alors P(0) = e^(-lambda). Lorsque x tend vers l'infini, P(x) tend vers 0 du fait du terme en factorielle qui domine le terme lambda^x. Cette loi de probabilité admet un unique pic, appelé aussi mode, avec la valeur de E(lambda), si lambda n'est pas un entier, et deux pics, lambda et lambda+1, si lambda est un entier. L'espérance ainsi que la variance de cette fonction valent lambda. L'écart type vaut donc sqrt(lambda).

Bruit de photons

Il a déjà été fait mention dans la première partie de ce cours sur les statistiques des exoplanètes, que les photons captés pendant un temps t par un pixel de caméra CCD suivent une loi de Poisson. De ce fait, lorsque plusieurs poses du même objet astronomique sont faites, durant par exemple 10 minutes, le nombre de photons d'un pixel provenant de l'objet décrit une loi de Poisson dont la moyenne qui est la mesure physique est le paramètre de la loi.


La loi normale

Loi normale
loi_normales.png
Trois exemples de fonctions de probabilités de loi normale avec différents espérances et écart-types.
Crédit : Wikipédia
Fonction de distribution de la loi normale
loi_normal_FD.png
La fonction de distribution de la loi normale dont l'écart-type vaut 1 et l'espérance 0.
Crédit : Wikipédia
Ecart-type de la loi normale
loi_normale_sigma.png
Figure du haut, boîte à moustaches représentant l'espace interquartile, les extrema théoriques étant à l'infini. Figure du milieu, la valeur exprimée en sigma des différents quartiles. Figure du bas, la probabilité d'avoir un résultat entre [-3*sigma, -1*sigma] (15,73 %), entre [-1*sigma, 1*sigma] (68,27 %) et enfin entre [1*sigma, 3*sigma] (15,73 %).
Crédit : Wikipédia

Définition

La dernière loi décrite est la plus connue si ce n'est la plus utilisée dans le domaine des statistiques. C'est le prolifique mathématicien allemand Carl Frierich Gauss qui la popularisa, elle porte son nom : la loi gaussienne aussi appelée loi normale. A l'inverse des deux précedentes lois, elle s'applique sur l'ensemble des réels. Pour un intervalle [x, x+dx], cette loi de probabilité vaut : P(x)*dx = (1/(sigma*sqrt(2*pi)))*e^(-(1/2)*((x-mu)/sigma)^2)*dx. Elle a deux paramètres qui sont mu, l'espérance de la fonction de probabilité, et sigma, l'écart type. Le terme devant l'exponentielle est un terme de normalisation afin que la probabilité totale de l'univers, donné par l'intégrale de cette loi depuis -infini jusque +infini, vale 1. Le mode, valeur pour laquelle la fonction connaît un pic, est égale à sa moyenne, mu. L'écart-type à l'espérance est donné par sigma. A 1*sigma la probabilité chute d'une facteur sqrt(e) ~= 1,648 ; à 3*sigma, ce facteur devient e^4,5, soit un peu plus de 90. La chute est donc très rapide à mesure qu'on s'éloigne de la valeur moyenne. En d'autres termes, la probabilité de voir sortir un réel séparé de plus de 3*sigma de la moyenne devient très faible, et cette probabilité devient quasiment nulle à 5*sigma (voir la troisième figure).

Une loi pour les erreurs de mesures

Lorsqu'une expérience est effectuée plusieurs fois, un résultat un peu différent de celui attendu apparaît. La différence entre la vraie valeur et notre mesure est appelée l'erreur. Par exemple, dans le cas de la fabrication de pièces mécaniques dans l'industrie, aucune pièce n'est strictement identique à une autre. Il y a donc un écart (une erreur) à la valeur désirée par le fabricant. Les causes des erreurs peuvent être multiples mais si elles sont sans lien entre elles (on dit qu'elles sont indépendantes), alors la loi de probabilité suivie par les erreurs est une gaussienne. Deux qualificatifs caractérisent une expérience ou la machine fabriquant une pièce mécanique : la fiabilité et la précision. La fiabilité informe si vous êtes en accord avec l'espérance en calculant la différence entre la moyenne obtenue et la valeur réelle. La précision quantifie l'incertitude pour chaque expérience, elle est donnée par l'écart-type, sigma. Si la moyenne diffère significativement de l'espérance ("signifcativement" voulant dire "par rapport à l'écart-type"), on parle de mesure biaisée.


Exercices

Auteur: Sylvain Fouquet

Exercices

Ce chapitre a pour but de revoir et de tester les connaissances sur la théorie des probabilités. Quelques questions de cours rappellent les concepts clés, puis, des questions proches du cours en sont une application directe pour tester la bonne compréhension du concept. Ensuite, des exercices, supposant que le cours est bien appris et compris, utilisent les probabilités pour résoudre des problèmes particuliers.


Variables aléatoires

exerciceCours

Difficulté :   

Question 1)

Qu'est-ce qu'une variable aléatoire ?

Question 2)

Quels sont les deux types de variables aléatoires ?

exerciceExercice sur les variables aléatoires

Difficulté :   

Question 1)

Ayant deux dés distinguables, un bleu et un rouge, combien d'événements sont possibles en les lançant ? Notez bien que l'évènement "Face 1" pour le dé rouge et "Face 2" pour le dé bleu, noté (1,2), n'est pas le même événement que "Face 2" pour le dé rouge et "Face 1" pour le dé bleu, noté (2,1).

Question 2)

Même question avec deux dés rouges que l'on choisit de ne pas distinguer. En d'autres termes, les couples tels que (2, 1) et (1, 2) sont considérés comme un unique évènement.

Question 3)

Supposons un générateur parfait de nombres aléatoires réels dans l'intervalle [0, 1[. Quels sont les évènements possibles et combien y en a-t-il ?

Question 4)

L'ordinateur n'est pas parfait et ne peut garder en mémoire que 4 chiffres après la virgule. Combien d'événements le générateur de la question 3) peut-il alors fournir ?


Ensemble

La théorie des probabilités se sert beaucoup de la théorie des ensembles. Ces exercices ont pour but de vous l'illustrer

exerciceCours sur les ensembles

Question 1)

Définir l'union de deux ensembles A et B ? Quelle est alors la probabilité P(A cup B), le signe cup signifiant Union ?

Question 2)

Définir l'intersection de deux ensembles A et B. Que dire de P(A cap B) par rapport à P(A) et P(B) pour des variables discrètes à valeurs dans un ensemble fini ? Donner un exemple où P(A cap B)=0. Notez que le symbole cap signifie l'intersection.

Question 3)

Quelle est la probabilité P(A U B U C) en fonction de P(A), P(B) et P(C) ?

Question 4)

Définir le complémentaire de l'ensemble A. Quelle est alors sa probabilité par rapport à P(A) ?


Probabilités à variables discrètes et équipartition

exerciceLancers de deux dés

Difficulté :   

Question 1)

Soit deux dés distincts que l'on lance, quels sont les différents événements et leurs probabilités ?

Question 2)

On s'intéresse maintenant à la somme des deux dés. Quels sont les événements possibles et comment sont-ils liés aux événements de la question précédente ? De là, quelles sont leurs probabilités ?

Question 3)

Commentez la nouvelle loi de probabilité calculée.

Question 4)

Vaut-il mieux tenter de faire un 6 avec un dé ou avec la somme de deux dés ?

exerciceJeu de fléchettes

Difficulté : ☆☆  

Question 1)

Soit un jeu de fléchettes avec une cible de rayon 10 cm. Quels événements considère-t-on en général dans ce jeu ? Sur quoi est basée la probabilité de ces derniers ?

Question 2)

On suppose que la moitié des fléchettes n'atteint pas la cible et que la zone centrale donnant le plus de point a un rayon de 1 cm. Quelle est alors la probabilité de faire le maximum de points ?


Probabilités conditionnelles

exerciceFaux positifs

Difficulté : ☆☆  

Lors du dépistage d'une maladie rare, touchant près d'une personne sur mille, les tests ne sont pas fiables à 100%. Après une campagne de dépistage, il y a alors des faux positifs, c'est-à-dire des personnes dépistées comme malades alors qu'elles sont saines. À l'inverse, il y a aussi des faux négatifs, c'est-à-dire des personnes dépistées comme saines mais en réalité malades. Le problème est alors de savoir quelle est la proportion de faux positifs parmi les détections.

On suppose qu'un patient malade est détecté par le dépistage avec une probabilité de 99%. À l'inverse, un patient sain est détecté comme tel avec une probabilité de 95%.

Question 1)

Quel est la malchance d'être diagnostiqué faux-positif, c'est à dire, quelle est la probabilité qu'une personne positive soit en fait non malade ?

Question 2)

Qu'en déduire sur le résultat d'un test positif ? Comment expliquer cela ?


Fonction de distribution

exerciceCours

Difficulté :   

Question 1)

Pour la variable x, Démontrer que variance(x) = moyenne(x^2) - mu^2 pour une variable discrète. (La démonstration est similaire pour une variable continue en changeant le signe somme en intégrale). moyenne(x^2) signifie l'espérance de x^2 et mu = moyenne(x).

Question 2)

Définir la fonction de distribution d'une loi de probabilité.

Question 3)

Quelle est la fonction de distribution de la loi de probabilité : p(x) = (3/2)(1-x^2) pour x dans l'intervall [0, 1], et p(x) = 0 en dehors.


Propriétés et applications de la loi binomiale

exerciceLoi binomiale

Difficulté :   

Question 1)

Définir la loi de probabilité binomiale ? Quelles sont ces propriétés : espérance et écart-type ?

Question 2)

Pour des événements de 30 lancers d'une pièce de monnaie non biaisée, combien de combinaisons présentent 28 lancers "face" ? Combien présentent 13 lancers "pile" ?

Question 3)

Si la probabilité d'avoir pile vaut p = 0,2, quelles sont alors les probabilités d'avoir 28 faces ou 13 piles ?


Propriétés et applications de la loi poissonnienne

exerciceLoi de Poisson

Difficulté :   

Question 1)

Définir la loi de probabilité de Poisson ? Quelles sont ses propriétés : espérance et écart-type ?

Question 2)

Soit un champ de 100 m², il tombe des gouttes de pluie en 10 secondes suivant une loi de Poisson de paramètre lambda = 1240,23. Combien en moyenne, tombera-t-il de gouttes d'eau dans ce champ en 1 heure ?


Propriétés et applications de la Gaussienne

exerciceLoi Normale

Difficulté :   

Question 1)

Définir la loi de probabilité normale ? Quelles sont ses propriétés : espérance et écart-type ?

Question 2)

Pour une loi normale de moyenne nulle, quelles sont les probabilités d'avoir, un résultat en dehors de 1 ou 3 sigma (sigma étant l'écart-type) ?

Question 3)

Supposons qu'un modèle physique prédise une mesure théorique de 20 mètres lors d'une expérience. L'expérimentateur fait l'expérience et trouve 19,5 mètres. Que dire sur le modèle physique selon que l'incertitude est de 0,5 m ou de 0,05 m ?


Mini-projet

Auteur: Sylvain Fouquet

Mini-projet

Dans cette dernière partie du cours, un ensemble d'exercices fait une synthèse entre la statistique des exoplanètes et les lois de probabilité. Les cinq exercices utilisent les lois de probabilité pour réfléchir sur les exoplanètes. Il faut noter que les hypothèses faites dans les énoncés (distribution des planètes autour d'une étoile donnée, détectabilités des exoplanètes) sont des hypothèses ad hoc. Ces propriétés sont encore très mal connues.


Contrôle

exerciceCombien d'exoplanètes dans la Voie Lactée ?

La première question concerne le nombre d'exoplanètes dans les sytèmes planétaires de notre galaxie, la Voie Lactée, en comparaison des planètes du système solaire. Notez que jusqu'à ce jour, on ne détecte que les exoplanètes de la Voie Lactée. On ne sait rien des planètes des milliards d'autres galaxies connues.

Supposons que la Voie Lactée soit constituée de 100 milliards d'étoiles, ce qui est juste au première ordre. Supposons aussi que la probabilité de trouver des planètes autour d'une étoile soit la même pour chaque étoile. Ceci est sûrement faux mais simplifie les calculs. Enfin supposons que la loi de probabilité du nombre de planètes par étoile est une loi de Poisson ayant un paramètre lambda égal à 5.

Question 1)

Combien en moyenne y a-t-il d'exoplanètes autour des étoiles ? Quelle est la probabilité de trouver un système planétaire avec un nombre égal à la moyenne ?

Question 2)

Quel est la probabilité de trouver un système planétaire tel que le système solaire, avec huit planètes ou avec au moins huit planètes ? Que conclure sur le système solaire dans ce cas ?

Question 3)

Considérant les données observationnelles, la plupart des exoplanètes sont seules autour de leur étoile. Dans ce cas, la loi des grands nombres tendrait à montrer que la moyenne des exoplanètes par étoiles serait proche de 1. Que devient la chance de trouver un système solaire dans un tel cas. Quelle est l'erreur de raisonnement fait ici ?

Question 4)

Combien statistiquement devrait-il y avoir d'exoplanètes dans la Voie Lactée ?

exerciceLes Jupiter Chauds

Cet exercice porte sur les Jupiter Chauds, des exoplanètes ayant une masse similaire à celle de Jupiter et très proches de leur étoile. Outre leur intérêt physique qui obligent à repenser la formation et l'évolution des planètes, ces planètes sont aussi intéressantes d'un point de vue statistique, car elles sont plus faciles à détecter et donc moins sujettes aux biais observationnels. Cet exercice montre que même avec une faible fraction de Jupiter Chauds dans la galaxie, cette population peut paraître la plus importante avec des moyens obervationnels limités.

Supposons toujours que les étoiles ont toute la même loi de probabilité d'avoir des planètes, un loi de Poisson avec une moyenne de 5. Supposons que la probabilité pour une planète d'être un Jupiter Chaud soit de 0,0001. Supposons que l'on soit sûr de pouvoir les découvrir à une distance de 2 kpc. On suppose aussi que la probabilité qu'une planète soit de type Terre est de 0,1 mais qu'il n'est possible de la trouver qu'à moins de 50 parsec.

Question 1)

Quelle loi de probabilité va servir pour déterminer le nombre de Jupiter Chauds ou de planètes de type Terre par la suite?

Question 2)

Combien de Jupiter Chauds et de planètes de type Terre y aurait-il dans la Voie Lactée ? Quel est leur rapport ?

Question 3)

En sélectionnant 100 000 étoiles brillantes dans le ciel, toutes à moins de 2 kpc, dont 27 sont à moins de 50 parsec, combien statistiquement y aura-t-il de Jupiter Chauds et de planètes de type Terre découverts? Quel est leur rapport ? Conclure.

exerciceRelation étoiles-exoplanètes

Cet exercice s'intéresse aux relations qui pourraient exister entre les exoplanètes et leur étoile hôte. La théorie bayésienne est alors utilisée. Dans un vision plus réaliste des exoplanètes que pour les exercices précédents, la probabilité de présence de planètes n'est pas la même pour les différents types d'étoiles.

Question 1)

Lors d'une observation non biaisée, c'est à dire complète, pour détecter des planètes géantes gazeuses sur 200 étoiles, 28 planètes géantes gazeuses sont découvertes autour de 75 étoiles de métallicité plus grande que 0 (étoiles riches en métaux) et seulement 2 pour les 125 étoiles de métallicité plus petite que 0 (étoiles pauvres en métaux). A chaque fois, les planètes gazeuses géantes sont trouvées seules sans autre géante gazeuse. Que dire qualitativement de l'influence de la métallicité sur la détection de planètes gazeuses?

Question 2)

Soit, G, l'ensemble des étoiles ayant la propriété suivante "avoir une seule planète gazeuse pour une étoile" et son contraire NG ainsi que l'ensemble M ="avoir une étoile riche en métaux" et son contraire NM. Avec les données de l'énoncé, quelles sont les probabilités de P(G), P(NG), P(M), P(NM) ?

Question 3)

Que signifient les probabilité suivantes P(G|M) et P(G|NM) ? Quelles sont leurs valeurs ? Les comparer à P(G) et commenter.

Question 4)

Pour une étoile choisie au hasard, une unique planète géante gazeuse est observée. Qu'elle est la probabilité pour l'étoile d'être une étoile riche en métaux, P(M|G) ? Commenter.

Question 5)

Comparer la probabilité que l'étoile avait d'être riche en métaux avant et après la découverte de la planète géante gazeuse. Quels sont les points forts et les points faibles de cette méthode pour connaître la métallicité d'une étoile ?

exerciceDétection d'une exoplanète par transit

Transit d'exoplanètes
transit.png
Différentes configurations de transit d'exoplanète. La direction de la ligne de visée est indiquée à droite. De la gauche vers la droite: une orbite d'exoplanète ayant un angle nul avec la ligne de visée, il y a un transit assuré, ensuite une exoplanète dont l'orbite fait un angle de quelques degrés, noté alpha, avec la ligne de visée, enfin une exoplanète dont l'orbite est perpendiculaire à la ligne de visée, l'exoplanète n'est alors pas visible par transit.
Crédit : Sylvain Fouquet

Lors d'un transit, une exoplanète passe devant son étoile depuis un observateur sur terre, la luminosité de l'étoile est alors diminuée durant un certain laps de temps avant de revenir à la normale. Cette mesure permet la détection d'une exoplanète. Lorsqu'une exoplanète est recherchée par la méthode des transits, les observateurs espèrent que cette l'orbite de l'exoplanète passe devant l'étoile hôte pour un observateur terrestre. Il y a un facteur chance pour détecter des transits d'une étoile donnée. Les campagnes de recherche observent un grand nombre d'étoiles et l'analyse des données nécessite de corriger le taux de détection de transits de la probabilité d'observer ces transits.

Question 1)

Supposons qu'une étoile ait un rayon de 1 million de km (par comparaison le Soleil fait près de 700 000 km de rayon), quel angle maximal, sur le plan d'une trajectoire circulaire d'une exoplanète à 1 U.A., faut-il pour voir un transit? Notons qu' une inclinaison de 0 degré signifie que la trajectoire est vue de côté, donc qu'il y a un transit, et qu'une inclinaison de 90 degrés signifie que la trajectoire est vue de face, donc sans transit.

Question 2)

Que dire sur l'influence du rayon de l'étoile et de la distance de l'exoplanète à cette étoile sur l'angle minimal requis pour détecter l'exoplanète ? Commenter le biais de cette méthode.

Question 3)

Que se passe-t-il qualitativement si l'orbite n'est plus circulaire mais elliptique ? Commenter sur un autre biais de la méthode des transits.

Question 4)

Dans le cas précédent (une exoplanète à 1 U.A. d'une étoile de rayon 1 millions de km), quelle est la probabilité de la détecter, sachant qu'aucun angle n'est a priori préféré pour son orbite circulaire ?

Question 5)

Que devient cette probabilité pour un Jupiter Chaud (distant de son étoile de 0.1 U.A) autour d'une étoile géante ayant un rayon de 10 millions de km ?


Conclusion

Au fil de ce cours plusieurs concepts clés sur la théorie des probabilités ont été étudiés. Premièrement, il y a eu l'idée de variables aléatoires qui signifie que pour la même expérience les résultats sont différents. Il peut y en avoir un nombre fini, comme pour le lancer d'un dé, ou infini comme pour le temps entre deux averses. Ensuite, l'idée qu'à chaque résultat ou évènement, il est possible d'associer une probabilité allant de 0, l'impossibilité, à 1, la certitude. Enfin, quatre lois de probabilités très utilisées ont été présentées : la loi d'équipartition lorsque tous les évènements ont la même probabilité, la loi binomiale, la loi de Poisson et la loi Normale.

Quant à la statistique, elle est en pratique utilisée pour découvrir ces lois de probabilités. Dans ce cours, le support a été l'étude des exoplanètes. L'étude d'un échantillon a montré des propriétés sur la masse, le rayon ainsi que le péricentre des exoplanètes.

Ce cours n'est évidemment qu'une introduction aux probabilités. Une étude plus approfondie permettra de mieux comprendre la définition mathématique rigoureuse des probabilités. De plus, avec le couple probabilité-statistique, il est possible de tester différentes lois de probabilité et de les confronter à des données statistiques pour en déduire si la loi à de fortes chances d'être correcte ou est sûrement fausse. Cela se fait par l'utilisation de tests statistiques, tels que le test Kolmogorov-Smirnov. Les probabilités servent aussi à ajuster des courbes ou des modèles. Cela se fait avec le test dit du "chi2" pour chi^2. Ce ne sont ici que des exemples très connus mais le couple probabilité-statistique est bien plus riche et peut servir dans bons nombres de domaines scientifiques et même économiques.


-------------FIN DU CHAPITRE -------------FIN DU CHAPITRE -------------FIN DU CHAPITRE -------------FIN DU CHAPITRE -------------

ACCES AU PLAN DES CHAPITRES


Réponses aux QCM

pages_nanosats-setester/qcm-partie-decouvrir.html

QCM 'Découvrir'

pages_qcm/objetobserves.html

QCM 'Paramètres'

pages_qcm/objetobserves.html

QCM 'Cibles'

pages_qcm/atmosphere.html

QCM 'Atmosphère'

pages_qcm/instrumentsqcm.html

QCM 'Séparer'

pages_qcm/instrumentsqcm.html

QCM 'Corriger'

pages_gcm-se-tester/gcm-qcm1.html

QCM

pages_gcm-se-tester/gcm-qcm1.html

QCM

pages_gcm-se-tester/gcm-questions-qcm2.html

QCM 'Question de cours'


Réponses aux exercices

pages_nanosats/exercice-representation-attitude.html

Exercice 'Angles d'Euler'


pages_nanosats/exercice-representation-attitude.html

Exercice 'Quaternions'


pages_nanosats/exercice-equations-mouvement.html

Exercice 'Cinématique d'attitude avec la MCD'


pages_nanosats/exercice-equations-mouvement.html

Exercice 'Cinématique d'attitude avec les angles d'Euler'


pages_nanosats/exercice-equations-mouvement.html

Exercice 'Cinématique d'attitude avec les quaternions'


pages_nanosats/exercice-couples-perturbateurs.html

Exercice 'Couples perturbateurs agissant sur un CubeSat'


pages_nanosats/exercice-propulsion.html

Exercice


pages_nanosats/exercice-lois-de-commande.html

Exercice 'Étude d'un ressort'


pages_dir-imagerie/astronomie.html

Exercice 'Astronomie'


pages_dir-imagerie/detectabilite.html

Exercice 'Détectabilité'


pages_dir-imagerie/probleme-questions.html

Exercice 'Distances'


pages_dir-imagerie/probleme-questions.html

Exercice 'Technique'


pages_ind-vr/exercice1.html

Exercice 'Astrométrie'


pages_ind-vr/exercice5.html

Exercice 'Bonnes et mauvaises configurations d'observation'


pages_ind-vr/exercice5.html

Exercice 'Qu'est-ce que les vitesses radiales permettent de mesurer ?'


pages_ind-vr/exercicebp.html

Exercice 'Magnitude et temps d'observation'


pages_ind-transits/taille.html

Exercice 'Transit de planètes du système solaire'


pages_ind-transits/candidates.html

Exercice 'Détectabilité des planètes par transit'


pages_ind-transits/setester.html

Exercice 'HD 189733'


pages_ind-transits/wasp89-donnees.html

Exercice


pages_ind-transits/wasp80-recherche.html

Exercice 'La recherche des transits'


pages_ind-transits/wasp80-planete.html

Exercice 'WASP-80 : Les paramètres de la planète'


pages_circulation-globale/gcm-comprendre-surface.html

Exercice


pages_circulation-globale/gcm-exercices.html

Exercice


pages_circulation-globale/analyse.html

Exercice


pages_stat-exercice/variable.html

Exercice 'Cours'


pages_stat-exercice/variable.html

Exercice 'Exercice sur les variables aléatoires'


pages_stat-exercice/ensemble.html

Exercice 'Cours sur les ensembles'


pages_stat-exercice/proba-discrete.html

Exercice 'Lancers de deux dés'


pages_stat-exercice/proba-discrete.html

Exercice 'Jeu de fléchettes'


pages_stat-exercice/bayes.html

Exercice 'Faux positifs'


pages_stat-exercice/fdd.html

Exercice 'Cours'


pages_stat-exercice/prop-binomiale.html

Exercice 'Loi binomiale'


pages_stat-exercice/prop-poissonnienne.html

Exercice 'Loi de Poisson'


pages_stat-exercice/prop-gaussienne.html

Exercice 'Loi Normale'