Publié le 5 juin 2025 Mis à jour le 25 juin 2025

Grand gagnant du Prix Jeunes Chercheurs 2025 de la Ville de Clermont-Ferrand, Etienne Russeil se prête au jeu de l'interview sur sa thèse, son parcours scientifiques et les avancées qu'ont permis ses travaux dans le domaine de l'astrophysique.

Les mathématicien·ne·s ont de la concurrence… De formation en astrophysique, Etienne Russeil a développé au cours de sa thèse une méthode de machine learning[1] inédite. Elle génère des modèles mathématiques qui décrivent des phénomènes astronomiques de façon optimisée. À l’occasion du « Prix Jeunes Chercheurs » organisé par la ville de Clermont-Ferrand le 15 avril dernier, il a relevé le défi de présenter ses recherches au grand public et a remporté le Grand Prix de la ville de Clermont-Ferrand.

Des modèles expliquant des phénomènes astrophysiques ont déjà été théorisés par des scientifiques … Quel est l’apport de votre thèse dans le domaine ?  

E. R. : Lors de ma thèse, je me suis intéressé plus particulièrement aux phénomènes transitoires astronomiques. Alors que les galaxies et les étoiles évoluent sur des millions voire des milliards d’années, certaines sources lumineuses ne brillent que quelques semaines voire quelques années au maximum. On les qualifie donc de phénomènes transitoires. Et le plus connu c’est la supernova, l’explosion d’une étoile. En général ce que l’on étudie de ces phénomènes c’est la luminosité qui s’accroit jusqu’à un certain point puis décroit, suivant une courbe. Une courbe de luminosité. J’en ai traité plusieurs centaines de milliers durant ma thèse. Parce que l’on ne peut pas décrire chaque courbe une par une, on cherche à automatiser l’analyse. On cherche à trouver un modèle mathématique, une équation générale, qui pourrait décrire l’ensemble des courbes de luminosité. À la différence de certains chercheurs qui ont théorisé des modèles, ici on fait de la programmation pour que ce soit la machine qui génère le modèle. Et moi j’ai utilisé une programmation qui s’inspire directement du vivant : la programmation génétique. Par exemple, on mélange des fonctions aléatoirement entre elles comme dans la reproduction. On fait tourner plusieurs générations de fonctions pour converger vers la bonne solution. On ressort avec des modèles que les astrophysicien·ne·s n’auraient pas pu inventer elleux-mêmes mais qui marchent bien et qui ont moins de paramètres à ajuster. Qui sont donc optimisés. En 2021, lorsque j’ai commencé à travailler sur cette méthodologie, personne n’avait publié quelque chose comme ça… C’est vraiment inédit !

Et les apports de votre thèse ne se limitent pas à l’astrophysique…

E. R. : L’algorithme que j’ai développé est un outil qui est très interdisciplinaire. On pourrait s’en servir dans plein de contextes en dehors de l’astrophysique et des supernovas. Pour vérifier que la méthode de programmation génétique pouvait être transférée dans d’autres domaines de recherche, au cours de ma thèse, j’ai contacté des chimistes de l’ICCF de Clermont. Je leur ai demandé de générer des données autour de l’absorption de molécules dans l’eau pour faire des tests avec notre algorithme et pour voir si on était capable de trouver de bons modèles. Et ça a fonctionné ! Une équation très simple, et que je trouve élégante, a été générée. On a également appliqué cet algorithme avec des données d’économie. Je pense que de façon générale, la méthode de machine learning que j’ai développée pourra être utile à la communauté scientifique. C’est assez fréquent que des chercheur·eu·ses aient des données qu’ielles ne savent pas tellement décrire parce que personne n’a jamais travaillé sur la question et qui tentent un modèle un peu approximatif et qui, faute de mieux, partent avec ça. On pourrait ainsi imaginer faire tourner notre algorithme pour leur trouver une solution simple et optimisée.

Comment votre thèse s’intègre au projet international Fink, un système de gestion de données astronomiques ?

E. R. : Aujourd’hui, les téléscopes génèrent une grande quantité de données d’observations. Par exemple, le LSST, produit 10 millions de détections d’éléments transitoires… Chaque nuit ! Et ces détections font l’objet d’une alerte dans le système informatique qui récupère les données. Le système Fink est capable de gérer en temps réel l’énorme volume d’alertes engendrées par le télescope. Et j’ai participé à la classification de ces données en classant les différents types de supernovas à l’aide du machine learning.

Vous avez gagné le Grand Prix de la ville lors de votre participation au Prix Jeunes Chercheurs organisé par la ville de Clermont-Ferrand. Comment avez-vous vécu cette expérience ?

E. R. : Ça s’est plutôt bien passé pour moi ! J’ai bien aimé l’exercice que j’ai trouvé assez amusant en fait. Parce que quand même, j’ai dû expliquer des notions pas si simples que ça, expliquer des équations… Qui, en général, font plutôt peur au public. Alors, j’ai utilisé des images, comme celle des équations représentées par des individus qui se reproduisent pour illustrer la programmation génétique et je crois que ça a fonctionné. C’était la première fois que j’expliquais ma thèse à une audience grand public. Peut-être que le fait que je consomme beaucoup de vulgarisation scientifique sur Youtube m’a inspiré ? En tous cas, je conseille vraiment aux doctorant·e·s de participer au Prix Jeunes Chercheurs car c’est un bon exercice. De manière générale, je trouve qu’essayer de résumer une idée complexe en 15 minutes aide à soi-même avoir une meilleure compréhension de qui est essentiel dans son idée.

Vous avez intégré l’université de Stockholm pour un contrat de post-doctorat. Est-ce dans la même lignée que votre thèse ?

E. R. : Oui, j’ai été embauché pour 3 ans pour continuer à faire de la classification sur un sous-type de supernova en particulier : les supernovas super lumineuses. Ce sont vraiment les événements les plus brillants, parmi les événements les plus brillants. Ici, je suis entourée d’experts purement astronomiques avec aucun bagage de machine learning. C’est intéressant pour moi parce que j’apprends plein de choses sur la physique des phénomènes transitoires et en même temps je peux aider dans le groupe en apportant les compétences en machine learning qu’ils n’ont pas.
 

[1] Machine learning ou "apprentissage automatique" est un champ d'étude de l'intelligence artificielle qui vise à donner aux machines la capacité d'« apprendre » à partir de données, via des modèles mathématiques.


>> Retrouvez Étienne et les 14 docteur·e·s du Prix Jeunes Chercheurs 2025 en photo et en 5 questions