Comment l’intelligence artificielle peut-elle aider à prévoir des événements extrêmes dans le domaine de l’hydrologie ? C’est la problématique sur laquelle travaill !e Anne Johannet, directrice du Centre de Recherches et d'Enseignement en Environnement et en Risques (CREER) d'IMT Mines Alès. L’objectif de ses travaux est de mettre au point des systèmes capables d’anticiper la survenue d’aléas tels que des crues, pour permettre aux gestionnaires privés et publics de l’eau d’en limiter les impacts. Des solutions attendues avec impatience par ces acteurs ? « En réalité, les gestionnaires sont généralement réticents à utiliser l’IA », observe, au contraire, la chercheuse. « Puisqu’il s’agit de modèles statistiques – et non physiques –, s’appuyant donc sur des données passées, ils les estiment incapables de prédire des événements extrêmes futurs, à plus forte raison dans un contexte de changement climatique. »
Avant même les défis scientifiques qui se présentent à eux, les chercheurs doivent ainsi d’abord faire face au scepticisme de leurs interlocuteurs. Pourtant, le recours à l’IA en hydrologie ne manque pas d’arguments. « Les modèles physiques s’avèrent très utiles pour modéliser des systèmes hydrologiques que l’on pourrait qualifier de simples, mais leur pertinence est mise à mal dans des cas plus complexes », note Anne Johannet. « C’est là que l’IA intervient. D’autant que nos modèles ne nécessitent que des informations souvent mesurées en entrée : les pluies et la hauteur d’eau. À l’inverse, les modèles physiques requièrent une multitude de caractéristiques : profondeur du cours d’eau, sa largeur, la rugosité du lit, etc. Autant de données à collecter sur le terrain, ce qui entraîne des coûts significatifs, dont l’IA s’affranchit en grande partie. »
Afin d’approfondir les travaux déjà menés par le CREER en la matière, son équipe « Eau, Ressources, Territoires » (ERT) – intégrée au laboratoire HydroSciences Montpellier – s’est associée à l’entreprise Synapse, société d’ingénierie développant des systèmes de surveillance des données dans le domaine de l’eau. Ensemble, les deux acteurs ont créé, en 2021, le laboratoire commun Hydr.IA, financé par l’Agence nationale de la recherche (ANR) et codirigé par Anne Johannet et Octavian Dobricean, directeur associé de Synapse. Son objectif : mettre au point des solutions de prévision hydrologique reposant sur l’intelligence artificielle, en particulier le deep learning.
Cependant, comme évoqué précédemment, le premier défi d’Hydr.IA consiste à convaincre les gestionnaires de l’eau, méfiants à l’égard de l’IA. C’est pourquoi l’équipe du laboratoire commun a premièrement œuvré à la réalisation d’un démonstrateur prouvant la pertinence d’une telle approche. « Il était également question d’explicabilité des modèles », complète Anne Johannet. « En effet, l’IA se comporte généralement comme une "boîte noire" : le résultat qu’elle fournit n’est pas expliqué, ce qui peut amplifier la méfiance des utilisateurs. Nous avons donc travaillé à expliquer le fonctionnement de notre modèle, en nous appuyant sur une précédente thèse conduite au CREER. »
Comment l’IA parvient-elle à « apprendre » à prévoir de futures crues ? « Nous avons alimenté notre modèle à partir d’une base de données fournies par des clients de Synapse, couvrant une période d’une vingtaine d’années », présente la chercheuse. « Nous l’avons calibré à partir de ces informations, de sorte qu’il apprenne le fonctionnement physique de l’hydrosystème en question. Et l’avantage de cette approche, par rapport à un modèle physique, est de pouvoir tester un grand nombre de variables. Par exemple, dans le cadre d’une étude sur la ville d’Anduze, nous nous sommes aperçus qu’indiquer le cumul de pluie ne suffisait pas à prévoir une crue. En revanche, si nous ajoutions l’intensité maximale des précipitations en entrée, combinée avec d’autres variables, nous obtenions de bien meilleurs résultats. »
Comme pour chaque modèle d’IA, une des clés se situe ainsi dans la pertinence et le volume de données mis à sa disposition. Dès lors, que faire si elles s’avèrent incomplètes ou en quantité insuffisante ? « Pour pallier le manque de données, nous faisons parfois appel à des "proxys", c’est-à-dire à des éléments liés à des variables physiques manquantes », indique Anne Johannet. « Par exemple, si l’on souhaite connaître le débit d’une rivière, on peut utiliser celui d’une rivière à proximité, et le modèle apprend le coefficient nécessaire pour obtenir une estimation pertinente. »
Le démonstrateur, reposant sur un modèle de deep learning entraîné sur ces données et développé par Synapse, a été testé dans le cadre d’un partenariat avec la ville de Nîmes. Convaincue par les résultats obtenus, la commune du Gard va désormais implémenter l’outil d’Hydr.IA au sein de son système de prévention des inondations (ESPADA).
Un autre enjeu de l’utilisation de l’IA en hydrologie réside dans sa capacité à généraliser. En d’autres termes, un modèle ayant appris à partir de données spécifiques à un hydrosystème peut-il s’adapter à d’autres bassins versants, dont les caractéristiques peuvent sensiblement varier ? « Répondre à cette question revient à déterminer ce qui fait qu’un bassin versant se comportera de façon similaire à un autre », précise Anne Johannet. « Nous recherchons donc les variables ayant une influence sur le comportement d’un bassin versant, telles que sa surface, le type d’occupation des sols, l’intensité des pluies… »
C’est l’objet du projet en cours Hydrafia, financé par l’institut Carnot Eau & Environnement et porté par Yves Tramblay. Directeur de recherche en hydrologie au sein de l'Institut de recherche pour le développement (IRD), il a développé, dans le cadre de cette activité, une base de données inédite portant sur plus de mille bassins versants situés en Afrique, une ressource essentielle pour ces travaux. Le modèle de deep learning va ici apprendre à partir d’un bassin pilote et chercher à identifier des variables statiques (par opposition à la pluie, par exemple) pertinentes. Il s’agit ensuite de vérifier si, lorsqu’on l’alimente avec les informations d’un autre bassin – les mesures relatives aux variables statiques identifiées, auxquelles s’ajoutent les données de pluie –, il est capable de fournir les débits attendus. L’opération est alors répétée jusqu’à obtenir des résultats satisfaisants, une démarche aboutissant à la fois à la production d’un modèle fonctionnel et à une liste de variables statiques pertinentes.
Si divers modèles d’IA peuvent être employés en hydrologie, tous possèdent un dénominateur commun : l’importance capitale des données de pluie afin d’estimer les débits d’eau. Par conséquent, pour améliorer les résultats obtenus, une autre piste consiste à disposer de prévisions précises de pluie. Davantage que celles fournies par Météo-France ? « Nous travaillons sur des bassins montagneux au sein desquels les prévisions de précipitations sont difficiles à établir, alors que nous avons besoin d’une grande précision temporelle et spatiale », expose Anne Johannet. « Météo-France ne peut pas fournir des informations aussi détaillées sur tous les bassins français. En revanche, depuis peu, il met gratuitement à disposition ses données, ce qui nous ouvre de nouvelles perspectives. »
En effet, une thèse a été lancée à ce sujet en 2023, dans le cadre d’Hydr.IA, et il n’est pas question de partir de zéro, mais de s’appuyer sur les données fournies par Météo-France et d’apprendre à les utiliser. Pour cela, un modèle de deep learning cherchera à les exploiter de différentes façons. Cette analyse permettra ensuite, en conditions réelles, de définir les meilleurs protocoles d’utilisation des prévisions de pluie de Météo-France, afin d’éventuellement compenser leur « biais » et ainsi de prévoir les débits d’eau avec davantage d’anticipation.
Si les projets précédents s’intéressent aux eaux de surface (hydrologie), le laboratoire commun devrait par la suite aborder des problématiques associées aux eaux souterraines (hydrogéologie). En se concentrant toujours sur les hydrosystèmes les plus complexes, notamment les cas où l’eau circule dans les fentes d’une roche fracturée. « Les nappes souterraines ne se rechargent pas toutes à la même vitesse », souligne Anne Johannet. « Certaines vont mettre des milliers d’années à se recharger, tandis que d’autres le feront à la suite d’une seule pluie de grande intensité. Nous souhaitons ainsi mettre au point un modèle d’IA capable de prévoir la recharge des nappes, donc la hauteur de l’eau au sein des roches, à partir de différents scénarios de pluie, afin d’anticiper la gravité d’éventuels épisodes de sécheresse. » Dans un contexte de changement climatique, impliquant une diminution du niveau des eaux en surface et donc une sollicitation croissante des nappes souterraines, l’intérêt d’un tel outil paraît ainsi clair… comme de l’eau de roche.