Bonjour à tous, c'est Malena — je suis journaliste d'investigation chez The Markup, mais je fais une pause dans mes plongées habituelles pour parler de quelque chose d'un peu plus léger : les oiseaux !
\ Plus précisément, je me suis intéressée à la façon dont l'intelligence artificielle (IA) transforme le monde de l'ornithologie. L'une des façons les plus importantes est à travers BirdCast, un projet qui utilise l'apprentissage automatique pour aider les scientifiques à prédire comment les oiseaux migrent en fonction des données météorologiques.
\ BirdCast est une collaboration entre le laboratoire d'ornithologie de Cornell, l'Université d'État du Colorado et UMass Amherst. Lancé en 2018, il utilise des données collectées à partir de 143 sites radar à travers les 48 états américains continentaux pour identifier les mouvements des oiseaux et prévoir comment ces oiseaux vont migrer.
Andrew Farnsworth est un scientifique invité au laboratoire d'ornithologie de Cornell qui travaille sur le projet depuis ses débuts dans les années 1990 et a rédigé la subvention pour ce qui deviendrait l'itération actuelle de BirdCast. L'entretien suivant a été édité pour plus de clarté et de concision.
\ Malena : Comment vous êtes-vous intéressé à l'observation des oiseaux ?
Andrew : J'avais un grand-père qui était scientifique. Il était biochimiste, mais il avait des jumelles à la maison et ce qui était considéré à l'époque comme du matériel de pointe dans un guide de terrain. Associé au fait de vivre dans un endroit relativement vert pour une banlieue de New York, dans le comté de Westchester, tout cela a créé l'étincelle. Le canard branchu et le pic mineur ont été en quelque sorte mes portes d'entrée.
\ Malena : Pourquoi est-il important de comprendre la migration des oiseaux ?
Andrew : Il y a trois bonnes réponses assez simples à cette question. À un niveau fondamental, les oiseaux sont de très bons indicateurs de leur environnement et de la santé de leur environnement. Pour cette raison, étudier les oiseaux migrateurs en particulier, parce qu'ils relient tant de parties de la planète, est simplement une très bonne façon de commencer à quantifier et qualifier : comment se portent nos écosystèmes ? Comment les valorisons-nous ? Comment les évaluons-nous ? Dans quel état de santé sont-ils ?
\ C'est aussi un très bon moyen d'impliquer les gens.
\ Et le troisième aspect concerne la science fondamentale. Comprendre les modèles et les observations que nous pouvons faire en tant qu'observateur avec des jumelles ou les oreilles vers le ciel est aussi important et de plus en plus connecté à tout ce que nous pouvons apprendre de la technologie dont nous disposons. Ce n'est qu'en 2018 que nous avons eu un chiffre sur le nombre d'oiseaux qui migrent la nuit au-dessus des États-Unis. C'est une quantité assez fondamentale que l'on veut connaître.
\ Malena : Comment l'intelligence artificielle et l'apprentissage automatique sont-ils utilisés dans BirdCast ?
Andrew : Nous devons, à partir des données radar, extraire ce qui relève de la météo et ce qui relève de la biologie ou des oiseaux. L'étiquetage de ces données et leur transformation en un modèle qui peut ensuite très rapidement déterminer : "oh, nous ne parlons que d'oiseaux dans ces données", l'apprentissage automatique est essentiel pour cela. Et c'est une excellente opportunité de faire de l'apprentissage automatique car il y a beaucoup de données [et] nous pouvons étiqueter ces données. Le travail le plus lourd pour l'apprentissage automatique dans le projet concerne cette création des ensembles de données, parlant de la migration des oiseaux par opposition aux précipitations ou autres phénomènes atmosphériques.
\ Il y a d'autres domaines intéressants et périphériques où l'apprentissage automatique commence à être impliqué, et le sera probablement de plus en plus, comme l'intégration de données supplémentaires. Le radar est excellent pour vous indiquer le nombre d'oiseaux et les modèles à grande échelle, mais il ne peut pas identifier les espèces. L'intégration de ce que nous appelons la science citoyenne ou la science communautaire, essentiellement les observations d'oiseaux... ou les cris de vol et les vocalisations des oiseaux migrant la nuit... va devenir de plus en plus un effort piloté par l'IA. Et cela va nécessiter beaucoup de calcul, mais [c'est] quelque chose qui, je pense, est tout à fait réalisable dans les années à venir.
\ Malena : Quelle est sa précision ?
Andrew : Le modèle général de ce qui est un oiseau et ce qui ne l'est pas... fonctionne vraiment bien, comme dans les 90% élevés si vous essayiez d'attribuer un pourcentage, une sorte d'exactitude. Et nous devons encore l'entraîner davantage. Il y a toujours des nouveaux cas intéressants, mais ils sont de plus en plus rares.
\ Le modèle de prévision est différent car il relie cet ensemble de données (migration des oiseaux sur radar) à autre chose (variables météorologiques). Ce modèle fonctionne également très bien [avec environ 80% de précision]. Ce n'est pas parfait, car 80% n'est pas 100%. Mais c'est de loin plus que suffisant pour faire un excellent travail de prédiction de l'intensité de la migration des oiseaux à travers les États-Unis où nous l'avons utilisé, et ce de manière constante au fil des ans.
\ Malena : Lorsque vous entraînez ces algorithmes à distinguer les oiseaux de tout le reste, quel genre de choses leur dites-vous de rechercher ?
Andrew : Il y a des modèles vraiment simples qui mettent d'abord en évidence : "d'accord, ceci est météorologique et cela ne l'est pas." La météorologie que l'on voit souvent sur le radar présente des modèles de pluie vraiment irréguliers — irréguliers en termes de formes qui apparaissent dans les images radar et qui ne sont pas uniformes. Ils ont aussi tendance à avoir ces valeurs de pixels, décrivant la réflectivité, ou la quantité d'énergie qui est renvoyée au radar, qui sont super variables, comme les orages — très haute intensité, très localisés.
\ Et c'est un modèle très différent du signal de migration des oiseaux sur le radar, et franchement, des insectes aussi. Le modèle biologique [tend] à être très uniforme et n'a pas cette forme extrêmement variable ou irrégulière. Lorsque vous étiquetez ces données en tant qu'expert... [vous pouvez dire] "compte tenu de ce que je sais sur la migration des oiseaux et aussi de la longueur d'onde du radar, les oiseaux sont beaucoup plus susceptibles d'être détectés que les insectes, je vais étiqueter ceci comme migration d'oiseaux. Et, ah oui, au fait, je sais quels sont les vents. Et il y a un autre produit de données qui provient du radar concernant la vitesse des choses qui sont dans l'atmosphère par rapport au radar. Oh, et ces choses se déplacent contre cela — ce sont définitivement des oiseaux."
\ Encore une fois, ce n'est pas parfait. Malgré le problème de longueur d'onde et le fait que les oiseaux sont beaucoup plus susceptibles d'être détectés, il y a des cas où il y a un très, très grand nombre d'insectes qui sont grands et volent rapidement. Il y a donc ces endroits où nous ne savons tout simplement pas : "s'agit-il d'oiseaux ou d'insectes ? Pas sûr. Je sais que c'est biologique ; ce n'est pas météorologique." Donc vous l'étiquetez ainsi. Nous n'avons pas beaucoup utilisé ces données dans le modèle. Mais à l'avenir, nous le ferons. Cela deviendra quelque chose de précieux une fois que cet ensemble de données se développera. C'est une autre chose pour l'avenir.
\ Malena : Vous avez déjà mentionné quelques éléments, mais qu'est-ce que l'IA ne peut pas encore faire pour BirdCast qui le rendrait meilleur ? Et à quel point êtes-vous proche d'y parvenir ?
Andrew : Il y a beaucoup plus d'informations dans les données radar au sens le plus brut, comme directement depuis la station radar, que nous, biologistes, ne voyons généralement pas. Elles sont filtrées, elles sont ajustées immédiatement d'un point de vue météorologique. [L'IA pourrait potentiellement] résoudre des modèles supplémentaires et aussi avoir des modèles qui tirent parti des différents moments que le radar produit.
\ À un niveau plus simple, il y a une réelle opportunité d'améliorer encore le modèle d'apprentissage automatique actuel, en particulier en ce qui concerne... l'interface oiseaux, insectes, chauves-souris du type "je sais que c'est biologique, mais je ne suis pas sûr de quoi."
\ Malena : Plus généralement, comment l'IA change-t-elle le domaine de l'ornithologie ?
Andrew : Elle le change de façon assez considérable. D'un point de vue général, l'idée que nous pouvons maintenant utiliser ces types de modèles et cette puissance de calcul pour reconnaître des images et des sons... et le faire avec une confiance très élevée, c'est énorme. Les gens ne s'en rendent peut-être pas compte — ils peuvent penser : "Je suis en train d'observer des oiseaux, je n'utilise pas beaucoup la technologie. Oui, j'utiliserai mon téléphone comme guide d'identification, et je lui ferai répondre à certaines questions si je ne connais pas les réponses." Mais cela signifie un engagement direct avec l'apprentissage automatique chaque fois que vous faites cela. Je pense donc qu'il y a un lien énorme, énorme très largement avec la façon dont nous faisons des observations.
\ Malena : L'ornithologie est l'un des rares domaines scientifiques où les gens ordinaires peuvent contribuer de manière significative. Quel rôle jouent les citoyens ordinaires en ornithologie en ce qui concerne l'IA ?
Andrew : Je pense qu'il y a effectivement un rôle très important. Les humains sont importants dans la modélisation de l'IA et dans tout l'apprentissage automatique en ce sens qu'ils sont les experts. Toutes les choses que vous faites dans votre cerveau qui vous amènent à dire : "Oh, j'ai vu un rouge-gorge, et j'en ai vu 10, et ils étaient à cet endroit précis." Ce sont des informations essentielles pour ces modèles à l'avenir. Et ainsi, les contributions deviennent les données brutes... sur lesquelles l'apprentissage automatique opère. Et il y a d'autres endroits où sortir et être un observateur sur le terrain où les données radar échantillonnent quelque chose dans l'atmosphère et être capable de faire cette connexion, ces éléments sont importants pour ce type de vérification sur le terrain. Les informations que les humains produisent, quelles qu'elles soient, que vous soyez un expert ou un novice, peuvent être vraiment essentielles comme noyaux sur lesquels ces modèles d'apprentissage automatique opèrent.
Merci de votre lecture.
\ Sincèrement,
\ Malena Carollo
\ Journaliste d'investigation
\ The Markup
\ Également publié ici
\ Photo par Mehdi Sepehri sur Unsplash


