Привет всем, это Малена — я журналист-расследователь в The Markup, но сейчас я делаю перерыв от своих обычных глубоких погружений, чтобы поговорить о чем-то более легком и воздушном: птицах!
\ Точнее, меня заинтересовало, как искусственный интеллект (ИИ) меняет мир орнитологии. Один из наиболее существенных способов — через BirdCast, проект, который использует машинное обучение, чтобы помочь ученым предсказывать, как птицы мигрируют на основе данных о погоде.
\ BirdCast — это сотрудничество между Лабораторией орнитологии Корнелла, Государственным университетом Колорадо и UMass Amherst. Запущенный в 2018 году, он использует данные, собранные со 143 радарных точек по всем нижним 48 штатам США, чтобы идентифицировать движения птиц и прогнозировать, как эти птицы будут мигрировать.
Эндрю Фарнсворт — приглашенный ученый в Лаборатории орнитологии Корнелла, который работал над проектом с момента его создания в 1990-х годах и написал грант на то, что стало нынешней итерацией BirdCast. Следующее интервью было отредактировано для ясности и краткости.
\ Малена: Как вы увлеклись наблюдением за птицами?
Эндрю: У меня был дедушка, который был ученым. Он был биохимиком, но у него дома были бинокли, и у него было то, что в то время считалось передовыми материалами в полевом справочнике. В сочетании с проживанием в относительно зеленом месте для пригорода Нью-Йорка, в округе Вестчестер, [это] все вместе стало искрой. Каролинская утка и пушистый дятел были своего рода воротами.
\ Малена: Почему важно понимать миграцию птиц?
Эндрю: На это есть три хороших, достаточно простых ответа. На каком-то фундаментальном уровне птицы являются действительно хорошими индикаторами своей среды и здоровья своей среды. Из-за этого изучение мигрирующих птиц, в частности, поскольку они соединяют так много частей планеты, является просто очень хорошим способом начать количественно и качественно оценивать, как обстоят дела с нашими экосистемами? Как мы их ценим? Как мы их оцениваем? Насколько они здоровы?
\ Это также очень хороший способ привлечь людей.
\ И третий аспект связан с фундаментальной наукой. Понимание моделей и наблюдений, которые мы можем делать как наблюдатель с биноклем или ушами к небу, так же важно и все больше связано со всем, что мы можем узнать из имеющейся у нас технологии. Только в 2018 году у нас появилась цифра о том, сколько птиц мигрирует ночью над США. Это довольно фундаментальная величина, которую вы хотите знать.
\ Малена: Как искусственный интеллект и машинное обучение используются в BirdCast?
Эндрю: Нам нужно из радарных данных извлечь, что является погодой, а что биологией или птицами. Маркировка этого и превращение в модель, которая затем может очень быстро определить: "о, мы говорим только о птицах в этих данных", машинное обучение критически важно для этого. И это отличная возможность для машинного обучения, потому что есть много данных [и] мы можем маркировать эти данные. Самая тяжелая работа для машинного обучения в проекте связана с созданием наборов данных, говорящих о миграции птиц, а не об осадках или других атмосферных явлениях.
\ Есть и другие интересные, периферийные места, где машинное обучение начинает участвовать, и, вероятно, будет все больше и больше, например, интеграция дополнительных данных. Радар отлично подходит для того, чтобы рассказать вам о количестве птиц и моделях в больших масштабах, но он не может идентифицировать виды. Интеграция того, что мы называем гражданской наукой или общественной наукой, в основном наблюдения за птицами... или звуки полета и вокализации птиц, мигрирующих ночью... будет все больше и больше управляемым ИИ предприятием. И это потребует много вычислений, но [это] что-то, что, я думаю, вполне достижимо в ближайшие годы.
\ Малена: Насколько это точно?
Эндрю: Общая модель того, что является птицами, а что нет, модель... справляется с этим действительно хорошо, как высокие 90-е, если бы вы попытались назначить процент, какой-то вид правильности. И нам все еще нужно тренировать ее дальше. Всегда есть интересные новые случаи, но они становятся все реже.
\ Модель прогноза отличается, потому что модель прогноза связывает этот набор данных (миграция птиц на радаре) с чем-то еще (переменные погоды). Эта модель также работает действительно хорошо [с точностью около 80 процентов]. Она не идеальна, так как 80 процентов — это не 100 процентов. Но она намного более чем достаточно хороша, чтобы отлично предсказывать интенсивность миграции птиц по всей территории США, где мы ее применяли, и делать это последовательно на протяжении многих лет.
\ Малена: Когда вы обучаете эти алгоритмы тому, как выделять птиц из всего остального, какие вещи вы говорите им искать?
Эндрю: Есть некоторые действительно простые паттерны, которые выделяют сначала: "хорошо, это метеорологическое, а это нет". Метеорология, которую вы часто видите на радаре, — это действительно нерегулярные паттерны дождя — нерегулярные с точки зрения форм, которые появляются на радарных изображениях, которые не однородны. Они также имеют тенденцию иметь эти значения пикселей, также описывающие отражательную способность, или количество энергии, которая рассеивается обратно к радару, которые супер изменчивы, как грозы — действительно высокой интенсивности, очень локализованные.
\ И это очень отличается от сигнала миграции птиц на радаре, и, честно говоря, насекомых тоже. Биологический паттерн [имеет тенденцию] быть очень однородным и не имеет этой дико изменчивой или нерегулярной формы. Когда вы маркируете эти данные как эксперт... [вы можете сказать] "учитывая то, что я знаю о миграции птиц, а также длину волны радара, птицы гораздо более вероятно будут обнаружены, чем насекомые, я собираюсь пометить это как миграцию птиц. И, да, кстати, я знаю, какие ветры. И есть еще один продукт данных, который приходит от радара о скорости вещей, которые находятся в атмосфере относительно радара. О, и эти вещи движутся против этого — это определенно птицы".
\ Опять же, это не идеально. Несмотря на проблему длины волны и то, что птицы гораздо более вероятно будут обнаружены, есть случаи, когда есть очень, очень большое количество насекомых, которые большие и быстро летающие. Так что есть эти места, где мы просто не знаем: "это птицы или насекомые? Не уверен. Я знаю, что это биологическое; это не метеорологическое". Так что вы маркируете это таким образом. Мы не так много использовали эти данные в модели. Но в будущем мы будем. Это вырастет во что-то ценное, как только этот набор данных вырастет. Это еще одна вещь будущего.
\ Малена: Вы уже упомянули несколько вещей, но чего ИИ еще не может делать для BirdCast, что сделало бы его лучше? И насколько вы близки к достижению этого?
Эндрю: В радарных данных в самом сыром смысле, прямо с радарной станции, есть гораздо больше информации, которую мы, как биологи, обычно не видим. Она фильтруется, она сразу корректируется с метеорологической точки зрения. [ИИ потенциально мог бы] разрешить дополнительные паттерны, а также иметь модели, которые используют преимущества различных моментов, которые производит радар.
\ На более простом уровне, есть реальная возможность для текущей модели машинного обучения работать еще лучше, когда дело доходит до, в частности... интерфейса птиц, насекомых, летучих мышей "ну, я знаю, что это биологическое, но я не уверен, что именно".
\ Малена: В более общем плане, как ИИ меняет область орнитологии?
Эндрю: Он меняет ее довольно значительно. С общей точки зрения, идея о том, что мы теперь можем использовать эти виды моделей и этот вид вычислительной мощности для распознавания изображений и звуков... и делать это с супер высокой уверенностью, это огромно. Люди могут не осознавать этого — они могут думать: "Я наблюдаю за птицами, я не так много взаимодействую с технологиями. Да, я буду использовать свой телефон как мой ID-гид, и я попрошу его ответить на некоторые вопросы для меня, если я не знаю ответов". Но это означает прямое взаимодействие с машинным обучением каждый раз, когда вы это делаете. Так что я думаю, что есть огромная, огромная связь очень широко с тем, как мы делаем наблюдения.
\ Малена: Орнитология — одна из немногих областей науки, где обычные люди могут значимо вносить свой вклад. Какую роль играют обычные граждане в орнитологии, когда речь идет об ИИ?
Эндрю: Я думаю, что на самом деле есть действительно важная роль. Люди важны в моделировании ИИ и всем машинном обучении в том, что они являются экспертами. Все вещи, которые вы делаете в своем мозгу, которые приводят вас от "О, я видел малиновку, и я видел 10 из них, и они были в этом конкретном месте". Это важная информация для этих моделей в будущем. И поэтому вклады становятся сырыми данными... на которых работает машинное обучение. И есть другие места, где выход и наблюдение на земле, где радарные данные отбирают что-то в атмосфере, и возможность установить эту связь, это важно для такого рода проверки на местности. Информация, которую производят люди, что бы это ни было, знаете ли, являетесь ли вы экспертом или новичком, может быть действительно важной, как ядра, на которых работают эти модели машинного обучения.
Спасибо за чтение.
\ Искренне,
\ Малена Каролло
\ Журналист-расследователь
\ The Markup


