大家好,我是Malena——我是The Markup的调查记者,但我正在暂时放下我平常的深入调查工作,来谈论一些更轻松愉快的话题:鸟类!
\ 更具体地说,我对人工智能(AI)如何重塑鸟类学世界产生了兴趣。其中一个最重要的方式是通过BirdCast,这个项目利用机器学习帮助科学家根据天气数据预测鸟类迁徙情况。
\ BirdCast是康奈尔大学鸟类学实验室、科罗拉多州立大学和马萨诸塞大学阿默斯特分校的合作项目。该项目于2018年启动,利用美国本土48个州143个雷达站点收集的数据来识别鸟类活动并预测这些鸟类将如何迁徙。
Andrew Farnsworth是康奈尔大学鸟类学实验室的访问科学家,自20世纪90年代该项目创立以来一直参与其中,并为现在的BirdCast版本撰写了资助申请。以下采访内容经过编辑,以提高清晰度和简洁性。
\ Malena: 你是如何开始对观鸟产生兴趣的?
Andrew:我有一位科学家祖父。他是生物化学家,但他家里有双筒望远镜,当时他还拥有被认为是最前沿的野外指南材料。再加上我住在纽约市郊区威彻斯特县一个相对绿化较好的地方,这些因素共同激发了我的兴趣。林鸳鸯和绒啄木鸟算是我入门的启蒙鸟类。
\ Malena:为什么了解鸟类迁徙很重要?
Andrew:对此有三个合理且简单的答案。从根本层面来说,鸟类是其环境及环境健康状况的极佳指标。正因如此,研究迁徙鸟类尤为重要,因为它们连接了地球上许多地区,这是开始量化和评估我们的生态系统的绝佳方式。我们如何重视它们?如何评估它们?它们有多健康?
\ 这也是吸引人们参与的很好方式。
\ 第三点与基础科学有关。理解我们作为观察者通过双筒望远镜或聆听天空所能获得的模式和观察结果,与我们从现有技术中学到的一切一样重要,并且越来越紧密相连。直到2018年,我们才有了关于有多少鸟类在夜间飞越美国上空的数据。这是你想要了解的相当基础的信息。
\ Malena:人工智能和机器学习在BirdCast中是如何应用的?
Andrew:我们需要从雷达数据中提取什么是天气,什么是生物或鸟类。对数据进行标记并将其转化为模型,然后能够快速判断"哦,我们在这些数据中只讨论鸟类",机器学习对此至关重要。这也是进行机器学习的绝佳机会,因为有大量数据,我们可以对这些数据进行标记。项目中机器学习最重要的工作与创建数据集有关,讨论鸟类迁徙而非降水或其他大气现象。
\ 还有其他一些有趣的、边缘领域开始涉及机器学习,而且可能会越来越多,比如整合额外数据。雷达擅长告诉你鸟类数量和大尺度模式,但无法识别物种。整合我们所称的公民科学或社区科学,基本上就是鸟类观察...或夜间迁徙鸟类的飞行叫声和发声...将越来越成为由机器学习驱动的工作。这需要大量计算,但我认为在未来几年内完全可以实现。
\ Malena:它的准确度如何?
Andrew:关于什么是鸟类什么不是的一般模式,模型...表现得非常好,如果要给出一个百分比的正确率,大概是高90%多。我们仍需进一步训练它。总会有一些有趣的新案例出现,但它们越来越罕见。
\ 预测模型不同,因为预测模型是将那个数据集(雷达上的鸟类迁徙)与其他东西(天气变量)联系起来。该模型也表现得非常好[约80%的准确率]。它不是完美的,因为80%不是100%。但它已经足够好,能够很好地预测美国各地我们应用该模型的鸟类迁徙强度,并且能够多年如一地保持这种预测能力。
\ Malena:当你训练这些算法如何从其他一切中识别出鸟类时,你告诉它要寻找什么样的特征?
Andrew:有一些非常简单的模式首先突显出"好的,这是气象现象,这不是"。你在雷达上经常看到的气象学特征是雨的不规则模式——在雷达图像中出现的形状不均匀。它们也往往有这些像素值,描述反射率,或散射回雷达的能量量,这些是超级可变的,比如雷暴——非常高强度,非常局部化。
\ 这与雷达上的鸟类迁徙信号模式非常不同,坦率地说,昆虫也是如此。生物学模式[倾向于]非常均匀,没有那种剧烈变化或不规则的形状。当你作为专家标记这些数据时...[你可以说]"根据我对鸟类迁徙的了解,以及雷达的波长使鸟类比昆虫更容易被探测到,我将把这个标记为鸟类迁徙。哦,对了,顺便说一下,我知道风向是什么。还有另一个来自雷达的数据产品,关于大气中物体相对于雷达的速度。哦,这些东西正在逆风移动——这些肯定是鸟类。"
\ 再次强调,它并不完美。尽管有波长问题,鸟类更容易被探测到,但有些情况下存在大量又大又快速飞行的昆虫。所以有些地方我们就不确定,"这是鸟类还是昆虫?不确定。我知道这是生物的,不是气象现象。"所以你就这样标记它。我们在模型中并没有太多使用这些数据。但在未来,我们会的。一旦数据集增长,它将发展成为有价值的东西。这是另一个未来的事情。
\ Malena:你已经提到了几点,但AI目前还不能为BirdCast做什么,而这些功能会使它变得更好?你离实现这些目标有多近?
Andrew:在最原始的雷达数据中有更多信息,就像直接从雷达站获取的那样,作为生物学家我们通常看不到这些。它会被过滤,从气象学角度立即进行调整。[AI可能]解决额外的模式,并拥有利用雷达产生的不同时刻的模型。
\ 在更简单的层面上,有一个真正的机会让当前的机器学习模型在特定方面做得更好...特别是在鸟类、昆虫、蝙蝠界面上的"嗯,我知道这是生物的,但我不确定是什么。"
\ Malena:更广泛地说,AI如何改变鸟类学领域?
Andrew:它正在以相当巨大的方式改变这一领域。从总体角度看,我们现在可以使用这些类型的模型和这种计算能力来识别图像和声音...并且能够以超高的置信度做到这一点,这是巨大的进步。人们可能没有意识到这一点——他们可能会想,"我在观鸟,我并没有太多接触技术。是的,我会用手机作为我的ID指南,如果我不知道答案,我会让它回答一些问题。"但这意味着每次这样做时都在直接与机器学习互动。所以我认为在我们如何进行观察方面,存在着广泛而巨大的联系。
\ Malena:鸟类学是少数几个普通人可以有意义地贡献的科学领域之一。在涉及AI的鸟类学中,普通公民扮演什么角色?
Andrew:我认为确实有一个非常重要的角色。人类在AI建模和所有机器学习中很重要,因为他们是专家。你大脑中所做的所有事情,让你从"哦,我看到了一只知更鸟,我看到了10只,它们在这个特定的地点"得出结论。这对于这些模型的未来发展是必不可少的信息。因此,这些贡献成为原始数据...机器学习据此运行。还有其他地方,比如出去成为地面观察者,在雷达数据正在采样大气中的某些东西的地方,并能够建立这种联系,这些对于那种地面真实性验证很重要。人类产生的信息,无论是什么,你知道,无论你是专家还是新手,都可能作为机器学习模型运行的核心非常重要。
感谢阅读。
\ 此致,
\ Malena Carollo
\ 调查记者
\ The Markup
\ 也发布于此处
\ 图片由Mehdi Sepehri在Unsplash上提供


