大家好,我是 Malena—我是 The Markup 的調查記者,但我正在暫時休息我平常的深入調查,來談談一些更輕鬆愉快的事:鳥類!
\ 更具體地說,我對人工智慧(AI)如何重塑鳥類學世界產生了興趣。其中一個最重要的方式是通過 BirdCast,這個專案使用機器學習來幫助科學家根據天氣數據預測鳥類如何遷徙。
\ BirdCast 是康奈爾大學鳥類學實驗室、科羅拉多州立大學和麻省大學阿默斯特分校的合作項目。該項目於 2018 年啟動,使用從美國本土 48 個州的 143 個雷達站收集的數據來識別鳥類移動並預測這些鳥類將如何遷徙。
Andrew Farnsworth 是康奈爾大學鳥類學實驗室的訪問科學家,自 1990 年代該項目開始以來一直參與其中,並為現在的 BirdCast 版本撰寫了資助申請。以下訪談已經過編輯,以提高清晰度和簡潔性。
\ Malena: 你是如何開始對觀鳥產生興趣的?
Andrew: 我有一位科學家祖父。他是一位生物化學家,但他在家裡有雙筒望遠鏡,當時他還擁有被認為是最前沿的野外指南材料。再加上我住在紐約市郊區韋斯特切斯特縣一個相對綠意盎然的地方,這些因素共同激發了我的興趣。木鴨和絨毛啄木鳥算是我的入門鳥種。
\ Malena: 為什麼了解鳥類遷徙很重要?
Andrew: 這個問題有三個很好且相對簡單的答案。從根本層面來說,鳥類是其環境及環境健康狀況的絕佳指標。正因如此,研究遷徙鳥類特別重要,因為它們連接了地球上許多地區,這是開始量化和評估我們的生態系統的很好方式。我們如何重視它們?我們如何評估它們?它們有多健康?
\ 這也是吸引人們參與的絕佳方式。
\ 第三點與基礎科學有關。理解我們作為觀察者用雙筒望遠鏡或耳朵對著天空所能做的觀察和模式,與我們從現有技術中學到的一切一樣重要,且兩者的聯繫越來越緊密。直到 2018 年,我們才有了關於有多少鳥類在夜間飛越美國的數據。這是一個你想知道的相當基本的數量。
\ Malena: BirdCast 如何運用人工智慧和機器學習?
Andrew: 我們需要從雷達數據中提取哪些是天氣,哪些是生物或鳥類。標記這些數據並將其轉化為一個模型,然後能夠快速判斷「哦,我們在這些數據中只談論鳥類」,機器學習對此至關重要。這也是進行機器學習的絕佳機會,因為有大量數據,我們可以標記這些數據。項目中機器學習最重的工作與創建數據集有關,討論鳥類遷徙而非降水或其他大氣現象。
\ 還有其他有趣的、邊緣領域開始涉及機器學習,而且可能會越來越多,比如整合額外數據。雷達在告訴你鳥類數量和大尺度模式方面很出色,但它無法識別物種。整合我們所謂的公民科學或社區科學,基本上就是鳥類觀察...或夜間遷徙鳥類的飛行呼叫和發聲...將越來越成為由機器學習驅動的工作。這將需要大量計算,但我認為在未來幾年內完全可以實現。
\ Malena: 它的準確度如何?
Andrew: 關於什麼是鳥類什麼不是的一般模式,模型...表現得非常好,如果你要給它分配一個百分比的正確性,大概是高達 90 多。我們仍然需要進一步訓練它。總是有一些有趣的新案例出現,但它們越來越罕見。
\ 預測模型不同,因為預測模型將該數據集(雷達上的鳥類遷徙)與其他東西(天氣變量)聯繫起來。該模型的表現也非常好[大約 80% 的準確率]。它不是完美的,因為 80% 不是 100%。但它已經足夠好,可以很好地預測美國各地我們使用它的地方的鳥類遷徙強度,並且能夠多年來持續這樣做。
\ Malena: 當你訓練這些算法從其他一切中識別出鳥類時,你告訴它要尋找什麼樣的東西?
Andrew: 有一些非常簡單的模式首先突出「好的,這是氣象學的,這不是」。你在雷達上經常看到的氣象學是雨的非常不規則模式—就形狀而言不規則,這些形狀出現在雷達圖像中且不均勻。它們也往往有這些像素值,描述反射率,或散射回雷達的能量量,這些是超級可變的,像雷暴—非常高強度,非常局部化。
\ 這與雷達上的鳥類遷徙信號,坦率地說,也包括昆蟲的模式非常不同。生物學模式[傾向於]非常均勻,沒有那種劇烈變化或不規則的形狀。當你作為專家標記這些數據時...[你可以說]「根據我對鳥類遷徙的了解,以及雷達的波長使鳥類比昆蟲更容易被檢測到,我將把這個標記為鳥類遷徙。哦,對了,順便說一下,我知道風向是什麼。還有另一個來自雷達的數據產品,關於大氣中物體相對於雷達的速度。哦,這些東西正在逆風移動—這些肯定是鳥類。」
\ 再次強調,它不是完美的。儘管有波長問題,鳥類更容易被檢測到,但有些情況下有非常非常多的大型且快速飛行的昆蟲。所以有些地方我們就不知道,「這是鳥還是昆蟲?不確定。我知道它是生物的,不是氣象的。」所以你就這樣標記它。我們在模型中並沒有太多使用這些數據。但在未來,我們會的。一旦數據集增長,它將發展成有價值的東西。這是另一個未來的事情。
\ Malena: 你已經提到了一些事情,但 AI 目前還不能為 BirdCast 做什麼,而這些會使它變得更好?你離實現這一目標有多近?
Andrew: 在最原始的雷達數據中有更多信息,就像直接從雷達站出來的那樣,作為生物學家我們通常看不到。它會被過濾,從氣象學角度立即被調整。[AI 可能會]解決額外的模式,並擁有利用雷達產生的不同時刻的模型。
\ 在更簡單的層面上,有一個真正的機會讓當前的機器學習模型在特定方面做得更好...特別是鳥類、昆蟲、蝙蝠界面的「好吧,我知道這是生物的,但我不確定是什麼。」
\ Malena: 更廣泛地說,AI 如何改變鳥類學領域?
Andrew: 它正在以相當巨大的方式改變它。從一般角度來看,我們現在可以使用這些類型的模型和這種計算能力來識別圖像和聲音...並且能夠以超高的信心做到這一點,這是巨大的。人們可能沒有意識到這一點—他們可能會想,「我在觀鳥,我沒有太多與技術互動。是的,我會用我的手機作為 ID 指南,如果我不知道答案,我會讓它回答我的一些問題。」但這意味著每次這樣做時都直接與機器學習互動。所以我認為在我們如何進行觀察方面,有一個非常廣泛的巨大聯繫。
\ Malena: 鳥類學是少數幾個普通人可以有意義地貢獻的科學領域之一。在涉及 AI 的鳥類學中,普通公民扮演什麼角色?
Andrew: 我認為確實有一個非常重要的角色。人類在 AI 建模和所有機器學習中很重要,因為他們是專家。你在大腦中做的所有事情,讓你從「哦,我看到了一隻知更鳥,我看到了 10 隻,它們在這個特定的地點」得出結論。這對於這些模型未來發展是必不可少的信息。因此,這些貢獻成為原始數據...機器學習運作的基礎。還有其他地方,比如出去成為地面觀察者,在雷達數據正在對大氣中的某些東西進行採樣的地方,並能夠建立這種聯繫,這些對於那種地面真實性驗證很重要。人類產生的信息,無論是什麼,你知道,無論你是專家還是新手,都可能成為機器學習模型運作的核心要素。
感謝閱讀。
\ 誠摯地,
\ Malena Carollo
\ 調查記者
\ The Markup
\ 也發表於此處
\ 照片由 Mehdi Sepehri 在 Unsplash 上提供


