維基百科聯合創始人吉米·威爾斯表示這家線上百科全書背後的非營利組織正在尋求與人工智能公司達成更多授權協議。 這一舉措正在進行,因為一系列自動化的人工智能機器人正在給維基百科的基礎設施帶來壓力。
威爾斯解釋說,人工智能公司使用該平台免費提供的知識來訓練大型語言模型(LLMs)。他指出,大量的人工智能機器人爬取整個網站,給平台帶來了重大的技術和財務負擔。
"人工智能機器人...正在遍歷整個網站...所以我們必須增加伺服器,必須增加更多的RAM和緩存記憶體,這給我們帶來了不成比例的成本,"他解釋道。
威爾斯指出,人工智能機器人的大量使用迫使維基百科擴展其伺服器,增加RAM,並改進緩存,所有這些都帶來了高昂的成本。
雖然該網站對個人用戶是免費的,他指出,營利性人工智能公司更大量、自動化的訪問是另一個問題。該非營利組織在2022年與Google簽署了授權協議,並正在與其他公司協商類似協議。
運營維基百科的非營利組織維基媒體基金會依靠相對較小的公眾捐款和志願編輯者來運作,這本不是為了資助大規模、營利性的人工智能發展。
威爾斯表示,讓貢獻者和捐贈者承擔商業人工智能公司使用維基百科內容的成本是不公平的。
維基百科表示,它警告人工智能機器人帶來的不可持續負擔。近幾個月來,對維基百科伺服器的需求急劇增加。自動化機器人增加了流量——特別是通過多媒體下載——並導致該非營利組織需要大量投資基礎設施。
這些流量中的大部分來自人工智能公司抓取內容以訓練其模型,而非來自人類。2022年,該基金會推出了一個付費商業產品,維基媒體企業版,以大規模提供其核心內容的訪問,並為平台用戶提供必要的工具和資源。
這項服務旨在減輕維基百科實時網站的壓力,同時為人工智能開發者提供必要的數據來增強他們的模型。威爾斯敦促人工智能公司使用這一付費選項,而不是抓取公共網站。
威爾斯表示,如果公司不遵守這些技術措施,可能會實施通過人工智能爬蟲控制等工具限制機器人訪問的措施。關於公共(或商業)人工智能在管理用戶現在持有的個人數據方面的角色存在一些爭議,這些數據的規模超出了法律上獲取免費、透明知識的權利,以及私營和公共部門的需求。
隨著越來越大比例的人工智能處理嚴重依賴大型、公開可用的數據集,維基百科正在倡導一種公平的方法,既補償維護這些數據的實體,也補償企業。維基百科在維持中立性的承諾方面並非不受影響。
維基百科網站作為由維基媒體基金會管理的非營利實體已經運營了20多年。其模式建立在全球志願編輯者大軍的基礎上,他們花時間創建、編輯和校對內容。
公眾捐款是確保它對任何人、任何地方都開放的關鍵因素,無論他們可用的資金或地理範圍如何。維基百科作為一個知名的國際網站和百科全書,也一直努力在其他來源中保持中立。
當詳細報導全球高風險政治問題、社會運動或武裝衝突時,這個問題變得更加嚴重。威爾斯表示,雖然大多數維基百科編輯本身不是活動家,但個人偏好可能會影響主題的報導方式。
然而,他補充說,他信任社區,表示編輯者即使在巨大壓力下也能以某種方式實現維基百科的公平和準確性價值觀。該平台的中立性在其社區政策、同行評審方法和爭議解決過程等方面進一步得到體現。
同時,對志願者和捐款的持續依賴突顯了系統的弱點。隨著平台面臨新的壓力,包括人工智能公司對其內容使用的增加,確保平台的核心價值(中立性、準確性和免費訪問)繼續保持不變變得越來越重要。
想讓您的項目展現在加密貨幣頂尖人士面前嗎?在我們下一期行業報告中展示它,數據與影響力在此相遇。


