在生成式 AI 瘋狂吸納開放資料的時代,維基百科選擇把「被白拿」的關係,正式轉寫成商業協議:從微軟、Google、Amazon 到新興 AI 公司,如今都必須透過內容授權與付費服務來存取維基。 (前情提要:Grok要取代維基百科?馬斯克透露xAI正開發「Grokipedia」:比Wikipedia有超大改進 ) (背景補充:V神首評LLM:Grok本質上拯救了 X 平台「有助真相傳播」,但仍有很多幻覺 ) 維基媒體基金會慶祝維基百科創立 25 週年,推出一系列活動與技術更新,同時也明確對外釋出訊號,全球最大的線上百科全書不只是「免費被使用」的知識庫,而是與多家 AI 巨頭簽訂內容授權協議、正式進入商業談判桌的關鍵基礎設施。 維基百科目前擁有逾 6,500 萬篇條目、覆蓋 300 多種語言,每月瀏覽量接近 150 億次,是全球前十名流量網站中唯一由非營利組織營運的平台,同時也是大型語言模型最重要的高品質開放資料集之一。 AI 巨頭不再只是「抓資料」 近年來,隨著生成式 AI 興起,科技公司對維基百科內容的依賴快速放大。為回應這股需求並維持財務永續,維基媒體開發了商用產品 Wikimedia Enterprise,專門提供大規模內容再利用與分發服務。 基金會在最新聲明中披露,包括 Ecosia、Microsoft、Mistral AI、Perplexity、Pleias、ProRata 等公司已成為新夥伴,加入原本的 Amazon、Google、Meta 等科技巨頭行列。 這代表,過去習慣直接抓取維基內容、用於搜尋結果或 AI 訓練的企業,如今開始以「授權合作」方式存取資料,由 Wikimedia Enterprise 依企業的延遲、穩定性和資料格式需求,提供 API 或資料流,企業則以付費形式回饋維基媒體基金會,用以支撐非營利營運與基礎建設投資。 為何維基百科具有談判籌碼? 維基媒體在公告中強調,維基百科已被多方評估為大型語言模型訓練中「最高品質」的開放資料集之一。原因在於,其內容由約 25 萬名活躍志工編輯維護,遵循中立性、可查證與可靠來源等嚴格標準,並經過長期版次歷史與社群審查,這些都是模型開發者難以自行重建的結構性資產。 對 AI 公司而言,取得維基內容不只關乎授權合法性與道德壓力,更涉及模型輸出品質與對事實的掌握能力;對維基媒體來說,則是把原本被動被抓取的流量,轉化成可預期的收入來源,以維持伺服器、跨語言社群與技術開發的長期投入。 同時強調人類編輯不可被取代 有趣的是,雖然與多家 AI 巨頭達成內容授權合作,維基媒體在自家 AI 策略中,仍反覆強調「人類優先」,AI 的角色是輔助志工編輯,而不是取代。 基金會計畫把 AI 用於偵測破壞編輯、標記可能有問題的條目、協助翻譯與內容發掘,讓編輯可以把時間集中在判讀來源、寫作與社群治理上。 執行長 Maryana Iskander 表示,維基百科的核心價值在於「人類驅動」的知識生產,即便在 AI 時代,平台仍會維持由全球志工社群治理的架構,AI 工具只是降低參與門檻的輔助,而不是接管內容決策的主體。 相關報導 重磅!Meta 祖克柏傳下令放棄「開源 AI」,轉用阿里巴巴 Qwen 訓練「Avocado」付費人工智慧 Intel 前執行長季辛格正在訓練「基督教導向大語言模型」:希望加速耶穌再臨 〈維基百科25週年宣布:賣內容給微軟、Google、Amazon等AI大廠「授權訓練」〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

