你每天和 AI 對話,分享你的想法、你的工作、你的私事。但這些對話最終去了哪裡?
加密貨幣社群有一句話流傳了十幾年:「Not your keys, not your coins」。意思是,如果你沒有掌控私鑰,那些加密資產就不真正屬於你,它們只是別人資料庫裡的一個數字。這句話在 FTX 崩潰時被反覆引用,因為無數人把資產放在交易所,最後什麼都沒了。
AI 世界的邏輯卻完全反過來。你不只沒有掌控,你甚至主動把最珍貴的東西,也就是你的思維脈絡、工作模式、隱私,送進別人的伺服器,每個月還付錢感謝它。
然後,Tether 決定做一件事。
Tether 是一家很難被歸類的公司。它發行了全球流通量最大的穩定幣 USDT,它在加密貨幣世界的地位,等同金融體系裡的美元,無所不在,卻很少被直接討論。
但 Tether 的 CEO Paolo Ardoino 從來沒有掩飾過他的信念。加密貨幣的核心命題,是把金融控制權從銀行和政府手中還給個人,這個哲學貫穿了 Tether 十幾年的路線。而現在,Ardoino 想把同樣的事情套用在 AI 上。
問題是,AI 世界目前的權力結構,和去中心化理想之間,差距遠比想像中大。OpenAI 的模型跑在微軟的 Azure 上,Google 的 Gemini 跑在自家 TPU 叢集裡,Meta 的 Llama 雖然開源,但真正有能力大規模部署的還是擁有資料中心的大型企業。訓練一個像樣的語言模型,需要的算力和資料量,對個人來說幾乎是天文數字。
這道牆,Tether 想從技術面把它拆掉。
3 月 17 日,Tether 旗下的 QVAC 發布了一個框架,宣稱是全球首個跨平台的 BitNet LoRA 微調工具,能讓消費者等級的裝置,直接在本地訓練十億參數等級的語言模型。
說白話是什麼意思?就是你手上的 iPhone 或 Android 手機,在不連網的情況下,可以微調一個屬於你自己的 AI 模型。
實測數字是這樣的:Samsung S25 訓練一個十億參數(1B)的模型,需要大約 1 小時 18 分鐘;iPhone 16 跑同樣的任務,約 1 小時 45 分鐘。QVAC 測試的最大規模是 iPhone 16 上的 130 億參數(13B)模型。
推論速度方面,手機 GPU 比同裝置的 CPU 快了 2 到 11 倍,視任務類型而異。
做到這件事的關鍵,是 Microsoft 研究的 BitNet 技術和 LoRA 的組合。
BitNet 把模型的參數壓縮到 1-bit,大幅降低記憶體需求,BitNet-1B 的記憶體用量比 Gemma-3-1B 少了 77.8%,比 Qwen3-0.6B 少了 65.6%。
LoRA(Low-Rank Adaptation)則讓微調不需要重新訓練整個模型,只調整一小部分參數就能讓模型學到新任務。兩個技術疊加,讓原本需要高階 GPU 伺服器才能做到的事,壓進了手機的運算空間。
跨平台是這次另一個值得關注的細節。QVAC 支援 Intel 和 AMD 的消費級顯示卡、Apple Silicon M 系列晶片,以及手機上的 Adreno、Mali、Apple Bionic GPU,是首次讓 1-bit 模型在非 NVIDIA 硬體上完成微調訓練。
Ardoino 在聲明中說,這個框架代表他們朝向「先進 AI 去中心化、普惠、賦能所有人」(advanced AI can be decentralized, inclusive, and empowering for everyone)的目標前進。這句話聽起來像是公關稿,但放在 Tether 的脈絡裡,它有一層更具體的意義。
AI 世界現在的問題,不只是隱私,而是訓練資料的控制權。當你用 ChatGPT 微調一個自訂模型,你的資料在 OpenAI 的伺服器上。當企業採購 Azure OpenAI Service,他們的資料進了微軟的生態系。雲端 AI 訓練的商業模式,本質上是一種資料換算力的交易,而且條款都在平台那一側。
這個問題對某些使用情境來說不只是隱私疑慮,而是根本不可行。醫療機構的病歷、律師事務所的案件摘要、新聞機構的線人資訊,這些資料本來就不該出現在任何第三方伺服器上。
但這些使用者同樣有微調語言模型的需求。然而,現有的雲端方案對他們來說,那扇門從一開始就沒有打開。
本地訓練把這道計算從雲端拉回裝置,資料主權重新落到使用者手上。這在技術上是效能的取捨,但在結構上,是一個關於 AI 未來由誰掌控的立場宣告。
當然,現實有它的門檻。訓練一個 1B 的模型需要將近兩個小時,對大多數人來說,這不是打開 app 就能完成的事。手機需要保持充電,期間不方便拿來做其他事。
但這個框架更重要的意義,或許不在消費者端,而在邊緣裝置的企業應用。
醫療診所的平板、律師事務所的工作站、記者的筆電,這些裝置的算力遠高於手機,而 QVAC 同樣支援 Apple Silicon 和 AMD 消費級顯示卡。本地訓練在這個場景下,從「有點不方便」變成「完全可行」。
隱私的真正意義從來不是躲藏。是選擇權,是你有權決定什麼不共享。當一個工具讓你不需要做選擇,你的資料就自然地留在你的裝置裡,這才是設計哲學的勝利。
QVAC 今天展示的,是一個可以被實現的方向。它不是 ChatGPT 的替代品,也不是要打敗 Google 的宣言。它的意義更接近比特幣在金融領域說的那件事:中心化不是唯一的路,只是目前最方便的路。
Ardoino 的 Tether 用了十幾年,在金融體系的邊緣建立了自己的基礎設施,在無數質疑聲中活了下來,並且愈做愈大。現在他們想在 AI 的邊緣做同樣的事。
加密貨幣打過的那場仗,AI 才剛開始。
責任編輯:Sisley
核稿編輯:Mia
加入 INSIDE 會員,獨享 INSIDE 科技趨勢電子報,點擊立刻成為會員!
延伸閱讀:


