中國 AI 新貴 DeepSeek 於 2025 年初推出大型語言模型,以驚人低算力達到逼近國際 AI 巨頭的水準,一舉震撼科技界,同時引發廣泛質疑。一年轉眼過去,美國時間 2 月 12 日,ChatGPT 開發商 OpenAI 向美國眾議院中國問題特別委員會提交一份備忘錄,直指 DeepSeek 透過「蒸餾」(distillation)技術「走捷徑」,試圖複製其他 AI 模型的成果來訓練自家模型。
OpenAI 在備忘錄中指出,已偵測到 DeepSeek 採用新的隱蔽手法,從領先的美國 AI 模型中提取輸出結果。他們發現 DeepSeek 員工開發了程式碼,能夠「程式化」存取美國 AI 模型用以獲取輸出,更有一些「未經授權轉售 OpenAI 服務的經銷商」,這些做法明顯旨在規避 OpenAI 對模型輸出的濫用防護措施。事實上,自 DeepSeek 去年發布 R1 模型不久後,OpenAI 便已私下表達擔憂,並與合作夥伴 Microsoft 共同展開調查,探討 DeepSeek 是否以未經授權方式取得其數據。

儘管 OpenAI 積極打擊違反服務條款的行為,「蒸餾」現象仍持續發生且手法日益精巧。簡單來說,「蒸餾」技術就像「請一位頂尖博士指導資優生」,讓參數較少的小模型在短時間內吸收大模型耗費巨量資源才累積的「知識精華」,最終使小模型性能接近大模型,卻在體積、推理速度與耗電量上大幅優化。
另一方面,OpenAI 與 Anthropic 等美國公司已投入數十億美元打造 AI 基礎設施,並對進階服務使用者收取訂閱費用。然而,「蒸餾」技術的普及可能嚴重侵蝕美國在 AI 領域的優勢,因為 DeepSeek 及其他許多中國模型不設訂閱門檻,對美國 AI 巨頭構成明顯的商業威脅。
OpenAI 更強調,DeepSeek 的進展帶來額外的國家安全隱憂:其聊天機器人會對中國政府視為敏感的議題(如台灣、天安門事件)進行自我審查。此外,透過「蒸餾」複製能力時,原本的安全防護機制往往被忽略,從而增加 AI 在生物學、化學等高風險領域被濫用的可能性。
美國眾議院中共問題特設委員會主席 John Moolenaar 在聲明中直言,這種「偷、抄、殺」是中共的慣用手法。他認為中國企業將持續「蒸餾」並利用美國 AI 模型來獲取優勢,正如他們抄襲 OpenAI 打造 DeepSeek 一樣。此外,白宮科學與技術顧問會議主席 David Sacks 此前已針對中國的「蒸餾」策略發出警告,他表示 DeepSeek「正從舊晶片中榨取更多效能」,並強調有「大量證據」顯示 DeepSeek 從 OpenAI 模型中「蒸餾」出知識。

目前,DeepSeek 及其母公司 High-Flyer 未對相關指控作出回應。
來源:Bloomberg



