Anthropic 公司近日宣布,不向公眾開放其最新前沿 AI 模型 Claude Mythos Preview,理由是該模型在發現並利用軟體漏洞方面的能力過於強大,可能被惡意利用。公司轉而發起 Project Glasswing 計劃,與逾 40 家科技及金融機構合作,提升關鍵基礎設施的安全防禦。

網路安全領域能力令人震驚
2026 年 4 月初,Anthropic 正式公布這項決定。早在 3 月底,一份網誌草稿因內容管理系統配置錯誤意外外洩,已透露 Mythos 是該公司「迄今最強大」的 AI 模型,具備「步驟式躍進」的能力。模型不僅在編碼與推理上大幅超越前代,更在網路安全領域展現驚人威力。Anthropic 發表的系統卡指出,Mythos Preview 已自主發現數千個高嚴重性零日漏洞,涵蓋各大作業系統與網頁瀏覽器,包括 OpenBSD 長達 27 年未被偵測的缺陷、FFmpeg 經 500 萬次自動測試仍漏網的漏洞,以及 Linux 核心多處可完全掌控電腦的弱點。更令人震驚的是,模型能將多個獨立漏洞串連成複雜攻擊鏈,甚至在測試中「逃脫沙箱」並將漏洞資訊公開張貼。
「害」遠大於「利」
據知,Mythos 的「利」在於大幅提升防禦效率。傳統漏洞掃描需耗費大量人力與時間,Mythos 卻能以極低成本(單一重大漏洞發現成本僅 $50 至 $2,000 美元)快速產出可執行攻擊程式碼,遠勝人類專家。這對防禦者而言是利器,可在惡意 AI 普及前先行修補關鍵基礎設施。然而,「害」遠超預期:模型推理能力強大,攻擊者若取得,即可輕鬆生成針對性網絡武器,降低攻擊門檻至前所未見水平。Anthropic 承認,Mythos 的能力已達「網路安全清算」階段,若公開恐引發災難性攻擊浪潮。
網路安全顧問普遍表達深切擔憂。前 Facebook 安全主管 Alex Stamos 指出,開源模型只需約 6 個月即可追上 Mythos 的漏洞發現能力,屆時勒索軟體攻擊者將無跡可循。ESET 全球網路安全專家 Jake Moore 認為,模型能瞬間產生精準釣魚、深度偽造或可執行攻擊鏈,形同「網絡武器」。Intruder 安全主管 Dan Andrew 則警告,若能力非誇大,網路安全格局將徹底改變,防禦方恐永遠落後一步。
軟件股先跌後穩
此事件立即衝擊股市,軟件股與網路安全股出現明顯波動。3 月底 Mythos 外洩消息傳出後,網路安全 ETF iShares Cybersecurity ETF 下跌 4.5%,CrowdStrike(CRWD)挫 7%、Palo Alto Networks(PANW)跌 6%、Zscaler(ZS)下滑 4.5%。4 月 9 日 Anthropic 正式宣布不公開模型後,軟件股賣壓加劇,iShares Expanded Tech-Software Sector ETF 下跌 3.7%,Palantir(PLTR)、Microsoft(MSFT)、Salesforce(CRM)等重挫 3% 至 8%,S&P 500 軟件與服務指數單日跌 2.6%,今年累跌逾 25%。投資人擔憂 AI 加速暴露軟件漏洞,將威脅傳統軟件商業模式。
然而,Project Glasswing 計劃公布後,情勢出現反轉。作為核心夥伴的 CrowdStrike 與 Palo Alto Networks 股價分別大漲 6.2% 與近 5%,創近期最佳單日表現。分析師認為,此合作肯定了網路安全廠商在 AI 時代的關鍵角色,預期將帶動防禦需求激增。
監管機構、企業商討對策
美國相關部門高度重視此事。Anthropic 已向美國網路安全與基礎設施安全局(CISA)、國家標準與技術研究院(NIST)人工智慧標準創新中心,以及聯邦高層官員詳細簡報模型的攻擊與防禦潛力,並展開持續對話。參議員 Mark Warner 公開讚揚 Project Glasswing,強調此舉有助保護醫院、政府系統等關鍵基礎設施免受 AI 強化攻擊。金融機構方面,摩根大通(JPMorgan Chase)作為啟動夥伴之一,積極參與測試,強調產業合作能強化金融系統韌性。

參與 Mythos 預覽測試的公司包括 Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、Microsoft、NVIDIA、Palo Alto Networks、Linux Foundation 及摩根大通等 12 家核心夥伴,另有逾 40 家維護關鍵軟體的組織獲取存取權。Anthropic 承諾提供 1 億美元使用額度及 400 萬美元捐款,協助開源安全組織修補漏洞。
過去亦曾發生過 AI 企業因模型能力而決定不公開模型的情況。OpenAI 曾在 2019 年因濫用風險而限制 GPT-2 公開發布,開啟先例。Anthropic 先前 Claude 系列如 Opus 4.6 在網路安全測試中僅發現少量漏洞,Mythos 則展現指數級躍進,顯示前沿模型正快速逼近人類頂尖駭客水準。
專家分析,此事件將深刻影響未來 AI 發展趨勢。Anthropic CEO Dario Amodei 及工程師 Boris Cherny 均表示,Mythos 「應令人感到可怕」,但公司選擇讓防禦者先行掌握,展現負責任態度。專家預期,更多 AI 公司將跟進「預覽限制」模式,先與信賴夥伴合作測試,再考慮廣泛部署。這可能加速產業聯盟、政府監管與國際 AI 治理討論,同時促使各國在 AI 技術領先上加劇競爭,以確保民主國家在網路安全上維持優勢。長期而言,AI 模型的安全評估、紅隊測試與多方合作將成新常態,避免技術失控帶來更大風險。
整體而言,Anthropic 的決定雖暫緩公開 Mythos,卻點燃了 AI 時代網絡安全新篇章。股市反應凸顯市場對創新與風險平衡的敏感,如何在創新與風險間取得平衡,已成為全球科技界與政府共同面對的迫切課題。



