你每天用的 PDF 工具、智慧卡、甚至 GIF 圖片背後,都靠開源程式碼在運作。這些程式碼的安全漏洞過去得靠人類一行行檢查,現在 AI 不需要任何指令就能自己挖出數百個沒人發現過的漏洞。
Anthropic 週四發表最新旗艦 AI 模型 Claude Opus 4.6,該模型在幾乎不需要任何指令引導的情況下,自主發現超過 500 個過去從未被揭露的高風險開源軟體零時差漏洞(zero-day vulnerabilities),每一個漏洞都經過內部團隊或外部資安研究人員逐一驗證。
這項突破被視為 AI 輔助網路防禦的關鍵轉折點。Anthropic 先鋒紅隊負責人 Logan Graham 表示:「這是防禦方與攻擊方之間的軍備競賽,而我們要做的就是盡快把武器交到防禦者手中。這些模型在這件事上已經極為出色,而且我們預期它們的能力還會大幅提升。」
值得注意的是,Claude 測試的並非乏人問津的冷門專案。根據 Anthropic 部落格文章,這些都是經過多年密集測試的成熟程式碼庫,傳統模糊測試器(fuzzer)累計已投入數百萬小時的 CPU 運算時間反覆掃描,Claude 卻依然從中找出高風險漏洞——其中部分漏洞甚至已經潛伏了數十年之久。
在正式發表前的測試階段,Anthropic 的先鋒紅隊在受控沙盒環境中為 Claude 配備了 Python 及漏洞分析工具(包括傳統除錯器和模糊測試器),但完全沒有給予任何特定指令或專業背景知識。Claude 僅憑「開箱即用」的基本能力,就完成了這項大規模漏洞挖掘。
這些漏洞涵蓋範圍極廣,從可能癱瘓整個系統到破壞記憶體完整性都有。根據 Anthropic 部落格文章,Claude 在熱門的 PDF 處理工具 GhostScript 中發現了可導致程式崩潰的漏洞,也在處理智慧卡資料的 OpenSC 和處理 GIF 檔案的 CGIF 中各自找到緩衝區溢位(buffer overflow)漏洞。這類漏洞可能讓攻擊者將惡意程式碼寫入系統記憶體,進而取得控制權。
更令人驚豔的是 Claude 展現出的自主推理能力。在 GhostScript 案例中,模糊測試和人工分析雙雙失敗後,Claude 轉而深入挖掘該專案的 Git 提交歷史紀錄,從中找到線索。
發現漏洞後,它還主動檢查程式碼其他區段是否潛伏類似問題。在 CGIF 案例中,Claude 更主動撰寫概念驗證程式(proof-of-concept),親自證實漏洞可被利用。
Anthropic 認為,這項能力將為長期困擾資安界的開源安全難題帶來重大突破。Graham 表示:「如果這最終成為開源軟體安全防護的主要手段之一,甚至是最重要的手段,我一點都不會意外。」
與此同時,Anthropic 也在新模型中建立了安全防線,部署即時偵測工具來攔截可能的惡意流量,以防止這些網路攻防能力遭到濫用。不過該公司也坦言,這些管控措施「無可避免地會對合法的安全研究與防禦工作造成一定程度的不便」,並表示將與資安研究社群合作尋求平衡。
Anthropic 也在部落格中點出一個更深層的產業挑戰:當 AI 發現漏洞的速度與數量遠超以往,現行業界標準的 90 天漏洞揭露窗口恐怕將難以負荷,整個產業都需要發展出能跟上 AI 節奏的新工作流程。
Graham 更透露,Anthropic 正積極研擬方案,計畫將漏洞偵測能力開放給更多資安社群使用,其中可能包括開發全新的工具產品。
核稿編輯:Mia
加入 INSIDE 會員,獨享 INSIDE 科技趨勢電子報,點擊立刻成為會員!
延伸閱讀:
「整個專案都是 vibe-coding 出來的」爆紅 AI 代理 Moltbot 資安漏洞多,創投照樣搶投資
Google Cloud 史上最大訂單出爐!Palo Alto 豪擲近百億美元押注 AI 資安


