安全與沙箱設定
了解 Cowork 如何透過虛擬機器隔離、權限控制和安全機制保護您的系統。安全使用自主 AI 代理的最佳實踐。
Claude Cowork 採用多層防禦安全策略。與直接在瀏覽器中執行的傳統 AI 聊天機器人不同,Cowork 是一個具有檔案系統存取權限的自主代理,因此需要強大的隔離機制來保護您的系統。
安全模型結合了硬體層級的虛擬機器隔離、明確的權限授予、用於偵測提示詞注入的內容分類器,以及透過強化學習訓練來識別和拒絕惡意指令。
schema 安全架構圖
macOS 主機
受保護的系統檔案與應用程式
VZVirtualMachine
Apple 虛擬化框架沙箱
Claude 代理
在隔離的 Linux VM 中執行
透過 Apple 虛擬化框架實現 VM 隔離
Cowork 不會直接在 macOS 主機上執行。它使用 Apple 的 VZVirtualMachine 框架啟動一個輕量級的自訂 Linux VM。這與 macOS 上 Docker Desktop 使用的技術相同。
程序隔離
代理在完全獨立的作業系統實例中執行。即使遭到入侵,也無法突破 VM 邊界。
無法存取系統
無法存取 macOS 系統檔案、應用程式,或您未明確授權的資料夾。
Apple Silicon 最佳化
利用 ARM 架構虛擬化和統一記憶體,將效能開銷降至最低。
每次全新啟動
每個 Cowork 工作階段都從乾淨的 VM 狀態開始。持久性惡意軟體無法跨工作階段存活。
技術說明
VZVirtualMachine 框架會啟動一個專為 Cowork 設計的自訂 Linux 根檔案系統。這實現了硬體隔離,代理只能存取明確「掛載」到 VM 環境中的資料夾。
權限系統
Cowork 遵循最小權限原則。您可以精確控制 Claude 能存取的資料夾,代理在執行重要操作前會請求明確核准。
資料夾存取權限
開始任務前,選擇允許 Cowork 存取的資料夾。Claude 只能在這些掛載的資料夾內讀取、寫入、建立和刪除檔案。除非您明確授權,否則文件、桌面和其他資料夾都受到保護。
操作確認
對於刪除多個檔案等重要操作,Claude 會暫停並請求確認。您可以在繼續之前檢視並核准或拒絕建議的操作。
即時活動紀錄
您可以即時查看 Cowork 正在執行的操作。所有檔案操作、網路請求和動作都會被記錄並顯示在介面中。您可以隨時暫停或停止執行。
安全機制
透過強化學習保護
Claude 透過 RLHF(基於人類回饋的強化學習)訓練,能夠識別並拒絕惡意指令。它會拒絕可能損害您系統或資料的請求。
內容分類器
在瀏覽網頁或處理檔案時,內容分類器會掃描不可信內容,偵測潛在的提示詞注入(試圖欺騙代理執行非預期操作的隱藏文字)。
稽核追蹤
工作階段期間所有操作的完整記錄。您可以查看 Claude 何時對哪些檔案執行了什麼操作。這有助於了解變更內容,必要時可以還原。
本機檔案處理
檔案在虛擬機器內本機處理。檔案內容不會上傳到外部伺服器,也不會用於模型訓練。只有對話上下文會傳送到 Claude API。
安全最佳實踐
授予最少的資料夾存取權限
只掛載任務所需的資料夾。不要授予整個家目錄的存取權限,建立專用的工作資料夾。
備份重要檔案
讓 Cowork 重新整理或變更檔案之前,確認您有備份。沙箱保護作業系統,但不保護授權資料夾內的資料。
執行前檢視計畫
Claude 會在開始任務前顯示計畫。請花時間檢視,特別是涉及檔案刪除或變更的任務。
提供具體指示
「全部清理」等模糊指示可能導致意外刪除。請明確指定要保留、變更和刪除的內容。
監控瀏覽器作業
使用 Chrome 擴充功能執行網頁作業時,請注意惡意網站可能嘗試提示詞注入。執行網頁作業時請監控活動紀錄。
已知限制
了解安全模型的限制有助於安全使用 Cowork:
不會保護您免受自己的指令
如果您指示 Claude 刪除檔案,它會執行。沙箱保護您免受外部威脅,但不會保護您免受明確授權的命令。
提示詞注入風險
雖然分類器有助於偵測提示詞注入,但惡意網站的蓄意攻擊仍可能成功。請謹慎監控網頁瀏覽任務。
可能的資料外洩
如果啟用網路存取,遭入侵的工作階段可能會將資料傳送到外部伺服器。對於敏感任務,請使用網路監控。
研究預覽階段
Cowork 仍處於研究預覽階段。隨著產品成熟,安全措施將持續演進。
疑難排解
虛擬機器無法啟動 expand_more
授權後仍無法存取資料夾 expand_more
Claude 拒絕安全的操作 expand_more
安全優先
Anthropic 投入大量資源確保 Cowork 的預設安全性。虛擬機器隔離、權限系統和安全機制協同運作,將風險降至最低。然而,沒有任何系統是完美的。授予 AI 代理檔案存取權限時,請務必謹慎評估。