セキュリティとサンドボックス設定
Coworkが仮想マシン隔離、権限制御、安全メカニズムでシステムを保護する仕組みを学びましょう。自律AIエージェントを安全に使用するためのベストプラクティス。
Claude Coworkは多層防御のセキュリティ戦略を採用しています。ブラウザ内で直接実行される従来のAIチャットボットとは異なり、Coworkはファイルシステムアクセス権を持つ自律エージェントとして動作するため、システムを保護する強力な隔離メカニズムが必要です。
セキュリティモデルは、ハードウェアレベルの仮想マシン隔離、明示的な権限付与、プロンプトインジェクション検出のためのコンテンツ分類器、および悪意のある指示を識別・拒否するための強化学習を組み合わせています。
schema セキュリティアーキテクチャ図
macOSホスト
保護されたシステムファイルとアプリケーション
VZVirtualMachine
Apple仮想化フレームワークサンドボックス
Claudeエージェント
隔離されたLinux VM内で実行
Apple仮想化フレームワークによるVM隔離
CoworkはmacOSホスト上で直接実行されません。代わりに、AppleのVZVirtualMachineフレームワークを使用して軽量なカスタムLinux VMを起動します。これはmacOS上のDocker Desktopと同じ技術です。
プロセス隔離
エージェントは完全に別のOSインスタンス内で実行されます。侵害されても、VM境界から逃れることはできません。
システムアクセスなし
macOSシステムファイル、アプリケーション、明示的に許可していないフォルダにはアクセスできません。
Appleシリコン最適化
ARMベースの仮想化とユニファイドメモリを活用し、パフォーマンスオーバーヘッドを最小化。
毎回新規起動
各Coworkセッションはクリーンなvm状態から開始。永続的なマルウェアはセッション間で生き残れません。
技術情報
VZVirtualMachineフレームワークはCowork専用に設計されたカスタムLinuxルートファイルシステムを起動します。これによりハード隔離が実現され、エージェントはVM環境に明示的に「マウント」したフォルダにのみアクセスできます。
権限システム
Coworkは最小権限の原則に従います。Claudeがアクセスできるフォルダを正確に制御でき、エージェントは重要な操作の実行前に明示的な承認を求めます。
フォルダアクセス許可
作業開始前に、Coworkがアクセスできるフォルダを選択します。Claudeはこれらのマウントされたフォルダ内でのみファイルの読み取り、書き込み、作成、削除が可能です。明示的に許可しない限り、ドキュメント、デスクトップ、その他のフォルダは保護されます。
操作確認
複数ファイルの削除などの重要な操作では、Claudeは一時停止して確認を求めます。続行前に提案された操作を確認し、承認または拒否できます。
リアルタイムアクティビティログ
Coworkが何をしているかリアルタイムで確認できます。すべてのファイル操作、ネットワークリクエスト、アクションが記録され、インターフェースで表示されます。いつでも実行を一時停止または停止できます。
安全メカニズム
強化学習による保護
Claudeは悪意のある指示を識別・拒否するためにRLHF(人間のフィードバックによる強化学習)でトレーニングされています。システムやデータに損害を与える可能性のあるリクエストを拒否します。
コンテンツ分類器
ウェブ閲覧やファイル処理時、コンテンツ分類器が信頼できないコンテンツをスキャンし、潜在的なプロンプトインジェクション(エージェントを騙して意図しない操作を実行させようとする隠しテキスト)を検出します。
監査証跡
セッション中のすべての操作の完全な履歴。Claudeが何を、いつ、どのファイルに対して行ったかを確認できます。変更の把握や必要に応じたロールバックに便利です。
ローカルファイル処理
ファイルは仮想マシン内でローカルに処理されます。ファイル内容は外部サーバーにアップロードされたり、モデルトレーニングに使用されたりしません。会話コンテキストのみがClaudeのAPIに送信されます。
セキュリティベストプラクティス
最小限のフォルダアクセスを付与
タスクに必要なフォルダのみをマウントしましょう。ホームディレクトリ全体へのアクセスを付与せず、専用の作業フォルダを作成しましょう。
重要なファイルをバックアップ
Coworkにファイルの再整理や変更をさせる前に、バックアップがあることを確認しましょう。サンドボックスはOSを保護しますが、許可されたフォルダ内のデータは保護しません。
実行前に計画を確認
Claudeは作業開始前に計画を表示します。特にファイルの削除や変更を含むタスクでは、時間をかけて確認しましょう。
具体的な指示を出す
「全部きれいにして」のような曖昧な指示は予期しない削除につながる可能性があります。何を保持し、何を変更し、何を削除すべきか明確に指定しましょう。
ブラウザタスクを監視
Chrome拡張機能でウェブタスクを実行する際は、悪意のあるサイトがプロンプトインジェクションを試みる可能性があることに注意してください。ウェブ操作中はアクティビティログを監視しましょう。
既知の制限
セキュリティモデルの制限を理解することで、Coworkを安全に使用できます:
あなた自身の指示からは保護しない
Claudeにファイル削除を指示すれば、実行します。サンドボックスは外部の脅威から保護しますが、明示的に許可したコマンドからは保護しません。
プロンプトインジェクションのリスク
分類器はプロンプトインジェクションの検出を助けますが、悪意のあるウェブサイトの確信犯的な攻撃は成功する可能性があります。ウェブ閲覧タスクは注意深く監視してください。
データ流出の可能性
ネットワークアクセスが有効な場合、侵害されたセッションは外部サーバーにデータを送信する可能性があります。機密作業にはネットワーク監視を使用してください。
リサーチプレビュー段階
Coworkはまだリサーチプレビュー段階です。製品の成熟に伴い、セキュリティ対策は進化し続けます。
トラブルシューティング
仮想マシンが起動しない expand_more
権限付与後もフォルダアクセスが拒否される expand_more
Claudeが安全な操作を拒否する expand_more
セキュリティを最優先に
AnthropicはCoworkをデフォルトで安全にするために多大なリソースを投入しています。仮想マシン隔離、権限システム、安全メカニズムが連携してリスクを最小化しています。ただし、完璧なシステムはありません。AIエージェントにファイルへのアクセスを許可する際は、常に適切な注意を払ってください。