新URL: CoworkerAI.io!

セキュリティとサンドボックス設定

Coworkが仮想マシン隔離、権限制御、安全メカニズムでシステムを保護する仕組みを学びましょう。自律AIエージェントを安全に使用するためのベストプラクティス。

Claude Coworkは多層防御のセキュリティ戦略を採用しています。ブラウザ内で直接実行される従来のAIチャットボットとは異なり、Coworkはファイルシステムアクセス権を持つ自律エージェントとして動作するため、システムを保護する強力な隔離メカニズムが必要です。

セキュリティモデルは、ハードウェアレベルの仮想マシン隔離、明示的な権限付与、プロンプトインジェクション検出のためのコンテンツ分類器、および悪意のある指示を識別・拒否するための強化学習を組み合わせています。

schema セキュリティアーキテクチャ図

desktop_mac

macOSホスト

保護されたシステムファイルとアプリケーション

memory

VZVirtualMachine

Apple仮想化フレームワークサンドボックス

smart_toy

Claudeエージェント

隔離されたLinux VM内で実行

隔離済み マウントされたフォルダのみ

Apple仮想化フレームワークによるVM隔離

CoworkはmacOSホスト上で直接実行されません。代わりに、AppleのVZVirtualMachineフレームワークを使用して軽量なカスタムLinux VMを起動します。これはmacOS上のDocker Desktopと同じ技術です。

verified_user

プロセス隔離

エージェントは完全に別のOSインスタンス内で実行されます。侵害されても、VM境界から逃れることはできません。

folder_off

システムアクセスなし

macOSシステムファイル、アプリケーション、明示的に許可していないフォルダにはアクセスできません。

memory

Appleシリコン最適化

ARMベースの仮想化とユニファイドメモリを活用し、パフォーマンスオーバーヘッドを最小化。

restart_alt

毎回新規起動

各Coworkセッションはクリーンなvm状態から開始。永続的なマルウェアはセッション間で生き残れません。

lightbulb

技術情報

VZVirtualMachineフレームワークはCowork専用に設計されたカスタムLinuxルートファイルシステムを起動します。これによりハード隔離が実現され、エージェントはVM環境に明示的に「マウント」したフォルダにのみアクセスできます。

権限システム

Coworkは最小権限の原則に従います。Claudeがアクセスできるフォルダを正確に制御でき、エージェントは重要な操作の実行前に明示的な承認を求めます。

folder_shared

フォルダアクセス許可

作業開始前に、Coworkがアクセスできるフォルダを選択します。Claudeはこれらのマウントされたフォルダ内でのみファイルの読み取り、書き込み、作成、削除が可能です。明示的に許可しない限り、ドキュメント、デスクトップ、その他のフォルダは保護されます。

approval

操作確認

複数ファイルの削除などの重要な操作では、Claudeは一時停止して確認を求めます。続行前に提案された操作を確認し、承認または拒否できます。

visibility

リアルタイムアクティビティログ

Coworkが何をしているかリアルタイムで確認できます。すべてのファイル操作、ネットワークリクエスト、アクションが記録され、インターフェースで表示されます。いつでも実行を一時停止または停止できます。

安全メカニズム

psychology

強化学習による保護

Claudeは悪意のある指示を識別・拒否するためにRLHF(人間のフィードバックによる強化学習)でトレーニングされています。システムやデータに損害を与える可能性のあるリクエストを拒否します。

security

コンテンツ分類器

ウェブ閲覧やファイル処理時、コンテンツ分類器が信頼できないコンテンツをスキャンし、潜在的なプロンプトインジェクション(エージェントを騙して意図しない操作を実行させようとする隠しテキスト)を検出します。

history

監査証跡

セッション中のすべての操作の完全な履歴。Claudeが何を、いつ、どのファイルに対して行ったかを確認できます。変更の把握や必要に応じたロールバックに便利です。

cloud_off

ローカルファイル処理

ファイルは仮想マシン内でローカルに処理されます。ファイル内容は外部サーバーにアップロードされたり、モデルトレーニングに使用されたりしません。会話コンテキストのみがClaudeのAPIに送信されます。

セキュリティベストプラクティス

check_circle

最小限のフォルダアクセスを付与

タスクに必要なフォルダのみをマウントしましょう。ホームディレクトリ全体へのアクセスを付与せず、専用の作業フォルダを作成しましょう。

check_circle

重要なファイルをバックアップ

Coworkにファイルの再整理や変更をさせる前に、バックアップがあることを確認しましょう。サンドボックスはOSを保護しますが、許可されたフォルダ内のデータは保護しません。

check_circle

実行前に計画を確認

Claudeは作業開始前に計画を表示します。特にファイルの削除や変更を含むタスクでは、時間をかけて確認しましょう。

check_circle

具体的な指示を出す

「全部きれいにして」のような曖昧な指示は予期しない削除につながる可能性があります。何を保持し、何を変更し、何を削除すべきか明確に指定しましょう。

check_circle

ブラウザタスクを監視

Chrome拡張機能でウェブタスクを実行する際は、悪意のあるサイトがプロンプトインジェクションを試みる可能性があることに注意してください。ウェブ操作中はアクティビティログを監視しましょう。

既知の制限

セキュリティモデルの制限を理解することで、Coworkを安全に使用できます:

warning

あなた自身の指示からは保護しない

Claudeにファイル削除を指示すれば、実行します。サンドボックスは外部の脅威から保護しますが、明示的に許可したコマンドからは保護しません。

warning

プロンプトインジェクションのリスク

分類器はプロンプトインジェクションの検出を助けますが、悪意のあるウェブサイトの確信犯的な攻撃は成功する可能性があります。ウェブ閲覧タスクは注意深く監視してください。

warning

データ流出の可能性

ネットワークアクセスが有効な場合、侵害されたセッションは外部サーバーにデータを送信する可能性があります。機密作業にはネットワーク監視を使用してください。

warning

リサーチプレビュー段階

Coworkはまだリサーチプレビュー段階です。製品の成熟に伴い、セキュリティ対策は進化し続けます。

トラブルシューティング

仮想マシンが起動しない expand_more
Appleシリコン(M1/M2/M3/M4)Macを使用していることを確認してください。VZVirtualMachineフレームワークにはARMアーキテクチャが必要です。また、Linuxファイルシステムをダウンロードするための十分なディスク容量があることも確認してください。
権限付与後もフォルダアクセスが拒否される expand_more
macOSシステム設定 > プライバシーとセキュリティ > ファイルとフォルダを確認してください。Claude Desktopに必要な権限があることを確認してください。権限付与後にアプリを再起動する必要があるかもしれません。
Claudeが安全な操作を拒否する expand_more
時々、セキュリティ分類器が過度に慎重になることがあります。リクエストをより具体的に言い換えてみてください。Claudeが正当なタスクを拒否し続ける場合は、その操作が安全で必要な理由についてより多くのコンテキストを提供できます。
shield

セキュリティを最優先に

AnthropicはCoworkをデフォルトで安全にするために多大なリソースを投入しています。仮想マシン隔離、権限システム、安全メカニズムが連携してリスクを最小化しています。ただし、完璧なシステムはありません。AIエージェントにファイルへのアクセスを許可する際は、常に適切な注意を払ってください。