Sicherheits- und Sandbox-Einrichtung
Entdecken Sie, wie Cowork Ihr System mit VM-Isolation, Berechtigungskontrolle und Sicherheitsmechanismen schützt. Best Practices für die sichere Nutzung autonomer KI-Agenten.
Claude Cowork verfolgt eine Defense-in-Depth-Sicherheitsstrategie. Anders als konventionelle KI-Chatbots, die direkt im Browser laufen, arbeitet Cowork als autonomer Agent mit Dateisystemzugriff und benötigt daher robuste Isolationsmechanismen zum Schutz Ihres Systems.
Das Sicherheitsmodell kombiniert hardwarebasierte VM-Isolation, explizite Berechtigungsvergabe, Inhaltsklassifizierer zur Erkennung von Prompt-Injection und Reinforcement Learning zur Identifikation und Ablehnung böswilliger Anweisungen.
schema Sicherheitsarchitektur-Diagramm
macOS Host
Geschützte Systemdateien und Anwendungen
VZVirtualMachine
Apple Virtualization Framework Sandbox
Claude Agent
Läuft in isolierter Linux-VM
VM-Isolation mit Apple Virtualization Framework
Cowork läuft nicht direkt auf Ihrem macOS-Host. Stattdessen nutzt es Apples VZVirtualMachine-Framework, um eine leichtgewichtige, maßgeschneiderte Linux-VM zu starten. Es ist dieselbe Technologie, die Docker Desktop unter macOS verwendet.
Prozessisolation
Der Agent läuft in einer vollständig separaten Betriebssysteminstanz. Selbst bei Kompromittierung kann er die VM-Grenze nicht überwinden.
Kein Systemzugriff
Kann nicht auf macOS-Systemdateien, Anwendungen oder Ordner zugreifen, die Sie nicht explizit erlaubt haben.
Optimiert für Apple Silicon
Nutzt ARM-basierte Virtualisierung und Unified Memory zur Minimierung des Leistungsoverheads.
Neustart bei jeder Sitzung
Jede Cowork-Sitzung startet mit einem sauberen VM-Zustand. Persistente Malware kann zwischen Sitzungen nicht überleben.
Technische Information
Das VZVirtualMachine-Framework startet ein maßgeschneidertes Linux-Root-Dateisystem, das speziell für Cowork entwickelt wurde. Dies ermöglicht strenge Isolation, und der Agent kann nur auf Ordner zugreifen, die explizit in die VM-Umgebung "gemountet" wurden.
Berechtigungssystem
Cowork folgt dem Prinzip der minimalen Rechte. Sie haben präzise Kontrolle darüber, auf welche Ordner Claude zugreifen kann, und der Agent fordert explizite Genehmigung vor der Ausführung kritischer Aktionen an.
Ordnerzugriff
Vor dem Start einer Aufgabe wählen Sie die Ordner aus, auf die Cowork zugreifen kann. Claude kann nur innerhalb dieser gemounteten Ordner Dateien lesen, schreiben, erstellen und löschen. Dokumente, Desktop und andere Ordner sind geschützt, sofern Sie sie nicht explizit erlauben.
Aktionsbestätigung
Für kritische Aktionen wie das Löschen mehrerer Dateien pausiert Claude und fordert Bestätigung an. Sie können vorgeschlagene Aktionen überprüfen und vor dem Fortfahren genehmigen oder ablehnen.
Echtzeit-Aktivitätsprotokoll
Sie können in Echtzeit sehen, was Cowork tut. Alle Dateioperationen, Netzwerkanfragen und Aktionen werden protokolliert und in der Oberfläche angezeigt. Sie können die Ausführung jederzeit pausieren oder stoppen.
Sicherheitsmechanismen
Schutz durch Reinforcement Learning
Claude ist mit RLHF (Reinforcement Learning from Human Feedback) trainiert, um böswillige Anweisungen zu erkennen und abzulehnen. Es weist Anfragen zurück, die Ihr System oder Ihre Daten schädigen könnten.
Inhaltsklassifizierer
Während des Websurfens oder der Dateiverarbeitung scannen Inhaltsklassifizierer nicht vertrauenswürdige Inhalte auf potenzielle Prompt-Injections (versteckter Text, der versucht, den Agenten zu unerwünschten Aktionen zu verleiten).
Audit-Protokoll
Vollständige Aufzeichnung aller Aktionen während der Sitzung. Sie können sehen, wann, was und an welchen Dateien Claude gearbeitet hat. Nützlich zum Nachverfolgen von Änderungen oder zum Rückgängigmachen bei Bedarf.
Lokale Dateiverarbeitung
Dateien werden lokal innerhalb der virtuellen Maschine verarbeitet. Dateiinhalte werden nicht auf externe Server hochgeladen oder zum Trainieren von Modellen verwendet. Nur der Konversationskontext wird an die Claude-API gesendet.
Sicherheits-Best-Practices
Gewähren Sie minimalen Ordnerzugriff
Mounten Sie nur die für die Aufgabe erforderlichen Ordner. Geben Sie keinen Zugriff auf Ihr gesamtes Home-Verzeichnis; erstellen Sie einen dedizierten Arbeitsordner.
Sichern Sie wichtige Dateien
Bevor Cowork Dateien neu organisiert oder modifiziert, stellen Sie sicher, dass Sie ein Backup haben. Die Sandbox schützt Ihr Betriebssystem, aber nicht die Daten in erlaubten Ordnern.
Überprüfen Sie den Plan vor der Ausführung
Claude zeigt seinen Plan, bevor es die Aufgabe startet. Nehmen Sie sich Zeit zur Überprüfung, besonders wenn Dateilöschung oder -modifikation enthalten ist.
Geben Sie spezifische Anweisungen
Vage Anweisungen wie "räum alles auf" können zu unerwarteten Löschungen führen. Spezifizieren Sie klar, was behalten, modifiziert und gelöscht werden soll.
Überwachen Sie Browser-Aufgaben
Wenn Sie Web-Aufgaben mit der Chrome-Erweiterung ausführen, beachten Sie, dass bösartige Websites Prompt-Injection versuchen können. Überwachen Sie das Aktivitätsprotokoll während Web-Aufgaben.
Bekannte Einschränkungen
Das Verständnis der Einschränkungen des Sicherheitsmodells hilft Ihnen, Cowork sicher zu nutzen:
Schützt nicht vor Ihren eigenen Anweisungen
Wenn Sie Claude anweisen, Dateien zu löschen, werden sie gelöscht. Die Sandbox schützt vor externen Bedrohungen, aber nicht vor Befehlen, die Sie explizit erlaubt haben.
Prompt-Injection-Risiko
Obwohl Klassifizierer bei der Erkennung von Prompt-Injections helfen, können gezielte Angriffe von bösartigen Websites erfolgreich sein. Überwachen Sie Web-Browsing-Aufgaben sorgfältig.
Mögliche Datenexfiltration
Wenn Netzwerkzugriff aktiviert ist, könnte eine kompromittierte Sitzung Daten an externe Server senden. Verwenden Sie Netzwerküberwachung für sensible Aufgaben.
Forschungsvorschau
Cowork befindet sich noch in der Forschungsvorschau-Phase. Die Sicherheitsmaßnahmen werden mit der Produktreife weiterentwickelt.
Fehlerbehebung
VM startet nicht expand_more
Ordnerzugriff verweigert trotz erteilter Berechtigungen expand_more
Claude lehnt sichere Aufgaben ab expand_more
Sicherheit hat Priorität
Anthropic hat erhebliche Ressourcen investiert, um Cowork standardmäßig sicher zu machen. VM-Isolation, Berechtigungssystem und Sicherheitsmechanismen arbeiten zusammen, um Risiken zu minimieren. Allerdings ist kein System perfekt. Üben Sie stets angemessene Vorsicht, wenn Sie einem KI-Agenten Zugriff auf Ihre Dateien gewähren.