Im letzten Teil haben wir über die Risiken gesprochen – von Prompt Injection bis zum Missbrauch von Werkzeugen. Heute gehen wir einen Schritt weiter: Wie schützen wir uns davor? Die Antwort lautet: Isolation. In der Welt der IT nennen wir das „Sandboxing“.
Stell dir einen Agenten wie einen neuen Mitarbeiter vor, den du noch nicht kennst. Du würdest ihm am ersten Tag auch nicht den Generalschlüssel zum Hauptquartier geben. Genauso müssen wir mit KI-Agenten umgehen.
Eine Sandbox ist ein abgesperrter Bereich deines Computers. Alles, was der Agent dort tut, bleibt dort. Er kann innerhalb dieser Box Dateien erstellen, Code ausführen oder Berechnungen anstellen – aber er kann nicht einfach „ausbrechen“ und auf deine privaten Dokumente oder dein Betriebssystem zugreifen.
KI-Agenten nutzen Tools, um Aufgaben zu lösen. Ein mächtiges Tool ist zum Beispiel ein Python-Interpreter, mit dem der Agent Code schreiben und ausführen kann. Ohne Sandbox könnte dieser Code deinen Rechner löschen. Mit einer Sandbox kann der Code zwar ausgeführt werden, hat aber keinen Zugriff auf deine echten Festplatten.
Isolation ist der wichtigste Schutzwall für jeden, der Agenten produktiv einsetzt. Es geht nicht darum, der KI zu misstrauen, sondern das System so zu gestalten, dass ein Fehler oder eine Manipulation keinen katastrophalen Schaden anrichten kann.
Im vierten Teil schauen wir uns konkrete Best Practices an, wie du im Alltag sicher mit Agenten arbeitest – egal ob du sie selbst entwickelst oder nur nutzt.