Browser-Shield-Richtlinien

Policies konfigurieren, die KI-Nutzung im Browser steuern — BLOCK, WARN, JUSTIFY, REDIRECT, MODIFY.

Browser Guard nutzt dieselbe Policy-Engine wie die Gateway-, SDK- und MCP-Pfade. Es gibt keinen separaten Policy-Satz — Sie schreiben eine Policy, sie greift überall. Der einzige Unterschied ist der Ingestion-Pfad, den Browser Guard als BROWSER_SHIELD taggt, zum Filtern und für Audit-Berichte.

Die fünf Enforcement-Aktionen

Aktion	Nutzererlebnis	Trace-Eintrag
BLOCK	Prompt wird nicht gesendet. Roter Toast mit Policy-Begründung. Nutzer kann nicht fortfahren.	`decision: BLOCKED`
WARN	Gelber Toast warnt den Nutzer. Zwei Buttons: Trotzdem senden (fährt fort) oder Abbrechen.	`decision: WARNED`, `userAction: WARN_PROCEEDED` (falls gesendet)
JUSTIFY	Modaler Dialog erfordert eine schriftliche geschäftliche Begründung, bevor der Prompt gesendet werden kann.	`decision: JUSTIFIED`, `justification: "..."`
REDIRECT	Toast mit Link auf eine genehmigte Alternative (z. B. internes Llama 3, Copilot for Enterprise).	`decision: REDIRECTED`, `redirect_to: "..."`
MODIFY	PII / Secrets werden inline vor dem Senden maskiert. Grüner Toast listet auf, was maskiert wurde.	`decision: MODIFIED`, `redactions: [...]`

Wahl nach Bedrohungsmodell und Business-Impact:

BLOCK bei unbedingten Verboten (z. B. Erzeugung von Finanzberatung, Kreditkarte im Prompt).
WARN, wenn die Aktion riskant, aber manchmal legitim ist (z. B. Kundendaten in einem öffentlichen LLM — okay für Marketing-Texte, nie für einen authentifizierten Nutzer-Datensatz).
JUSTIFY, wenn Sie einen Audit-Trail für „warum" brauchen — der Begründungstext wird manipulationssicher erfasst.
REDIRECT, wenn Sie eine genehmigte interne Alternative haben — treibt die Adoption sanktionierter Tools.
MODIFY für maskierbare Daten (PII, Secrets). Der Nutzer arbeitet weiter; sensitive Bytes verlassen nie das System.

Empfohlene Starter-Policies

PII-Schutz (MODIFY)

Browserbasierte KI ist die Top-Quelle für unbeabsichtigte PII-Leakage. Setzen Sie eine MODIFY-Policy auf BROWSER_SHIELD-Traces mit aktivem PII-Redaktion-Preset. Der maskierte Prompt geht zum LLM; der Nutzer behält seinen Workflow; Sie behalten Compliance.

Kundendaten-Block (BLOCK)

Eine zweite, engere Policy, die auf „echte Kundendatensätze" zielt — z. B. alles, was E-Mail + Telefon + Name im selben Prompt enthält — und blockiert. Die MODIFY-Policy oben fängt einen PII-Typ nach dem anderen; diese fängt das „Ich frage ChatGPT zu einem bestimmten Kunden"-Muster.

Vertrauliche Projektnamen (BLOCK)

Blockieren Sie Prompts mit internen Projekt-Codenamen, Finanzzahlen oder Kundenlogos. Konfigurieren Sie die Keyword-Liste in der Neural Instruction der Policy.

Shadow-AI-Observability (FLAG)

Bevor Sie zu blockieren beginnen, fahren Sie zwei Wochen eine reine FLAG-Policy, um zu sehen, was Mitarbeiter wirklich tun. Daten erscheinen im Shadow-AI-Dashboard — nutzen Sie die Funde, um Ihre eigentlichen Policies zu scopen.

Nutzeraktionen auf Traces erfassen

Wenn eine WARN, JUSTIFY oder REDIRECT feuert, erfasst Palveron die Reaktion des Nutzers im Trace. Programmatische Aufrufer (z. B. die Browser-Shield-Extension, eigene Integrationen) aktualisieren den Trace via:

POST /api/v1/traces/{trace_id}/action
Authorization: Bearer pv_live_...

{
  "action": "WARN_PROCEEDED",
  "justification": "Prüfe öffentliches Marketing-Material — keine PII."
}

Gültige Actions: WARN_PROCEEDED, JUSTIFIED (letztere erfordert eine justification von mindestens 10 Zeichen). Der Endpoint ist idempotent — first writer wins; nachfolgende Calls geben den Original-Record zurück.

Nutzeraktionen erscheinen in:

Trace-Detail — User-Action-Badge mit Hover-für-Begründung (siehe Trace Explorer).
Compliance-Berichte — Per-Agent-warn_overrides-Counter; erscheint im EU-AI-Act-Annex-IV-PDF als Nachweis menschlicher Aufsicht.
Shadow-AI-Compliance-Summary — Per-Domain-Warn-Override-Rate; hilft Ihnen, Policies zu identifizieren, die zu oft feuern (vermutlich falsch gescoped), und Policies, die selten feuern, aber viele Begründungen sammeln (vermutlich ist die Policy-Begründung unklar).

Toast-Benachrichtigungen

Nutzer sehen farbcodierte Toasts, die nach 6 Sekunden verschwinden (oder bis zur Bestätigung bleiben für JUSTIFY).

Farbe	Bedeutung
🔴 Rot	Prompt blockiert
🟠 Gelb	Warnung — fortfahren oder abbrechen
🔵 Blau	Begründung erforderlich
🟣 Violett	Umleitung auf genehmigtes Tool
🟢 Grün	Prompt modifiziert (maskiert) — gesendet

Toasts erkennen die Browser-Sprache automatisch (Englisch oder Deutsch out-of-the-box). Für weitere Sprachen konfigurieren Sie eigene Übersetzungen unter Einstellungen → Browser Guard → Lokalisierung.

Browser-Shield-Richtlinien

On this page