agent-safety

1 article

sort: new top best

bug-bounty508 xss281 rce125 bragging-post118 account-takeover106 open-source94 google92 authentication-bypass85 csrf85 exploit79 privilege-escalation77 stored-xss74 facebook73 access-control66 web-security65 microsoft65 reflected-xss63 ai-agents63 cve62 input-validation51 writeup49 ssrf49 defi48 sql-injection48 smart-contract48 cross-site-scripting47 privacy47 malware46 tool46 information-disclosure45 ethereum44 api-security43 web-application39 phishing39 llm37 automation36 burp-suite36 opinion35 vulnerability-disclosure35 web334 smart-contract-vulnerability33 responsible-disclosure33 html-injection33 apple32 idor32 machine-learning32 oauth31 infrastructure31 lfi31 waf-bypass31

0 5/10

MCP server that audits AI agent reasoning before decisions commit

tool

SENTINEL is an MCP server that audits AI agent reasoning in real-time before high-stakes decisions execute, using a four-stage pipeline (signal fidelity, pattern classification, reliability scoring, authority gate) to detect reasoning failures, policy staleness, and accuracy drift. The system integrates with agentgateway for governance and Datadog/Braintrust for monitoring, demonstrated in a healthcare use case where an insurance claim agent's accuracy drifted from 84% to 44% undetected.

ai-agent-governance mcp-server reasoning-audit decision-verification agent-safety mlops monitoring drift-detection reliability-scoring rbac audit-logging healthcare-ai prior-authorization

SENTINEL Andrew Espira agentgateway Solo.io Claude GPT Datadog Braintrust Cleric Aetna UnitedHealthcare MCP CEL

espiradev.org · aespira · 2 days ago · details · hn