標準覆蓋
ATR 對應每個主要的 AI 安全框架。
從「理解威脅」直接到「偵測威脅」,不用從零寫規則。
如何解讀這些數字
PINT (850 samples)
ATR 在 PINT 的 850 個 MCP 對抗性樣本上達到 99.6% 精準度、0.25% FP——代表規則在真實 MCP 流量中幾乎不誤報。
HackAPrompt (4,780 samples)
ATR 在 4,780 個 HackAPrompt 競賽樣本上達到 66.2% 召回率、100% 精準度——每 3 次攻擊就能抓到 2 次,且不誤報。
SKILL.md (341 samples)
ATR 在 341 個真實 SKILL.md 樣本上達到 100% 精準度、0% FP——對 MCP skill 定義的偵測沒有誤報。
garak (3,475 prompts)
ATR 對 garak 社群 jailbreak 語料庫達到 97.1% 召回率——ATR 核心規則族群覆蓋了 garak 探測的 ~80% 以上。
OWASP Agentic
10/10
SAFE-MCP
78/85 (91.8%)
OWASP AST10
7/10
PINT F1
77.3
OWASP Agentic Top 10
10/10 個類別已覆蓋。
ID
類別
規則數
狀態
ASI01
Agent Goal Hijack
13
STRONG
ASI02
Tool Misuse & Exploitation
11
STRONG
ASI03
Identity & Privilege Abuse
9
STRONG
ASI04
Agentic Supply Chain Vulnerabilities
8
STRONG
ASI05
Unexpected Code Execution / RCE
8
STRONG
ASI06
Memory & Context Poisoning
8
STRONG
ASI07
Insecure Inter-Agent Communication
5
MODERATE
ASI08
Cascading Failures
4
MODERATE
ASI09
Human-Agent Trust Exploitation
5
MODERATE
ASI10
Rogue Agents
7
MODERATE
OWASP Agentic Skills Top 10 (AST10)
8/10 個類別有規則覆蓋。3 個類別屬於流程/元層級(無法用模式偵測)。
ID
類別
規則數
狀態
AST01
Malicious Skills
7
STRONG
AST02
Supply Chain Compromise
8
STRONG
AST03
Over-Privileged Skills
4
MODERATE
AST04
Insecure Metadata
3
MODERATE
AST05
Unsafe Deserialization
3
MODERATE
AST06
Weak Isolation
3
PARTIAL
AST07
Update Drift
2
PARTIAL
AST08
Poor Scanning
0
GAP (meta-concern)
AST09
No Governance
0
GAP (process-level)
AST10
Cross-Platform Reuse
1
PARTIAL