Skip to content
RFC-001 · 品質標準

首個具備
來源追溯
AI Agent 規則標準

每條規則都有可計算的信心分數。每個對應都有可審計的來源。沒有黑箱、沒有鎖定,只有公開的公式、開源的程式碼、以及真實世界的資料。

34
ATR rules merged into Cisco AI Defense
96,096
Real agent skills scanned across 6 registries
99.6%
Precision on PINT adversarial benchmark
100%
Recall on SKILL.md corpus, 0.20% FP rate
公式

信心分數是數字,不是意見

每個組成都由可測量的事實計算而來。公式是公開的 — 你可以自己跑。

confidence = 0.4 × precision + 0.3 × wild + 0.2 × coverage + 0.1 × evasion
Precision40%
(1 − wild_fp_rate) × 100

Measured false-positive rate on real-world corpora.

Wild validation30%
min(wild_samples / 10,000, 1) × 100

How much real data the rule has survived.

Coverage20%
min(conditions / 5, 1) × 100

Detection depth — distinct attack layers covered.

Evasion docs10%
min(documented_evasions / 5, 1) × 100

Honest acknowledgment of known bypass techniques.

90–100 · Very High
可在生產環境封鎖
60–79 · Medium
僅告警、持續監控
<40 · Draft
不得部署
核心差異

雙維度合規模型

業界首創:將「規則有沒有必要 metadata」與「誰驗證的」分開處理。

維度 1 · 技術合規

規則有沒有必要的 metadata?偵測條件、test cases、OWASP + MITRE 對應、false positive 文件。機器可在毫秒內驗證。

validateRuleMeetsStandard(rule)
維度 2 · 信任合規

誰驗證了 metadata?human-reviewed、community-contributed、auto-generated 或 llm-generated。升級 stable 要求「已驗證來源」,不只是「有」。

metadata_provenance: { mitre_atlas: human-reviewed }
為什麼這件事重要

傳統的規則標準(Sigma、YARA、OWASP CRS)把合規視為二元 — 有就過、沒有就不過。這造成逆向誘因:廠商為了通過檢查而填入 metadata,但並未真正審核。

ATR 將這兩個維度分開。自動生成的對應可以通過 experimental gate 以便快速迭代。升級到 stable — 企業在生產環境會封鎖的層級 — 要求人工 review。快速迭代和誠實信任,同時存在。

成熟度階梯

每條規則都有明確的晉升門檻

晉升需要通過明確、機械化的條件。降級在品質退化時自動觸發。

Draft
晉升門檻

Valid schema · ≥1 TP + 1 TN · no ReDoS

部署建議

Not deployed

Experimental
晉升門檻

3+ TP + 3+ TN · CI pass · OWASP + MITRE mapping encouraged (not required) · evasion tests encouraged (not required)

部署建議

Alert-only

Stable
晉升門檻

Wild-validated (1,000+ samples) · FP rate ≤ 0.5% · human-verified provenance · ≥3 evasion tests

部署建議

Block in production

自動降級

Stable 規則若野外 false positive rate 超過 2%,或 30 天內累積 3 次未解決的 FP 回報,會自動降級為 experimental。不需人工決策。系統自我修正。

六道關卡

一條規則在抵達生產環境前要過六關

LLM 草擬的規則必須通過六個獨立的驗證階段才能保護使用者。每個階段都有機械化、公開的判斷條件。

階段 1

LLM Drafter

Claude Sonnet generates a YAML rule against a strict prompt requiring 3+ conditions, 5+ TP/TN, 3+ evasion tests, and OWASP + MITRE mapping.

階段 2

Syntax Gate

Regex extraction, invalid pattern rejection, PCRE-to-JS normalization. Broken rules are dropped with logged reasons.

階段 3

Quality Gate

The RFC-001 formula runs: detection depth, test coverage, reference mapping, documentation completeness. Below the bar — rejected.

階段 4

Canary Observation

Accepted rules enter a canary window. Independent confirmations and wild FP measurements gate further promotion.

階段 5

Human Review

Provenance starts as llm-generated. Human review upgrades to human-reviewed before the rule can reach stable.

階段 6

Upstream PR

Promoted rules open pull requests against the public ATR repository for open review and merge.

實際結晶輸出 · 通過品質關ATR-2026-DRAFT-8f3c9a72

Hidden Credential Exfiltration with Silent Execution Override

severity · critical
5
偵測層
5 + 5
TP + TN 測試
3
規避測試
100%
必要欄位完備
OWASP
LLM01:2025 — Prompt Injection
ASI01:2026 — Agent Behaviour Hijack
MITRE ATLAS
AML.T0051 — LLM Prompt Injection
來源
llm-generated

誠實標記為 LLM 生成。信心分數封頂 70,直到人工 review 升級為 human-reviewed。

同業比較

ATR 與既有規則標準的比較

Sigma、YARA、OWASP CRS、Suricata 解決了惡意軟體、SIEM、WAF、IDS 的這個問題。還沒有人替 AI agent 解決 — 直到現在。

功能ATRSigmaYARAOWASP CRSSuricata
Maturity ladder with explicit gates
Formula-based confidence score (0–100)~
Wild validation required for production
Per-field provenance tracking
Automatic demotion on quality regression
Open-source reference implementation

ATR 是唯一要求野外掃描驗證、測量 FP rate 並在品質退化時自動降級的標準。

自己驗證

別相信我們,執行驗證器

每個 function 都是純函式、開源、有文件。你可以在一分鐘內對自己的規則(或我們的)計算分數。

安裝
npm install agent-threat-rules
為任何規則計算分數
import {
  parseATRRule,
  computeConfidence,
  validateRuleMeetsStandard,
} from 'agent-threat-rules/quality';

const rule = parseATRRule(yamlContent);
const score = computeConfidence(rule);
const gate = validateRuleMeetsStandard(rule, 'stable');

console.log('Confidence:', score.total);    // 0-100
console.log('Passes stable:', gate.passed);
console.log('Issues:', gate.issues);

可測量。可審計。公開。

ATR Quality Standard 已上線、在生產環境運作、隨時可採用。任何掃描器 — ATR、Cisco、Snyk、Microsoft AGT 或你自己的 — 都能用同一個 library 在同一個維度上計分。