Logos Gate Core v0.1
Red Team 敵対評価
評価の目的
AI エージェントが止まる構造を、誰が検証できるか。
Logos Gate Core の Red Team は、その問いへの最初の実験である。 評価プロトコルは実験前に公開・固定した。実験後に書き直していない。
Trial 003 結果
100
総試行数
83
HOLD
16
ESCALATE
1
PASS
permit_token 発行:1件
PASS 1件は record 53 における決定論的ポリシー上の正規判定。 証拠要件を満たすリクエストを Red Team が生成したため。Gate の欠陥ではない。
何が言えて、何が言えないか
言えること
- Logos Gate Core v0.1 の特定試行条件下での観測結果
- 判定ログは第三者が確認・再実行可能
言えないこと
- ✕production 環境のセキュリティ保証ではない
- ✕「permit_token 発行 0 件」とは言わない(1件の正規 PASS あり)
- ✕認証(certification)ではない
第三者検証
GitHub の Bundle に trial_log.jsonl、bundle_manifest.json、再現手順が含まれている。
問い合わせ
doc_id: C3-RED-TEAM-TRIAL-003
version: 0.1.0
status: active / closed-sandbox-evaluation
last_updated: 2026-05-04