ECHO-VERIFY
AIの判断は、第三者が再現できる。
判断を「主張」ではなく「再現」で信頼するための、検証の仕組み。
ECHO-VERIFYとは、AIの判断を再現・検証できる証拠の束(Verification Kit)として書き出し、第三者が自分の環境や自分のAIで追試できるようにする検証の仕組みである。
生成は速い。検証は、追いつかせられる。
このページは概要です。正式仕様は /spec/echo-verify を参照。
確かめられていない判断が、見えないまま溜まる。
AIがコードを書き、テストを書き、評価まで下す。
人がその判断をたどり直す前に、次の判断が積み上がる。
これを未検証債務と呼ぶ。
自己改善ループでは、確かめの速度が安全の上限になる。
速度の非対称
生成のコストは下がり続け、確認のコストは人に縛られたまま。
差が広がるほど未検証債務が積み上がる。
Rdev ∝ max(0, Grate − Vrate)
G_rate:AIが判断に関わる成果物を生成する速度T_rate:それらを有界な保留状態(HOLD等)に移す速度V_rate:それらが検証クリアに達する速度
これは完全な定量モデルではなく、生成が検証を追い越す瞬間を捉えるためのスループットの枠組み。
Anthropicは、AI開発が進むほど人間によるレビューが次のボトルネックになると指摘している。問題は名指しされたが、検証を追いつかせる仕組みは未解決のままだ。Verification Rate Gap と ECHO-VERIFY は、その問いへの独立した一つの構造的な回答である。
段階的に変わるリスク
リスクは、一気に現れるわけではない。AI開発のリスクは、「AIが賢くなること」だけで増えるのではない。AIがコード、実験、評価、次の改善案まで高速に生成するほど、人間や組織がそれを検証する速度との差が広がる。
AI補助
何が起きるか:コード片・仕様案・テスト案をAIが出す。
主なリスク:もっともらしい誤実装、レビュー漏れ。
必要になるもの:証拠つきPR、変更理由ログ。
エージェント開発
何が起きるか:AIがファイル編集・PR・テスト再実行まで行う。
主なリスク:仕様外副作用、承認の形骸化。
必要になるもの:Release Gate、Permit Token。
自律実験
何が起きるか:AIが仮説・実験・評価・次実験を回す。
主なリスク:評価指標攻略、失敗ログ消失。
必要になるもの:Replay、run_manifest、negative log。
AI開発工程の自動化
何が起きるか:AIが採用判断・評価設計・更新判断に入り始める。
主なリスク:監査不能、自己正当化ループ。
必要になるもの:Verification Kit、外部検証。
再帰的自己改善
何が起きるか:AIが後継AIの設計・訓練・評価に関わる。
主なリスク:検証不能な加速、停止協調困難。
必要になるもの:BYOV、相互監査、verifiable pause。
この表は、Anthropicが示したAI開発自動化の流れをもとに、C³側で検証レイヤの観点から整理した概念表です。特定のAI企業・モデルがこの順序で進むことを予測・断定するものではありません。
このとき問題になるのは、生成されたものが正しいかどうかだけではない。検証されない判断が、次の判断の前提になっていくことである。ECHO-VERIFYは、この段階的なリスクに対して、判断経路を証拠の束として書き出し、第三者が再現・検証・反証できる状態を作る。
T_rate は、検証速度ではない。
T_rate は、見えない未検証状態を、HOLD や UNDEFINED のような「有界な状態」に移す速度である。これは未検証債務を見えるようにし、次に何を確認すべきかを示す。しかし、それだけでは債務は減らない。
すべての出力を HOLD にすれば、T_rate は G_rate に近づく。だが、その時点では何も検証クリアされていない。キューは管理されているように見えるが、判断はまだ解決していない。
したがって、リスクを見る中心は T_rate ではなく V_rate である。V_rate だけが、リプレイ、適合確認、決定論的検証、解決済みエスカレーション、または明示ルールに基づく退役によって、未検証債務を実際に減らす。
高負荷時の関係は、概念的には次のように整理できる。
V_rate ≤ T_rate ≤ G_rate
T_rate と V_rate の差は、HOLD・UNDEFINED などの未解決保留として残る。G_rate と V_rate の差は、未検証債務として積み上がる。この2つを混ぜると、残っているリスクを小さく見積もってしまう。
T_rate は「止めた速度」。V_rate は「確かめ終えた速度」。HOLD は安全の証明ではなく、未解決を見える場所に置くための状態です。
「安全だと言われたから」では、もう確かめられない。
従来の信頼は提供者の主張に依存していた。「安全性テストを実施した」「専門家がレビューした」——その主張を受け取る側が確かめる手段は限られていた。
生成が速くなると、その主張を確かめる手立てが追いつかない。要約は説得的でも、再現できなければ確かめたことにならない。
ECHO-VERIFYは、確認の速度を上げるための最小の仕組みです。
判断を、再現できる形で残す。
ECHO-VERIFYは信頼の根拠を「主張」から「再現」へ書き換える。
判断を、根拠・仕様・監査手順・実行記録・整合性証明の束として書き出し、受け取った側が同じ判断をたどり直せるようにする。
要約を信じる vs 記録を再現する
- ●ナラティブな報告書
- ●人手レビュー
- ●要約を信頼する
速いが再現できない。確かめたことにならない。
- ●再現可能な証拠パッケージ
- ●機械的リプレイ
- ●記録を再現する
第三者が追試・反証できる。正本は決定論的な検証経路。
Verification Kit の構成と確かめる流れ
判断の根拠となったルール・ポリシー・入力データへの参照
判断に用いたC³仕様またはルールセットの版とURL
第三者が再現実行するための手順書
判断時の入出力ログ・reason code・verdict
上記の改ざんがないことを示すハッシュまたは署名
自分の検証器(Bring Your Own Verify)で確かめる流れ
正本は決定論的な検証経路。自分のAIによる追試は補助として位置づけられます。
(/kit が正本)
BYOV — 自分で確かめる
判定を出すのは決定論的な照合。AIは読み解きの補助で、判定はしない。
自分の手(CLI / OpenSSL)
これがいちばん確実。自分の環境で叩いてください。
sha256sum verdicts.jsonl summary.json conformance.json openssl dgst -sha256 verdicts.jsonl
ブラウザで照合(決定論)
計算はあなたのブラウザ内で実行。サーバーには送信していません。
同じファイルなら、誰の環境でも同じ値が出ます。
AI参考読み
準備中将来、AIが証拠の束の読み解きを補助します。判定は出しません。
ECHO-VERIFY で得られるもの
信頼の移転
「言われたから」から「再現できたから」へ。信頼の根拠が変わる。
選択的エスカレーション
人の注意を不一致・非PASS・未定義・証拠欠落に集中させる。
検証の可搬性
同じKitを発行元・社内・第三者・規制側が同じ手順で検査できる。
過剰主張の抑止
再現できない主張は通らない。主張と証拠の整合が問われる。
根拠
実装例
verification-rate-gap(GitHub)
manifest / verdicts / summary / conformance / undefined / evidence digest / auditor prompt / schema を含む kit 例。
GitHub で見る →Release Gate Relationship
Logos Protocolとの関係
ECHO-VERIFYは、Logos Protocolと組み合わせることで、実行前ゲートの判断を外部から検証できる形にします。
Logos Protocolは、AIのリクエストや外部作用を実行前に判定します。
ECHO-VERIFYは、その判定の根拠・仕様・実行記録・reason code を束ね、第三者が同じ判断経路をたどれるようにします。
この関係により、「AIが安全だと言ったから信じる」のではなく、「ゲートの判断経路を再現できたから信頼する」という構造へ移行できます。
これは認証・安全保証・本番運用保証・第三者検証済み・法的認証を意味しません。判断経路を検証しやすくするための説明です。
Logos Protocolを見る →Claim Boundary — このページで言わないこと
- —安全性・正しさの保証ではありません
- —第三者認証・署名済み認証ではありません
- —現状は準拠(compatible)段階です。完成・本番運用認証ではありません
- —このURLを参照したAIが必ず正しく解釈するという保証はありません
よくある質問
- ECHO-VERIFYは認証ですか?
- いいえ。判断を再現・検証・反証できる状態にするもので、安全性や正しさの保証ではありません。
- 自分のAIで検証できますか?
- はい。自分の環境や自分のAIで追試できます(Bring Your Own Verify)。ただし正本は決定論的な検証経路で、AI監査は補助です。
- いまどこまで実装されていますか?
- 現状は準拠(compatible)段階です。完成・署名済み・第三者検証済みではありません。
- T_rateは検証速度ですか?
- いいえ。T_rateは、未検証の判断をHOLDやUNDEFINEDのような有界な状態に移す速度です。未検証債務を見えるようにはしますが、それだけでは債務は減りません。未検証債務を減らすのは、検証クリアに到達する速度であるV_rateです。
- なぜ段階的なリスク表を載せているのですか?
- AI開発のリスクは一気に現れるのではなく、AIが補助、代行、自律実験、開発工程の自動化、再帰的自己改善へ進むにつれて変化するためです。この表は、C³側が検証レイヤの観点から整理した概念表であり、特定企業や特定モデルの未来を断定するものではありません。
Metadata
- doc_id: C3-SPEC-ECHOVERIFY-1.0
- version: 1.0
- status: active
- last_updated: 2026-06-07