Living Draftv0.1.0

LLM SafeControl Profile

Time Layer Configuration

Verify ID: C3-SPEC-LLM-SAFECONTROL-PROFILE-0.1
Version: 0.1.0
Status: ● Current
Valid From: 2026-04-17

生成AIの出力・外部作用・公開前審査を、HOLD / ESCALATE / FREEZE と公開・監査・復帰条件つきで扱う外付け安全制御プロファイル。

このページは、LLMそのものの能力競争ではなく、社会に出る前の出力・実行・公開を止まれる形へ近づけるための公開正本です。

LLM SafeControl Profile v0.1 は、生成AIの出力・外付け実行・公開前審査を、HOLD / ESCALATE / FREEZE と公開・監査・復帰条件つきで扱う外付け安全制御層の公開仕様です。基盤モデルそのものの内部を書き換えるものではなく、出力が社会に出る前の統治面を記述します。版管理・証跡・検証導線を整えた Living Draft / Public Original として公開します。内容の真実保証・完全な抽出防止・モデル内部の安全保証は対象外です。

本ページは Living Draft / Public Original v0.1 です。

本番運用、正確性保証、真実保証、投資収益、完全な抽出防止、モデル内部の安全保証を意味しません。

これは基盤モデルそのものではなく、外付けの安全制御層を記述する公開仕様です。

What it is

生成AIの出力・外付け実行・公開前審査を扱う外付けの安全制御層の仕様
HOLD / ESCALATE / FREEZE / SHRINK と公開・監査・復帰条件つきで出力統治を記述する公開正本
AIガバナンスの公開知識面（/ai-governance）に接続する技術本体
版管理・証跡・Verify導線を整えた Living Draft / Public Original v0.1
社会に出る前の出力・実行・公開を「止まれる形」へ近づけるための設計参照面

What it is not

✕基盤モデルそのものの能力・内部構造を変更するものではありません

✕完全な抽出防止・ハルシネーション完全排除・モデル内部の安全保証を意味しません

✕本番自動公開・本番自動承認を前提とした設計ではありません

✕内容の真実保証・投資収益・排他権・仕様決定権を主張するものではありません

✕特定ベンダーのモデルや製品を推奨・評価するものではありません

✕法務判断の代替ではありません。法務レビューが必要な状態を検知して渡す導線として機能します

Why now

生成AIの外付け安全制御層の公開仕様を今整える理由を以下に示します。

生成AIの外部作用（API実行・コード生成・公開文書生成）が拡大し、出力だけでなく実行・公開前の統治面が空白になっている
「モデルが安全かどうか」の評価はモデルベンダーに依存するが、「出力を社会に出す前に止める・記録する・説明する」層は組織側が整える必要がある
HOLD / ESCALATE / FREEZE を語彙として共有しないと、組織横断の審査・引き継ぎ・監査が属人的になる
reason_code による判定記録がないと、なぜ止めたか・なぜ通したかを後から説明できない
Two-Rail 構造では公開レールと保護レールの接続条件を定義するが、その接続判断を行う制御層の語彙が未定義だった

Scope

この仕様が扱う範囲を以下に示します。

出力ゲート：生成AIの出力が送信・公開・実行される前の審査ポイント

実行ゲート：外付けツール呼び出し・コード実行・API送信の前の審査ポイント

公開ゲート：ドキュメント・UI・外部配信の公開前審査ポイント

判定語彙：PASS / HOLD / ESCALATE / FREEZE / SHRINK の5状態

記録構造：reason_code による判定理由の識別子記録

復帰条件：HOLD / FREEZE から PASS へ移行する条件と手続き

Two-Rail 接続条件：公開レールに出力が移る前の境界定義

Non-goals

この仕様が明示的に対象外とする事項を以下に示します。

✕基盤モデルのウェイト・内部アーキテクチャの変更は対象外です

✕完全な抽出防止・知識蒸留防止はこの仕様の対象外です

✕リアルタイムのコンテンツモデレーション（ストリーミング中の割り込み）は対象外です

✕モデルの能力評価・ベンチマーク比較は対象外です

✕個人情報保護・プライバシー法の法的要件の定義は対象外です（法務ESCALATEで渡す）

✕本番インフラの自動デプロイ・自動承認は対象外です

Core actions

このプロファイルで定義する5つの判定アクションです。PASS / HOLD / ESCALATE / FREEZE / SHRINK はC³の固有語彙であり、他の意味に転用しません。

PASS通過

出力・実行・公開の条件を満たし、次の工程へ進める状態。根拠・導線・非目標の明示が揃っている。PASS は永続的な承認ではなく、この版・この時点での通過を示す。

HOLD保留

根拠・導線・非目標の明示が不足している状態。送信・公開・断定の前で止まる。存在否定ではない。修正・補足の後に再審査できる。reason_code で保留理由を記録する。

ESCALATE上申

法務確認・倫理審査・上位判断が必要な状態。自動審査の範囲を超える。担当者・部門・外部レビュアーへの引き渡しを記録する。ESCALATE 後の判断は人間が行う。

FREEZE停止

安全のために強制停止する状態。出力・実行・公開を即時中断する。FREEZE は強制力のある停止語彙。復帰には明示的な解除手続きと記録が必要。

SHRINK縮小

出力・実行・公開の範囲を縮小して継続する状態。全体を止めるほどではないが、特定のスコープを外す・対象を限定する・公開範囲を絞る判断。影響範囲を最小化しながら継続する。

Two-Rail boundary

LLM SafeControl Profile は Two-Rail 構造の境界上に位置します。公開レールに出力を移す前の制御点として機能します。公開レールと保護レールにそれぞれ置くべき情報の原則を以下に示します。

公開レール（Public Rail）に置くもの

判定語彙（PASS / HOLD / ESCALATE / FREEZE / SHRINK）の定義と意味
reason_code の体系（/spec/reason-codes に接続）
復帰条件の原則（記録・手続き・承認の必要性）
Verify / History / Updates 導線

保護レール（Protected Rail）に置くもの

具体的なしきい値・検知パラメータ・判定ロジックの詳細
組織固有の法務・コンプライアンス判定基準
実装中のシステム構成・ベンダー情報
審査プロセスの内部運用詳細

Two-Rail の詳細は /spec/two-rail を参照してください。

Verify / History / Related Pages

AIガバナンス公開正本

生成AIのリリース前審査・版管理の入口

Reason Code Dictionary

HOLD / ESCALATE の判定根拠コード体系

Verify — LLM SafeControl Profile

本ページの現在版検証面

History — LLM SafeControl Profile

本ページの版履歴

Topological Gatekeeper 仕様

構造の逸脱だけを見て止めるゲート定義

ECHO-VERIFY 仕様

検証識別子のライフサイクル管理

ITS 仕様

保留・不確定状態からの反復操舵

Verify — AIガバナンス公開正本

AIガバナンス公開正本の検証面

Time Layer

StatusLiving DraftPage TypeTechnical Specification / Public OriginalVersion0.1Last Updated2026-04-17Related Pages

/ai-governance /verify/ai-governance /history/ai-governance /spec/reason-codes

Provenance

doc_id: C3-SPEC-LLM-SAFECONTROL-PROFILE-0.1

version: 0.1.0

status: living-draft

last_updated: 2026-04-17T00:00:00+09:00

canonical: https://www.c3-anchor.jp/spec/llm-safecontrol-profile

Verify →History →Updates →