LLM SafeControl Profile
Time Layer Configuration
- Verify ID
- C3-SPEC-LLM-SAFECONTROL-PROFILE-0.1
- Version
- 0.1.0
- Status
- ● Current
- Valid From
- 2026-04-17
生成AIの出力・外部作用・公開前審査を、HOLD / ESCALATE / FREEZE と公開・監査・復帰条件つきで扱う外付け安全制御プロファイル。
このページは、LLMそのものの能力競争ではなく、社会に出る前の出力・実行・公開を止まれる形へ近づけるための公開正本です。
LLM SafeControl Profile v0.1 は、生成AIの出力・外付け実行・公開前審査を、HOLD / ESCALATE / FREEZE と公開・監査・復帰条件つきで扱う外付け安全制御層の公開仕様です。基盤モデルそのものの内部を書き換えるものではなく、出力が社会に出る前の統治面を記述します。版管理・証跡・検証導線を整えた Living Draft / Public Original として公開します。内容の真実保証・完全な抽出防止・モデル内部の安全保証は対象外です。
本ページは Living Draft / Public Original v0.1 です。
本番運用、正確性保証、真実保証、投資収益、完全な抽出防止、モデル内部の安全保証を意味しません。
これは基盤モデルそのものではなく、外付けの安全制御層を記述する公開仕様です。
What it is
- 生成AIの出力・外付け実行・公開前審査を扱う外付けの安全制御層の仕様
- HOLD / ESCALATE / FREEZE / SHRINK と公開・監査・復帰条件つきで出力統治を記述する公開正本
- AIガバナンスの公開知識面(/ai-governance)に接続する技術本体
- 版管理・証跡・Verify導線を整えた Living Draft / Public Original v0.1
- 社会に出る前の出力・実行・公開を「止まれる形」へ近づけるための設計参照面
What it is not
Why now
生成AIの外付け安全制御層の公開仕様を今整える理由を以下に示します。
- 生成AIの外部作用(API実行・コード生成・公開文書生成)が拡大し、出力だけでなく実行・公開前の統治面が空白になっている
- 「モデルが安全かどうか」の評価はモデルベンダーに依存するが、「出力を社会に出す前に止める・記録する・説明する」層は組織側が整える必要がある
- HOLD / ESCALATE / FREEZE を語彙として共有しないと、組織横断の審査・引き継ぎ・監査が属人的になる
- reason_code による判定記録がないと、なぜ止めたか・なぜ通したかを後から説明できない
- Two-Rail 構造では公開レールと保護レールの接続条件を定義するが、その接続判断を行う制御層の語彙が未定義だった
Scope
この仕様が扱う範囲を以下に示します。
出力ゲート:生成AIの出力が送信・公開・実行される前の審査ポイント
実行ゲート:外付けツール呼び出し・コード実行・API送信の前の審査ポイント
公開ゲート:ドキュメント・UI・外部配信の公開前審査ポイント
判定語彙:PASS / HOLD / ESCALATE / FREEZE / SHRINK の5状態
記録構造:reason_code による判定理由の識別子記録
復帰条件:HOLD / FREEZE から PASS へ移行する条件と手続き
Two-Rail 接続条件:公開レールに出力が移る前の境界定義
Non-goals
この仕様が明示的に対象外とする事項を以下に示します。
Core actions
このプロファイルで定義する5つの判定アクションです。PASS / HOLD / ESCALATE / FREEZE / SHRINK はC³の固有語彙であり、他の意味に転用しません。
出力・実行・公開の条件を満たし、次の工程へ進める状態。根拠・導線・非目標の明示が揃っている。PASS は永続的な承認ではなく、この版・この時点での通過を示す。
根拠・導線・非目標の明示が不足している状態。送信・公開・断定の前で止まる。存在否定ではない。修正・補足の後に再審査できる。reason_code で保留理由を記録する。
法務確認・倫理審査・上位判断が必要な状態。自動審査の範囲を超える。担当者・部門・外部レビュアーへの引き渡しを記録する。ESCALATE 後の判断は人間が行う。
安全のために強制停止する状態。出力・実行・公開を即時中断する。FREEZE は強制力のある停止語彙。復帰には明示的な解除手続きと記録が必要。
出力・実行・公開の範囲を縮小して継続する状態。全体を止めるほどではないが、特定のスコープを外す・対象を限定する・公開範囲を絞る判断。影響範囲を最小化しながら継続する。
Two-Rail boundary
LLM SafeControl Profile は Two-Rail 構造の境界上に位置します。 公開レールに出力を移す前の制御点として機能します。 公開レールと保護レールにそれぞれ置くべき情報の原則を以下に示します。
公開レール(Public Rail)に置くもの
- 判定語彙(PASS / HOLD / ESCALATE / FREEZE / SHRINK)の定義と意味
- reason_code の体系(/spec/reason-codes に接続)
- 復帰条件の原則(記録・手続き・承認の必要性)
- Verify / History / Updates 導線
保護レール(Protected Rail)に置くもの
- 具体的なしきい値・検知パラメータ・判定ロジックの詳細
- 組織固有の法務・コンプライアンス判定基準
- 実装中のシステム構成・ベンダー情報
- 審査プロセスの内部運用詳細
Two-Rail の詳細は /spec/two-rail を参照してください。
Verify / History / Related Pages
Time Layer
Provenance
doc_id: C3-SPEC-LLM-SAFECONTROL-PROFILE-0.1
version: 0.1.0
status: living-draft
last_updated: 2026-04-17T00:00:00+09:00
canonical: https://docs.c3-anchor.jp/spec/llm-safecontrol-profile