Living Draftv0.1.0

LLM SafeControl Profile

Time Layer Configuration

Verify ID
C3-SPEC-LLM-SAFECONTROL-PROFILE-0.1
Version
0.1.0
Status
● Current
Valid From
2026-04-17

生成AIの出力・外部作用・公開前審査を、HOLD / ESCALATE / FREEZE と公開・監査・復帰条件つきで扱う外付け安全制御プロファイル。

このページは、LLMそのものの能力競争ではなく、社会に出る前の出力・実行・公開を止まれる形へ近づけるための公開正本です。

LLM SafeControl Profile v0.1 は、生成AIの出力・外付け実行・公開前審査を、HOLD / ESCALATE / FREEZE と公開・監査・復帰条件つきで扱う外付け安全制御層の公開仕様です。基盤モデルそのものの内部を書き換えるものではなく、出力が社会に出る前の統治面を記述します。版管理・証跡・検証導線を整えた Living Draft / Public Original として公開します。内容の真実保証・完全な抽出防止・モデル内部の安全保証は対象外です。

本ページは Living Draft / Public Original v0.1 です。

本番運用、正確性保証、真実保証、投資収益、完全な抽出防止、モデル内部の安全保証を意味しません。

これは基盤モデルそのものではなく、外付けの安全制御層を記述する公開仕様です。

What it is

  • 生成AIの出力・外付け実行・公開前審査を扱う外付けの安全制御層の仕様
  • HOLD / ESCALATE / FREEZE / SHRINK と公開・監査・復帰条件つきで出力統治を記述する公開正本
  • AIガバナンスの公開知識面(/ai-governance)に接続する技術本体
  • 版管理・証跡・Verify導線を整えた Living Draft / Public Original v0.1
  • 社会に出る前の出力・実行・公開を「止まれる形」へ近づけるための設計参照面

What it is not

基盤モデルそのものの能力・内部構造を変更するものではありません
完全な抽出防止・ハルシネーション完全排除・モデル内部の安全保証を意味しません
本番自動公開・本番自動承認を前提とした設計ではありません
内容の真実保証・投資収益・排他権・仕様決定権を主張するものではありません
特定ベンダーのモデルや製品を推奨・評価するものではありません
法務判断の代替ではありません。法務レビューが必要な状態を検知して渡す導線として機能します

Why now

生成AIの外付け安全制御層の公開仕様を今整える理由を以下に示します。

  • 生成AIの外部作用(API実行・コード生成・公開文書生成)が拡大し、出力だけでなく実行・公開前の統治面が空白になっている
  • 「モデルが安全かどうか」の評価はモデルベンダーに依存するが、「出力を社会に出す前に止める・記録する・説明する」層は組織側が整える必要がある
  • HOLD / ESCALATE / FREEZE を語彙として共有しないと、組織横断の審査・引き継ぎ・監査が属人的になる
  • reason_code による判定記録がないと、なぜ止めたか・なぜ通したかを後から説明できない
  • Two-Rail 構造では公開レールと保護レールの接続条件を定義するが、その接続判断を行う制御層の語彙が未定義だった

Scope

この仕様が扱う範囲を以下に示します。

出力ゲート:生成AIの出力が送信・公開・実行される前の審査ポイント

実行ゲート:外付けツール呼び出し・コード実行・API送信の前の審査ポイント

公開ゲート:ドキュメント・UI・外部配信の公開前審査ポイント

判定語彙:PASS / HOLD / ESCALATE / FREEZE / SHRINK の5状態

記録構造:reason_code による判定理由の識別子記録

復帰条件:HOLD / FREEZE から PASS へ移行する条件と手続き

Two-Rail 接続条件:公開レールに出力が移る前の境界定義

Non-goals

この仕様が明示的に対象外とする事項を以下に示します。

基盤モデルのウェイト・内部アーキテクチャの変更は対象外です
完全な抽出防止・知識蒸留防止はこの仕様の対象外です
リアルタイムのコンテンツモデレーション(ストリーミング中の割り込み)は対象外です
モデルの能力評価・ベンチマーク比較は対象外です
個人情報保護・プライバシー法の法的要件の定義は対象外です(法務ESCALATEで渡す)
本番インフラの自動デプロイ・自動承認は対象外です

Core actions

このプロファイルで定義する5つの判定アクションです。PASS / HOLD / ESCALATE / FREEZE / SHRINK はC³の固有語彙であり、他の意味に転用しません。

PASS通過

出力・実行・公開の条件を満たし、次の工程へ進める状態。根拠・導線・非目標の明示が揃っている。PASS は永続的な承認ではなく、この版・この時点での通過を示す。

HOLD保留

根拠・導線・非目標の明示が不足している状態。送信・公開・断定の前で止まる。存在否定ではない。修正・補足の後に再審査できる。reason_code で保留理由を記録する。

ESCALATE上申

法務確認・倫理審査・上位判断が必要な状態。自動審査の範囲を超える。担当者・部門・外部レビュアーへの引き渡しを記録する。ESCALATE 後の判断は人間が行う。

FREEZE停止

安全のために強制停止する状態。出力・実行・公開を即時中断する。FREEZE は強制力のある停止語彙。復帰には明示的な解除手続きと記録が必要。

SHRINK縮小

出力・実行・公開の範囲を縮小して継続する状態。全体を止めるほどではないが、特定のスコープを外す・対象を限定する・公開範囲を絞る判断。影響範囲を最小化しながら継続する。

Two-Rail boundary

LLM SafeControl Profile は Two-Rail 構造の境界上に位置します。 公開レールに出力を移す前の制御点として機能します。 公開レールと保護レールにそれぞれ置くべき情報の原則を以下に示します。

公開レール(Public Rail)に置くもの

  • 判定語彙(PASS / HOLD / ESCALATE / FREEZE / SHRINK)の定義と意味
  • reason_code の体系(/spec/reason-codes に接続)
  • 復帰条件の原則(記録・手続き・承認の必要性)
  • Verify / History / Updates 導線

保護レール(Protected Rail)に置くもの

  • 具体的なしきい値・検知パラメータ・判定ロジックの詳細
  • 組織固有の法務・コンプライアンス判定基準
  • 実装中のシステム構成・ベンダー情報
  • 審査プロセスの内部運用詳細

Two-Rail の詳細は /spec/two-rail を参照してください。

Verify / History / Related Pages

Time Layer

StatusLiving DraftPage TypeTechnical Specification / Public OriginalVersion0.1Last Updated2026-04-17Related Pages

Provenance

doc_id: C3-SPEC-LLM-SAFECONTROL-PROFILE-0.1

version: 0.1.0

status: living-draft

last_updated: 2026-04-17T00:00:00+09:00

canonical: https://docs.c3-anchor.jp/spec/llm-safecontrol-profile