- SynthID は、AI によって生成されたコンテンツを識別できるように、テキスト、画像、音声、ビデオに目に見えない透かしを埋め込みます。
- テキストでは、キーと n-gram を備えたロジット プロセッサとして機能し、しきい値によってベイズ検出を設定できます。
- この実装は Transformers 4.46.0 以降で利用可能で、GitHub に公式のスペースとリファレンスが用意されています。
- 制限(短いテキスト、翻訳、書き直し)はありますが、透明性と追跡可能性が強化されます。
生成AIの出現により、画像、テキスト、音声、動画の生産がこれまでにない規模で増加し、それに伴い、それらの起源に関する疑問が高まっています。 コンテンツがモデルによって作成または変更されたかどうかを識別する デジタル信頼の鍵となります。 シンセID 素晴らしい解決策になる可能性があります。
これはGoogle DeepMindの提案であり、 「目に見えない」透かし技術のファミリー これらは AI 生成コンテンツに直接埋め込まれ、人間が認識する品質を低下させることなく、その後の検証を容易にします。
SynthID とは何ですか? また、その目的は何ですか?
GoogleはSynthIDを次のようなツールとして説明している。 AI生成コンテンツ用の特定の透かし透明性とトレーサビリティを促進するために設計されています。単一のフォーマットに限定されず、画像、音声、テキスト、動画を網羅しているため、単一の技術的アプローチをさまざまな種類のメディアに適用できます。
Google エコシステムでは、すでにいくつかの方法で使用されています。
- 本文中フラグは Gemini 応答に適用されます。
- 音声では、Lyria モデルや、Notebook LM のテキストからポッドキャストを作成する機能などで使用されます。
- Enビデオは、1080p でクリップを生成できるモデルである Veo Creations に統合されています。
いずれの場合も、 透かし それは目に見えないもので、 頻繁な変更に耐える 品質を低下させることなく、圧縮、オーディオまたはビデオカットのリズム変更などを実現します。
技術面以外では、その実際的な目的は明らかです。 合成材料とAIなしで生成された材料を区別するのに役立ちますこれにより、ユーザー、メディア、機関はコンテンツの消費と配信について十分な情報に基づいた決定を下すことができるようになります。
テキスト透かし(SynthID Text)の仕組み
実際には、SynthID Textは ロジットプロセッサ これは、通常のサンプリングフィルタ(Top-KとTop-P)の後に言語モデル生成パイプラインにフックされます。このプロセッサは、モデルのスコアを微調整します。 擬似乱数関数 gテキストのスタイルや品質に目に見えるアーティファクトを導入することなく、確率のパターンで情報をエンコードします。
その結果、一見すると、 品質、精度、流動性ただし、訓練された検証者によって検出可能な統計構造が組み込まれています。
透かし入りのテキストを生成するために、 モデルを再トレーニングする: メソッドに設定を提供するだけです .generate() SynthID Textのロジットプロセッサを有効化します。これにより導入が簡素化され、既に導入済みのモデルを使ったテストが可能になります。
透かし設定には、次の 2 つの重要なパラメータが含まれます。 keys y ngram_len. 鍵 g関数を用いて語彙をスコアリングするために用いられる、一意のランダムな整数のリストです。このリストの長さによって、透かしの「層」がいくつ適用されるかが決まります。一方、 ngram_len 検出可能性と変換に対する堅牢性のバランスを設定します。値が高いほど検出が容易になりますが、シールは変更に対して脆弱になります。開始点としては値 5 が適切です。
さらに、SynthID Textは サンプリングテーブル 2 つのプロパティがあります。 sampling_table_size y sampling_table_seed関数gがサンプリング時に安定して偏りのない動作をすることを保証するために、少なくとも2^16のサイズが推奨されます。 サイズが大きいほどメモリが多くなります 推論中に、シードは任意の整数にすることができ、評価環境における再現性を高めます。
信号を改善するには重要なニュアンスがあります。 繰り返しnグラム 文脈の最近の歴史の中で(定義される context_history_size)はマークされません。これにより、テキストの残りの部分でマークが検出されやすくなり、言語の自然な繰り返しに関連する誤検出が減少します。
セキュリティのため、各透かしの設定(キー、シード、パラメータを含む) 非公開で保管する必要があるこれらのキーが漏洩した場合、第三者がブランドを簡単に複製したり、さらに悪いことに、その構造を完全に把握した上でブランドを操作しようとする可能性があります。
検出方法: 閾値を用いた確率的検証
テキスト内の透かしの検証はバイナリではなく、 確率的Google は、Transformers と GitHub の両方でベイズ検出器を公開しています。この検出器は、テキストの統計パターンを分析した後、次の 3 つの状態を返します。 ブランド, ブランドなし o 不確かこの 3 値出力により、さまざまなリスクおよびエラー許容度のコンテキストに合わせて操作を調整できます。
検証者の動作は、 2つの閾値 偽陽性と偽陰性の割合を制御する機能です。つまり、ユースケースに応じて、検出の厳しさを調整し、精度を優先するか、逆に精度を優先するかを決めることができます。これは特に、 編集環境、モデレーション または内部監査。
複数のモデルが同じ トークナイザー、共有することもできます 同じブランドの構成と同じ検出器検証者のトレーニングセットにそれらすべての例が含まれている限り、複数のLLMを持つ組織で「共通のウォーターマーク」を構築しやすくなります。
検出器がトレーニングされると、組織は露出レベルを決定できます。 完全にプライベート、それをある方法で提供する セミプライベート APIを通じて、あるいは 公共 第三者によるダウンロードおよび使用。選択は、各組織のインフラ運用能力、規制リスク、透明性戦略によって異なります。
画像、音声、動画の透かし
このブランドは長持ちするように設計されている 一般的な変換 メタデータを保持することなく、トリミング、サイズ変更、回転、色の変更、さらにはスクリーンショットなど、様々な編集作業を行うことができます。当初は、 Vertex AIの画像ユーザーはコンテンツを生成する際に透かしを有効にするかどうかを選択できます。
オーディオでは、このブランドは 聞こえない MP3圧縮、ノイズの追加、再生速度の変更といった一般的な操作もサポートしています。Googleはこれを リリア また、ノートブック LM ベースの機能では、ファイルが損失の多い公開ストリームを通過する場合でも信号を増幅します。
ビデオでは、このアプローチはイメージアプローチを再現します。ブランドは、 各フレームのピクセルフィルター、リフレッシュレートの変更、圧縮などに対しても安定しています。 カット. 動画作成者 なるほど VideoFX などのツールは、作成時にこのマークを組み込むため、後続の編集で誤って削除されるリスクが軽減されます。
テキストシールのサンプリングアルゴリズムと堅牢性
SynthID Textの核心は サンプリングアルゴリズムは、キー(またはキーのセット)を用いて、各潜在トークンに疑似ランダムスコアを割り当てます。候補はモデルの分布から(Top-K/Top-Pの後)抽出され、排除ラウンドを経て「競争」にかけられ、関数gに従って最高スコアのトークンが選ばれるまで続きます。
この選択手順は、 最終的な統計パターン 確率はブランドの特徴を帯びているが、不自然な選択肢を強制することはない。発表された研究によると、この手法は 消去、改ざん、または元に戻す 時間とやる気のある相手に対して、常に合理的な範囲内で封印します。
適切な実装とセキュリティ対策
- SynthID Textを展開する場合は、構成を次のように扱います。 製造秘密: 鍵とシードを安全なマネージャーに保存し、アクセス制御を適用し、定期的なローテーションを可能にします。漏洩を防ぐことで、リバースエンジニアリングに対する攻撃対象領域が縮小されます。
- 計画を設計する 監視 検出器向け: 偽陽性/偽陰性率を記録し、状況に応じてしきい値を調整し、検出ポリシーを決定します。 暴露 明確な法的および運用基準に基づき、プライベート、API経由のセミプライベート、またはパブリックのモデルを選定します。複数のモデルがトークナイザーを共有する場合は、 共通検出器 メンテナンスを簡素化するために、すべての例を示します。
- パフォーマンスレベルでは、
sampling_table_sizeメモリとレイテンシを考慮して、ngram_len編集に対する許容度と信頼性の高い検出の必要性のバランスをとる。重複したn-gramを除外することを忘れないでください(context_history_size) を使用すると、流れるテキスト内の信号が改善されます。
SynthIDは誤情報に対する特効薬ではありませんが、 生成 AI 時代の信頼チェーンを再構築するための基本的な構成要素を提供します。 Google DeepMind は、テキスト、画像、音声、動画に由来のシグナルを埋め込み、テキスト コンポーネントをコミュニティに公開することで、実用的かつ測定可能で、何よりもコンテンツの創造性と品質と互換性のある方法で真正性を監査できる未来を目指しています。