Project Genie: Google DeepMindの世界生成器の仕組み


科学技術
2026-01-30T11:02:59+01:00

最終更新日: 2026年01月30日
  • Project Genie を使用すると、Genie 3 モデルやその他の Google AI によってサポートされるテキストや画像からインタラクティブな 3D ワールドを作成できます。
  • アクセスは米国の Google AI Ultra 加入者に限定されており、セッションは 60 秒、解像度は 720p 近くになります。
  • 世界は動的かつリミックス可能ですが、フレーム レートが低く、遅延や物理的な不具合が発生し、結果に一貫性がなくなります。
  • Project Genie は、世界モデルと AGI をめぐる競争の一部であり、将来的にはヨーロッパのビデオ ゲーム、教育、シミュレーションにも影響を与えるでしょう。

プロジェクト・ジーニー

Google DeepMindは限定的に公開し始めた。 へのアクセス プロジェクト・ジーニー研究プロトタイプにより インタラクティブな仮想世界を生成する 自然言語による説明や画像に基づいて、より正確な翻訳を実現します。現在、プラン加入者のみお試しいただけます。 Google AI ウルトラ しかし、同社はすでに、時間をかけてより多くの地域に展開を拡大していく意向を示唆しており、ヨーロッパの開発者やスタジオはこれを非常に注意深く見守ることになるだろう。

Genieは完成品ではなく、Googleが人々がどのようにこれらを使用するかを観察したい生きた実験室として提示されている。 世界モデルこの技術がビデオゲーム、シミュレーション、トレーニング、そして新しい形態のインタラクティブコンテンツの基盤としてどの程度活用できるかを、データを収集し、測定することを目的としています。現状の限界はあるものの、この技術がどこまで発展していくのか、その可能性を垣間見ることができます。 3D環境に適用された生成AI 今後数年間で。

Project Genie とは何ですか? 他のものと何が違うのですか?

本質的には、 プロジェクト・ジーニー これは、テキストや画像を取得して、 プレイ可能なシナリオ わずか数秒で。このツールはGoogleの人工知能モデルを複数組み合わせて、 ワールドモデル ジーニー3、画像ジェネレータ ナノバナナプロ そして マルチモーダルモデル ジェミニアイデアから制御可能なキャラクターを備えたナビゲーション可能な世界へと連鎖的に進み、作業を進めます。

ユーザーは「ワールドスケッチ」から始め、どのような環境を作りたいか、どのようなキャラクターや視点が欲しいか(歩く、飛ぶ、運転する、馬に乗る、一人称視点、三人称視点など)を言葉で記述します。そのスクリプトから、Nano Banana Proは ステージのプレビュー画像 次のステップに進む前に、これを微調整して、Genie 3 を使用してインタラクティブな 3D 空間に変換することができます。

重要なのは、モデルが静的なセットを作成するだけでなく、 フレームごとの環境ダイナミクスこれは、あらかじめ定義されたシーンをレンダリングする従来のグラフィックエンジンではなく、プレイヤーの行動に基づいて次のフレームを計算する「予測エンジン」として機能します。これにより、ゲーム世界のルールを臨機応変に変化させることができますが、現状ではこの約束は、視覚的および物理的な矛盾を伴っています。

この初期段階では、Genieは 創造的な探求 洗練されたゲーム体験を提供することよりも、プログラミングの知識がないユーザーでも「チョコレートの川に浮かぶマシュマロの雲の城」といったフレーズから、非常に短時間でプレイ可能な世界を構築できることを実証することこそが、このゲームの価値なのです。

ワールド生成の仕組みを段階的に解説

使用フロー プロジェクト・ジーニー 少なくとも紙面上では、比較的簡単に設計されています。すべては、システムが作成したい世界と主人公の役割について尋ねる簡単なフォームから始まります。そこからAI自身がモデルを連鎖させていきます。

  • 1. 世界をスケッチするユーザーは環境(「夜の未来都市」、「浮遊する火山島」、「巨大な波とサーファーがいる海」)を説明し、アバターのタイプと探索方法を定義します。
  • 2. 画像生成: ナノバナナプロ シナリオを表す静的な画像を作成し、それを変更(色、構成、スタイル)して結果を改良することができます。
  • 3. プレイ可能な世界の作成そのイメージを基にして、 ジーニー3 ゲーム中にカメラを調整しながら、移動、ジャンプ、飛行などのアクションを実行できるインタラクティブな環境を作成します。
  • 4. 探索と記録ユーザーは 最大60秒のセッション 世界を旅します。最後には、旅の様子を収めたビデオをダウンロードできます。
  • 5. リミックスとギャラリー:彼らはできる 既存の世界をリミックスする自分の作品や他のユーザーの作品も含め、ギャラリーの厳選されたセレクションから新しいバリエーションを作成することもできます。

テキストプロンプトに加えて、 ジーニーは認める出発点としての実際の写真例えば、雪山のスナップショットから、機敏な登山家が描かれた高高度マップを生成したり、ヨーロッパの街路の写真をビデオゲームのような美学を持つ探索可能な環境に変換したりすることができます。しかし、 結果が必ずしも期待通りの精度を維持するとは限りません。 オリジナル画像付き。

現在の経験は、 いくつかの技術的制限世界は 720pに近い解像度フレームレートは1秒あたり20~24フレーム そして 顕著な入力遅延これにより、キャラクターの操作がややぎこちなく感じられます。これは偶然ではありません。セッションごとにユーザー用にチップが1つ確保され、 Google は、より多くの人々に同時アクセスを許可するための時間制限を設けています。 コンピューティングコストを増やすことなく。

ディープマインドは、これはプロトタイプであり、その動作は不安定になる可能性があると主張している。 いくつかの世界は比較的首尾一貫しておりプレイ可能ですが、他の世界ではシステムが奇妙なシナリオを生成します。地形の急激な変化や不自然なアニメーション。それでもなお、研究者たちは、現在の技術では他には実現できない何かの「閃光」について語っている。

最初のテスト:創造性、ラグ、そして古典のクローン

ジャーナリストとコンテンツ制作者によって行われたテストでは、 創造力 プロジェクト・ジーニーの長所と短所が強調された。Googleが主催したデモでは、 チョコレートの川に浮かぶマシュマロでできた雲のお城また、変形可能な雪や、大きなターコイズブルーの波が立つ荒れた海など、よりリアルな環境も用意されています。

一方、一部の記者は、この制度をより繊細な領域に押し込もうとしている。例えば、 象徴的なビデオゲーム綿密に練られた描写によって、次のようなタイトルから明らかにインスピレーションを得た世界が創造されている。 スーパーマリオ64, メトロイドプライム o ゼルダの伝説 ブレス オブ ザ ワイルド視覚的なスタイルだけでなく、特定の要素も思い起こさせる ゲームの仕組みゼルダのようなシナリオの場合、キャラクターはジャンプ時に一種のパラグライダーを展開し、 これは、モデルがゲームプレイ動画から非常に特殊なパターンを学習したことを示しています。 ウェブ上で入手可能です。

El 問題は、経験が最初の「わあ!」という効果を超えて、 まだ固まるには程遠い60 秒のセッション制限によりゲームが短くなり、フレーム レートが低いため流動性に影響し、コントロールの遅延により商用ゲームに慣れている人にとってはキャラクターの制御がイライラするものになります。

このタイプのモデルに典型的な現象も現れます。 突然草地に変わる道理由もなく消えてしまう筆致や、現実味のある物理法則を無視して壁や物体をすり抜けていくキャラクターなど。こうした点から、GenieはまだUnityやUnrealのようなエンジンの代替にはなっていないという見方が強まっている。 「純粋なAIエンジン」がどのように機能するかについての高レベルの実験.

それでも、多くのクリエイティブチームにとって、これらの世界で何時間も遊ぶことよりも、 アイデアをほぼ瞬時にテスト、特定のプロンプトで AI がどのような環境を生成するかを確認し、そこからより大きなプロジェクトの設計を再考します。

知的財産、セキュリティ、コンテンツ管理

既存のフランチャイズを彷彿とさせる世界を創造する可能性は、 知的財産初期のテストでは、Project Genie によって、特定の有名なサーガに非常によく似たシナリオを大きな障害なく作成することができたため、Google は一部の記事の公開直前に制限を厳しくしました。

特に、同社は「マリオ」のような保護された名前に関連付けられた世界の作成をブロックし、特定の用語や明示的な言及の導入を直接阻止するフィルターを実装しました。また、ユーザーがキャラクターの外見やブランドの要素のみを説明する場合、システムは名前を挙げることなくそれらの世界を想起させる世界を生成するため、 自動モデレーション 複雑な地形になるでしょう。

ディープマインドは、いくつかのアクティブな セキュリティ対策 これらの対策は、不適切なコンテンツや第三者の権利を侵害する可能性のあるコンテンツを抑制することを目的としています。同社は既に、生成モデルの使用に関するディズニーからの差し止め命令など、正式な警告を受けることに慣れており、システムの動作を微調整する間は、慎重な対応を心がけています。

膨大な公開データで訓練されたモデルと、エンドユーザーへのアクセス(限定的ではあるものの)の組み合わせは、特に新たなAI規制の枠組みにおいて、欧州で既に対処されている問題を引き起こします。Project Genieがより多くの地域に展開されるにつれて、これらの課題にどのように適応していくかを見守ることが重要になります。 欧州の法的要件 透明性、著作権、生成されたコンテンツの管理について。

スペインや他の EU 諸国のクリエイティブ分野の開発者や企業にとって、この初期段階は観察の場として役立ちます。Google がどのようにモデレーションに取り組んでいるかに注目し、これらのツールがより広く利用可能になったときに知的財産を尊重するビジネス モデルについて今から考え始めることができます。

世界のモデルとAGIへのキャリア

娯楽目的以外にも、プロジェクト・ジーニーは Googleディープマインド いわゆる 世界モデル世界モデルは、多くの研究者がより汎用的な人工知能への道筋において不可欠であると考える要素です。孤立した画像や動画を生成するだけの他のシステムとは異なり、世界モデルは… 内部的に環境を表現する そして、その中で実行されるアクションに基づいて、それがどのように進化するかを予測します。

DeepMindは、チェスや囲碁といった特定のゲームをマスターしたAIエージェントの長い歴史を持っていますが、それらの環境は非常に閉鎖的で、完全に定義されています。汎用AIにとっての課題は、曖昧なルールと予測不可能な要素を含む多様なコンテキストを管理することであり、これは現実世界の仕組みに非常に近いものです。

Genie 3では、Googleは単一のモデルで処理できることを実証しようとしている。 複数の種類のシナリオ幻想的な風景からよりリアルなシミュレーションまで、一貫した動き、インタラクション、そして物理特性を生み出します。理論上は、この種の技術はロボット工学、複雑な空間でのナビゲーション、高度なアニメーション、あるいはデジタルで再現された史跡の探索などに応用できる可能性があります。

プロジェクト・ジーニーのリリースは、 競争の激化 この分野では、フェイフェイ・リー氏が率いるMarble製品を持つWorld Labs、ジェネレーティブビデオのスタートアップRunway、そしてヤン・ルカン氏の新プロジェクトAMI Labsといった企業や研究所が、独自の世界モデルを開発しています。今後数年間で、様々なプレイヤーが最高のシミュレーションを提供するために競い合うエコシステムが形成され、ヨーロッパのエンターテインメントおよび産業セクターに直接的な影響を与える可能性が非常に高いでしょう。

欧州の大学、研究センター、テクノロジー企業にとって、このシナリオは協力と規制の機会を開くものであり、EUが科学的観点からも規制の観点からも独自の発言権を持ちたい分野である。

ヨーロッパの開発者とスタートアップにとっての機会と課題

公式アクセスは プロジェクト・ジーニー 現在、米国のGoogle AI Ultra加入者と18歳以上に限定されており、その開発は ビデオゲーム、教育テクノロジー、シミュレーションのスタートアップ スペインおよびヨーロッパの他の地域でも同様です。理由は簡単です。プレイ可能なプロトタイプやテストシナリオを数秒で生成できるツールは、従来のプロセスに比べて大幅な短縮となるからです。

小規模なチームでは、このタイプのプラットフォームを使用して ゲームの仕組みを検証する様々なビジュアルスタイルを試したり、投資家やパートナー向けの簡単なデモを作成したりすることで、制作にかかる時間とコストを削減できます。企業研修や教育などの分野では、 カスタマイズされた没入型環境 多額の予算をかけずに、複雑な概念を説明したり、手順を練習したり、危険な状況をシミュレートしたりできます。

しかし、この好機にはいくつかの課題が伴います。まず、 生成された世界の質と安定性は、まだ必要なレベルには程遠い。 商業的に打ち上げるには、本格的なプロジェクトではこれらのモデルを組み合わせる必要がある。 より成熟した技術一方、トレーニング データの出所、結果として得られるコンテンツに対する権利、EU における法的義務に関する議論により、複雑さがさらに増しています。 欧州企業が無視できない複雑さ.

今後数年間を見据えると、ヨーロッパのエコシステムにとって最も賢明なのは、 開発の監視 Project Genieは、他の地域への展開時にパイロットプログラムに参加し、これらのモデルを責任を持って統合するためにテクノロジーパートナーとのパートナーシップを模索することを提案しています。アクセス拡大時に優位な立場に立つことが、準備が万端か遅れをとるかの違いを生む可能性があります。

これまでに見てきたものすべてを踏まえると、Project Genieは生成AIとインタラクティブな世界の交差点における最も印象的な実験の一つとして際立っています。これはまだ発展途上のシステムであり、遅延、厳しい制限、予測不可能な結果がありますが、デジタル環境の作成と探索の異なる方法を示しており、遅かれ早かれビデオゲーム、シミュレーション、そして 没入型体験 スペインやその他のヨーロッパ諸国からも来ています。