Google DeepMind人工知能 (AI) 研究のリーダーである Genie 2 は、インタラクティブな 3D 世界の生成に革命をもたらす革新的なモデルである Genie XNUMX を発売しました。このツールは、 世界の基本モデル、を変換することができます。 シンプルなイメージ のテキスト説明の横にある 完全にプレイ可能な 3 次元環境.
Genie 2: 従来を超えた
ジニー2 視覚的に魅力的な環境を生成するだけでなく、これらの世界は ダイナミックでインタラクティブな。たとえば、次のようなアクションを実行できます。 ジャンプする, 泳ぐ o オブジェクトを移動する, すべてキーボードとマウスを使用します。シナリオには、オブジェクトの相互作用、高度な物理学、リアルな照明と反射、マーキングなどの要素を含めることができます。 大幅なジャンプ Genie 1 などの以前のテクノロジーと比較して。
最も注目に値するイノベーションの中で、Genie 2 には以下の機能が備わっています。 一貫性を維持する能力 彼らの環境では。これは、ユーザーの視野の外にあるオブジェクトがランダムに消えたり再生したりせず、一定のレベルを維持することを意味します。 リアリズム Decart's Oasis や World Labs プロジェクトなどの従来のモデルの限界を超えています。
それはどのように動作しますか?
DeepMind モデルは、次の方法でトレーニングされました。 豊富なビデオセットを使用すると、画像や説明を解釈するだけでなく、アクションが環境にどのような影響を与えるかを理解することができます。たとえば、「森の中のロボット」のようなコマンドを入力すると、Genie 2 は、 あのロボットが歩ける世界、NPC (非プレイアブル キャラクター) と対話したり、重力やその他の物理的な力を体験したりできます。
このレベルのリアリズムにより、クリエイティブやゲーム開発者にとって魅力的なツールとなるだけでなく、 研究者にとって不可欠なリソース。 Genie 2 を SIMA などの AI エージェントと統合することで、AI エージェントを次のようにトレーニングできます。 多様性に富んだ模擬環境、実際のシナリオでのより複雑な課題に備える。
創造性と研究への貢献
Genie 2 は、AI トレーニングのリソースであるだけでなく、次の分野で新たな可能性を開きます。 ビデオゲーム用のラピッドプロトタイピング。開発者は設計コンセプトを実験し、完全なシナリオを作成できるようになりました。 ほんの数分 数週間や数か月の代わりに。同様に、このテクノロジーは次のような分野に影響を与えることが期待されています。 バーチャルリアリティ と ロボット工学、ロボットが相互作用することを学ぶことができる場所 未知の環境 AIによって生成されます。
ゲーマーにとって、これは未来を垣間見ることができます: 適応するビデオ ゲーム 動的に プレイヤーの好みやスキルレベルに合わせて。環境がリアルタイムで調整されて、 ユニークな体験 遊ぶたびに。
制限と倫理的課題
Genie 2 は印象的な開発ですが、論争がないわけではありません。批評家は、このモデルが以下に関連する問題を引き起こす可能性があると指摘している。 著作権、人気のあるビデオゲームを含む視聴覚データを使用してトレーニングされたためです。ただし、DeepMind は、Genie 2 が直接保存または再生しないことを保証します。 ライセンス素材、これらの法的リスクからあなたを大幅に保護します。
一方で、このモデルには DeepMind が認識している技術的な制限があります。たとえば、生成されたワールドは約 1 年間しかプレイできません。 minuto、これにより、さらに便利になります 研究 y プロトタイピング 長く続いている商用ビデオゲームよりも。
これらの制限にもかかわらず、Genie 2 は、AI がデジタル世界との相互作用をどのように変革できるかという点で大きな飛躍を示し、無限の将来のアプリケーションへの窓を提供します。このツールは、私たちの創作方法だけでなく、想像方法も変えることを約束します。