Nano Bananaが正式にリリースされました: チャット中に使えるGoogleエディタジェネレーター、Gemini 2.5 Flash Image


人工知能
2025-08-28T11:39:54+02:00

最終更新日: 2025年08月28日
  • 「Nano Banana」は、Google の新しい画像生成および編集モデルである Gemini 2.5 Flash Image のコード名です。
  • 会話形式の編集が可能になり、人物とオブジェクト間の一貫性が維持され、画像と自然言語の指示が組み合わせられます。
  • 目に見えない透かしとして SynthID が含まれており、機密コンテンツや公人に対してフィルターが適用されます。
  • Gemini アプリと Google AI Studio で gemini-2.5-flash-image-preview モデルを使用してテストできます。

ナノバナナ

数週間の憶測の後、ニックネーム 「ナノバナナ」謎ではなくなる:対応する Googleの新しい画像エンジンが正式に発表されました ジェミニ2.5 フラッシュイメージ同社は、創作フローの摩擦を減らすことを目指し、生成と編集を会話型のアプローチと組み合わせた機能を導入している。

このモデルは、MidjourneyのようなジェネレータやPhotoshopのような従来のエディタと競合するために登場し、 ショット間の一貫性、機能の保存、そしてGoogleが「電光石火の速さ」と表現する応答速度。さらに、 これは Gemini アプリに統合されており、API および Google AI Studio を通じて利用できます。.

「ナノバナナ」とは何ですか?何を提供しますか?

「ナノバナナ」は、テキストガイドによる編集と高度に制御された生成に重点を置いた進化型モデルの内部名称です。システムは自然な指示を理解し、同じ画像に変更を適用します。毎回最初からやり直す必要はありません。

その主な特徴の一つは 視覚的な一貫性写真を編集すると、被写体の顔、ポーズ、照明はバージョン間で一貫性を保ちます。 歪みや視点のジャンプを軽減します 複雑なシナリオでは他のエンジンでも依然として発生します。

El フォトリアリズムは、よりリアルなテクスチャと照明で一歩前進しましたGoogleは、画像AIにおいて従来は繊細な分野であった顔と手という2つの分野で具体的な進歩を遂げたと主張している。このモデルはまた、 スピードが際立つこれにより、テストと改善のサイクルが短縮されます。

LMアリーナのようなコミュニティベンチマークでは、「ナノバナナ」は トップ評価 ユーザー エクスペリエンス編集において、品質、制御、応答速度のバランスを重視しています。

主な編集および生成機能

  • 会話型編集: 画像と対話し、反復的な調整を要求します (例: 空の強調、車の色の変更、オブジェクトの追加)。
  • 局所的な選択とレタッチ: 特定の領域を選択して、要素を消去したり、背景を変更したり、他の部分に影響を与えずに照明や色を調整したりできます。
  • 作曲と混合: 複数の写真を 1 つのシーンに結合し、1 つの画像のスタイルを別の画像のオブジェクトに適用します。
  • キャラクターの一貫性: 複数の編集にわたって、同じ人物、ペット、またはオブジェクトのバージョン間の類似性を維持します。

創造的な柔軟性に加えて、Googleはセキュリティの層を追加します: 生成または編集されたすべての画像にはSynthIDが組み込まれていますは、変換に抵抗する目に見えない埋め込み透かしであり、コンテンツが AI によって作成または変更されたかどうかを確認できます。

システムには、以下の生成や操作を防ぐためのフィルターが含まれています。 センシティブなコンテンツ (暴力、露骨なヌードなど)をブロックし、有名人の編集をブロックします。ユーザーが実際の写真をアップロードして加工しようとすると、セキュリティメカニズムによってディープフェイクにつながる可能性のあるリクエストを阻止しようとします。

実際には、これは技術的なテストに費やす時間が減り、クリエイティブな成果にもっと集中できることを意味します。 自然言語のコマンドが現場でのアクションになる より正確な意味と、スケール、深さ、スタイルへの尊重をもって。

GeminiアプリとAI StudioでNano Bananaを使用する方法

経験 Geminiインターフェースに統合されています追加のソフトウェアを必要とせずに、多くの場合 あなたもそれを活用できます 無料版地域とアカウントの展開に応じて異なります.

  • Geminiアプリまたはウェブサイト: アクセス gemini.google.com/app (o モバイルアプリ)で、利用可能なテンプレートを選択し、「ツール」の「画像の作成」に進みます。
  • 生成または編集: プロンプトを入力してゼロから作成するか、写真をアップロードして編集します。連鎖的な指示を追加することで、複数のラウンドで結果を微調整できます。
  • 便利な注文「ショットを白黒にする」、「背景からオブジェクトを削除する」、「背景を街並みに変更する」、「この画像のスタイルをこのドレスに適用する」などです。

開発者環境から正しいモデルを使用していることを検証したい場合は、Google AI Studioは制御されたテストのための直接フローを提供します。 gemini 2.5 フラッシュイメージプレビュー.

  • Google AI Studioにログイン.
  • 「gemini-2.5-flash-image-preview」モデルを選択してください セレクターで。
  • テキストプロンプトを入力したり、画像をアップロードしたりして、編集内容をリアルタイムで確認します。マルチシフト編集をサポートします。

動作の一貫性とフォトリアリズムが向上した一方で、 画像内のテキストや特定の複雑な反射の表現はまだ完璧ではないかもしれないそれでも、言語主導の編集と透かしは、創造的な制御と責任の間の興味深いバランスを提供します。

会話編集、文字の一貫性、スピード、SynthIDのような安全策の組み合わせにより、 「Nano Banana」は、マスクやレイヤーを複雑にすることなく写真を調整したりシーンを構成したりしたいクリエイター、ブランド、ユーザーにとって多用途のオプションとして最適です。: すべて Gemini 自体から行われ、元のアイデアに最も適したバージョンが見つかるまで反復を促すフローを備えています。