- GPT-4o は、ChatGPT の DALL-E に代わって、ネイティブに画像を生成するようになりました。
- 画像内のテキストと複数のオブジェクトを生成する際の精度と視覚的な一貫性が向上しました。
- 有料会員と無料会員の両方が利用可能で、将来的には他のサービスにも拡張される予定です。
- セキュリティ対策と著作権の尊重、現存するアーティストの模倣の回避。
OpenAIは、生成型人工知能の進化において、 GPT-4oを使用してChatGPTで直接画像を生成する。この変化は、 DALL-Eモデルをベースにした以前のバージョンと比較して大幅な進歩を遂げ、 よりスムーズで一貫したユーザーエクスペリエンスを実現します。この統合の詳細については、次の記事をご覧ください。 DALL-E 3で画像を作成する方法.
新機能 Plus、Pro、Teamプランの加入者向けに提供開始、また、生成できる画像の数に若干の制限がある無料ユーザー向けもあります。まもなく、API と ChatGPT Edu 教育サービスを通じて開発者に公開される予定です。
より高い精度を追求するモデル
GPT-4oは、 より正確で詳細な画像を生成するテキストのレンダリングの質が悪かったり、シーン内でオブジェクトを首尾一貫して配置するのが難しかったりといった、これまでの制限を克服しました。ご興味のある方は ChatGPT 4を無料で使用するこの新しいバージョンは、画像生成における顕著な進歩を表しています。
DALL-Eで使用された拡散技術を放棄し、自己回帰アプローチを採用することにより、 今作成された画像は、より大きな構造的論理を持っている。つまり、ポスターやビジュアルドキュメント上で、特定の位置に複数のオブジェクトを配置し、読みやすいテキストを含むイラストを生成することが可能です。
主なアプリケーションと機能強化
ChatGPT の新世代の画像は、次のようなさまざまな実用的な用途を可能にします。
- DISEÑOGRAFICOバナー、ポスター、適応型ビジュアルコンテンツの作成。
- 学歴: さまざまな形式のインフォグラフィック、図表、説明図。
- デジタルマーケティング: ソーシャル メディアやオンライン キャンペーン向けのコンテンツ生成。
- ビデオゲーム開発: 登場人物と設定の概念化。
さらに、この技術を現場に統合することで チャットボットの 成長を続け、より多くのユーザーがこれらの革新的な機能の恩恵を受けることができるようになります。
安全対策と制限
法的および倫理的な衝突を避けるために、OpenAIは 現存する芸術家のスタイルを直接模倣することを禁止する厳格な方針。さらに、生成されたすべての画像には、その出所を証明し、誤報を防ぐための C2PA メタデータが含まれています。さらに同社は 不適切なコンテンツの作成を検出しブロックするためのモデレーションを強化しました露骨な暴力や詐欺的な操作を描写した画像など。
この新たな進歩により、 OpenAIは生成型人工知能におけるリーダーシップを強化ユーザーのニーズに適応し、市場の需要に応えて より正確でアクセスしやすいソリューション.