OpenAI が o3 および o3 Mini を発表: 人工知能における高度な推論のための新しいモデル


-1
2024-12-23T16:03:53+01:00

最終更新: 23/12/2024

OpenAI人工知能分野の先駆的企業である同社が、最新の進歩であるモデルを発表しました。 o3 と o3 ミニ。これらの新しいソリューションは、高度な推論を必要とするタスクに対処するために特別に設計されており、o1 などの前世代のモデルと比較して大幅な進歩が期待できます。これらはまだ一般公開されていませんが、テクノロジー コミュニティではすでに興奮を引き起こしています。

推論モデルは最初のリリース以来、精度と詳細な分析が必要なアプリケーションにおいて重要なツールであることが証明されています。 OpenAI は、o3 と o3 Mini により、この分野でのリーダーシップを強化し、パフォーマンスと使用の柔軟性の両方で大幅な向上を目指しています。

新モデルのハイライト

o3 のハイライトの XNUMX つは、次の機能です。 複雑な問題を小さなステップに分割して解決する。 「思考連鎖」として知られるこのプロセスにより、モデルは最終的な答えを提供する前に各段階を分析できます。これにより、精度が向上するだけでなく、推論の詳細な説明も保証されます。 教育、高度なプログラミング、科学分析などの分野.

これまでに実施されたテストでは、素晴らしい結果が得られました。たとえば、ベンチマークでは SWEベンチ検証済み, o3 は、前世代の o22,8 と比較して 1% の向上を達成し、精度レベルは 84,9% に達しました。別の注目すべきテストでは、 2024 年アメリカ数学招待試験, o3 は 96,7% を獲得し、不合格は XNUMX 問だけでした。

さらに、最適化された軽量バージョンである o3 Mini は、コンピューティング能力が低い特定のアプリケーションやデバイス向けに設計されています。どちらのモデルも独自の機能の恩恵を受けています。ユーザーは、 「推理の時間」 低、中、高の間。これにより、状況に応じて速度または精度を優先することが可能になり、以前のモデルと比較して大幅に進歩しました。

汎用人工知能への戦略的一歩

OpenAI は、ブランドの重要性とその市場への影響を見逃していません。同社によれば、英国の通信会社O2との法的抵触の可能性を避けるため、「o2」という名前を省略することにしたという。この動きは興味深いものではあるが、サム・アルトマン率いる同社の細部へのこだわりを反映している。

新しいモデルは技術的な改善を超えて、 汎用人工知能 (AGI)。のようなテストでは ARC-AGI人間と同様の認知能力を測定するように設計された o3 は、前世代をはるかに上回る 87,5% のスコアを獲得しました。

入手可能性と早期アクセス

モデルはまだ一般公開の準備ができていませんが、OpenAI は o3 Mini のテストに興味のあるセキュリティ研究者向けの待機リストを開設しました。このモデルは 2025 年初頭に発売され、その後、o3 が同年後半に発売される予定です。同社は、どちらもサブスクリプションで利用できると約束しているが、具体的な詳細はまだ明らかにされていない。

この段階的なアプローチにより、OpenAI は広範なテストを実行して、高度な人工知能の開発における基本的な側面であるモデルの安全性と効率性を確保できます。

競争市場: OpenAI 対 Google

o3 および o3 Mini モデルの発売は、AI 分野での熾烈な競争の最中に行われました。 Google も最近、Gemini 2.0 Flash で「思考モード」を開始しました。これは、AI モデルの論理的推論の向上を目指すテクノロジーでもあります。ただし、OpenAI は、競合他社のより汎用性の高いモデルとは異なり、より段階的で専門化に重点を置いたアプローチに傾いているようです。

両社は人工知能で可能なことの限界を押し広げており、この分野の将来が技術の進歩と実装戦略の両方に依存していることを明らかにしています。

o3 モデルと o3 Mini モデルは、より正確で信頼性が高く、特化された人工知能の探求における大きな進歩を表しています。構造化ロジックを使用して複雑な問題に対処するその能力は、科学、専門、教育への応用に新たな可能性をもたらし、高度な推論技術の開発の前後を特徴づけます。