ホームテクノロジーGoogleはジェミニディープトンアウトアウトアイ、並行して複数のアイデアをテストする推論モデルです

Googleはジェミニディープトンアウトアウトアイ、並行して複数のアイデアをテストする推論モデルです


Google DeepMindが展開されています Gemini 2.5 Deep Think、同社は、最も高度なAI推論モデルであり、複数のアイデアを同時に調査および検討し、それらの出力を使用して最良の答えを選択することで質問に答えることができると言います。

Googleの月額250ドルの購読者 ウルトラ サブスクリプションは、金曜日からGeminiアプリでGemini 2.5 Deep Thinkにアクセスできます。

Google I/O 2025で5月に最初に発表されたGemini 2.5 Deep Thinkは、Googleの最初の公開されたマルチエージェントモデルです。これらのシステムは、AI複数のエージェントを生成して、単一のエージェントよりもはるかに多くの計算リソースを使用するが、より良い回答をもたらす傾向があるプロセスである並行して質問に取り組むために問題に取り組みます。

GoogleはGemini 2.5 Deep Thinkのバリエーションを使用しました 金メダルを獲得します 今年の国際数学オリンピアード(IMO)。

Gemini 2.5 Deep Thinkに加えて、同社はIMOで使用したモデルを数学者と学者の選択グループにリリースしていると述べています。 Googleは、このAIモデルは、ほとんどの消費者向けAIモデルのように数秒または数分ではなく、「推論に数時間かかる」と言います。同社は、IMOモデルが研究努力を強化し、学術的ユースケースのマルチエージェントシステムを改善する方法に関するフィードバックを得ることを目指していることを望んでいます。

Googleは、Gemini 2.5 Deep ThinkモデルがI/Oで発表したものよりも大幅な改善であると指摘しています。同社はまた、Gemini 2.5のDeepを奨励するために、「新しい強化学習技術」を開発したと主張しています。

「深い考え方は、人々が創造性、戦略的計画、改善を段階的に必要とする問題に取り組むのに役立ちます」と、GoogleはTechCrunchと共有するブログ投稿で述べています。

TechCrunchイベント

サンフランシスコ
|
2025年10月27〜29日

同社は、Gemini 2.5 Deep Thinkが人類の最後の試験(HLE)で最先端のパフォーマンスを達成していると述べています。これは、数千のクラウドソーシングされた質問に数千のクラウドソーシングの質問に答える能力を測定する挑戦的なテストです。 Googleは、25.4%を獲得したXaiのGrok 4と、20.3%を獲得したOpenaiのO3と比較して、そのモデルがHLEで34.8%(ツールなし)で得点したと主張しています。

Googleはまた、Gemini 2.5 Deep Thinkは、競争力のあるコーディングタスクの挑戦的なテストであるLiveCodebench6のOpenai、Xai、および人類のAIモデルよりも優れていると述べています。 Googleのモデルは87.6%を獲得しましたが、Grok 4は79%を獲得し、OpenaiのO3は72%を獲得しました。

ベンチマークスコア。画像クレジット:Google

Gemini 2.5 Deep Thinkは、コード実行やGoogle検索などのツールで自動的に動作します。同社は、従来のAIモデルよりも「はるかに長い応答」を作成できると述べています。

Googleのテストでは、モデルは、他のAIモデルと比較して、より詳細で審美的に心地よいWeb開発タスクを作成しました。同社は、モデルが研究者を支援し、「発見への道を潜在的に加速する可能性がある」と主張している。

GoogleのAIが作成したアートシーン(クレジット:Google)

いくつかの主要なAIラボがマルチエージェントアプローチを中心に収束しているようです。

Elon Musk’s Xaiは最近、独自のマルチエージェントシステムをリリースしました。 グローク4ヘビー、それは、いくつかのベンチマークで業界をリードするパフォーマンスを達成することができたと言います。 Openaiの研究者であるNoam Brownは、 ポッドキャスト 同社が今年の国際数学オリンピアード(IMO)で金メダルを獲得するために使用した未発表のAIモデルもマルチエージェントシステムでした。その間、 人類の研究エージェント、徹底的な研究ブリーフを生成することは、マルチエージェントシステムも搭載されています。

強力なパフォーマンスにもかかわらず、マルチエージェントシステムは、従来のAIモデルよりもサービスがさらに費用がかかるようです。つまり、ハイテク企業はこれらのシステムを最も高価なサブスクリプションプランの背後に格納する可能性があります。

今後数週間で、GoogleはGemini 2.5 Deep ThinkをGemini APIを介して選択したグループのグループと共有する予定だと言います。同社は、開発者と企業がマルチエージェントシステムを使用する方法をよりよく理解したいと考えています。

関連記事

最も人気のある