今年のGoogle I/Oの基調講演は、情報量が膨大で、外部からは要点を掴みきれないほどだった。
Googleは常に中国のAI企業にとって重要なベンチマークであり、学びの対象となってきましたが、今回のI/Oではフラッグシップとなる最先端モデルが欠席し、Agent製品が事実上遅れて登場し「遅れを取り戻す」形となったことなど、一連の要因により、多くのAI関係者が失望し、Googleが一体何をしているのかと疑問を抱いています。
過去2日間、私はDeepMindのCTOであるKoray Kavukcuoglu氏、GoogleのチーフAIサイエンティストであるJeff Dean氏、そしてGoogleのCEOであるSundar Pichai氏を含むGoogleの主要人物たちと交流する機会を得た。これらの第一手情報をもとに、今日のGoogleの状況を理解しようと試みる。
結局のところ、これらすべてはGoogleのDeepMindに対する姿勢に帰着するのだと気づいた。
Googleは、現時点で最も重要なことは何だと考えているのか
明らかに、Google社内全体で現在統一されている最大のコンセンサスは、Googleこそが唯一の真のAIフルスタック企業であるということだ。様々なやり取りの中で、それがGoogleにもたらした自信は、私のすでに高かった予想さえも上回るものでしたが、これはChatGPTが登場した直後のGoogleの当初の狼狽ぶりを連想させずにはいられません——BardやAIインフラ全体の蓄積に対しても同様に自信を持っていたものの、過信が災いして問題が生じたのです。
今後どのような展開になるかは、私の見解では、リソース配分の意思決定が鍵を握る。当初はBardに賭けたが、後に資金と計算リソースをDeepMindに投入したことが正しかったことが証明された。
またしても重要な岐路に立たされている。フルスタックが巨大な競争優位性を意味する以上、今日のGoogle内部におけるリソース配分の決定は、最先端のモデルに最良のリソースを一気に投入するのではなく、「最も実用性の高いモデル」に重点を置くというものだ。
どこか見覚えがある。
したがって、このように見ると、Flashシリーズは妥協案ではなく、戦略的意義が最も重要であり、おそらくより多くの利用可能な計算リソースを割り当てられている。これはOpenAIやAnthropicの戦略とは極めて異なる。
I/Oの基調講演で、あまり注目されなかったデモの一つにおいて、TPU 8i上で実行されたGemini 3.5 Flashのタスクのスループット速度は、かつて「速さ」だけを追求し、他のすべてを顧みなかったGroqを彷彿とさせるほどだった。一方で、新モデルに対するユーザー体験のフィードバックには賛否両論が出始めているが、こう見れば、これはまさにこの優先順位戦略とリソース配分による必然的な結果だと言える。
その理由については、実はGoogleがずっと語ってきたことそのものだ。ピチャイ氏は少人数の交流の場で、需要があまりにも大きく、しかも絶えず増加していると語った。過去のインターネットや携帯電話などの歴史を振り返れば、何をすべきかは明らかだ。ヘビーユーザー以外の最も広範なニーズを迅速に特定し、満たすこと。エージェントのブームと相まって、そこに「最強」ではなく、最も使いやすく最適なモデルを提供することこそが、現時点でのGoogleにとって最も重要な機会であり、最優先事項なのだ。
では、この決定は今後数ヶ月の競争環境にどのような影響を与えるだろうか?
私の感覚では、ピチャイが直面する「世論の風向き」は、これらの決定によって再びしばらくの間、緊張する可能性が高い。
DeepMindの落差
Korayは3年連続で同じTシャツを着て私と話してくれたが、私が彼に投げかけた質問も一貫していた:初年度は、いわゆるネイティブ・マルチモーダルをどのように定義するのかを尋ね、2年目はマルチモーダルの具体的な手法や、なぜVeoがこれほど強力なのかについて、そして今年は、今振り返ってこのコンセンサスとは異なる選択をどう評価するか、それがGoogleに何をもたらしたのかについて話をした。
DeepMindの対外的な顔として最も多く登場している彼は、これをGoogleの最も正しい決断の一つだと評した。すでにI/Oのメインステージには登場していないが、社内の影響力は依然として大きいジェフ・ディーンも、今回の様々な発表の中でOmniの意義は大きく、それがGeminiがこれまで蓄積してきた能力を真に動画の中に組み込んだものだと考えている。
DeepMindが主導するモデル開発において、彼らが定義する「知能」とは、未来を見据えたものでなければならず、言語能力など今日すでに際立っている能力を単純に一方向へ拡張するだけでは不十分だ。しかし、そのトレーニング方法については、依然として「レシピ」のようなものは存在せず、本質的には絶えず実験を繰り返す必要がある。
そして実験にはリソースの消費が伴います。
幾度かのやり取りを通じて、私はここにある緊張感をはっきりと感じました。Googleは、あるモダリティの能力が他のモダリティを上回っていることが見えても、「自制」すべきだとさえ考えているのです。
Omniは、今回のI/OでDeepMindのCEOである偉大なDemis Hassabis氏が自ら登壇して発表した唯一のモデルでもある。しかし、発表後、体験に関する悪いフィードバックがすでに多く寄せられている。その大きな理由の一つは、今回発表されたのがFlashモデルであることだ。
Geminiが先にFlashをリリースした戦略とは異なり、ピチャイはOmniを「既存のモデルを世代を超えて凌駕する新モデル」と定義しており、安全面と責任の観点から、まずOmni Flashをリリースしたのだ。
前述した「現時点でGoogleにとって最も重要なこと」という観点と合わせると、ここにもまた伏線が張られている可能性があります。
DeepMindが追求するネイティブマルチモーダルは、当初、社内でさえも大きなプレッシャーを伴う、コンセンサスの得られていない技術路線への賭けでした;
第2段階では、この路線からVeoやNano Bananaが生まれたことで、多くの疑問は払拭された;
しかし、現在は第3段階に入り、技術路線としての色合いは薄れ、驚くべきことに、むしろGoogleというビジネス組織のニーズによって内面化され、吸収されてしまっていることに気づくでしょう。
興味深い内部の思考プロセスもこれを裏付けており、Googleは、このネイティブなマルチモーダルがもたらすもう一つの重要な成果として、Googleのソフトウェアとハードウェアを統合したフルスタック戦略への貢献を挙げている。マルチモーダル能力はハードウェアのイテレーションを加速させるために活用でき、AIはすでにDeepMindに次のNano Bananaレベルの革新を生み出させるためではなく、この「内部循環」のために利用され始めている。
DeepMindが開発できる最強のモデルと、検索などの実際のビジネスにおいて収益や体験を向上させることができる実用的なモデル、この2つのうち、Googleにとってどちらがより重要なのか?
この問題は幽霊のように再び浮上してきたが、現状を見る限り、GoogleとDeepMindの足並みは依然として揃っていない。