【衝撃】AIの進化が止まらない!アリババ、動画生成で「ワールドモデル」開発に2900万ドル投資
アリババのAI投資ニュース概要
アリババクラウドは、OpenAIのChatGPTのようなチャットボットとは異なるアプローチで、現実世界をより良く再現するための新しい人工知能に投資しています。
大規模言語モデルの限界を認識し、開発者たちはテキスト中心の学習から、動画や現実の物理的シナリオに基づいた「ワールドモデル」に焦点を当て始めています。
このトレンドに乗り、アリババはAI動画生成ツールViduを手掛けるスタートアップ、シェンシューに対し、20億元(約2900万ドル)を投資することを発表しました。
TALエデュケーションやバイドゥベンチャーズも、シリーズBの資金調達ラウンドに参加しています。
今回の投資は、シェンシューがQimingベンチャーパートナーズなどから6億元を調達してから約2ヶ月後に行われました。
シェンシューは企業評価額の開示を控えています。
シェンシューは、最新の資金調達が、ゲームやAI生成動画のデジタル世界と、自動運転やロボットの物理世界という、現在分離されている2つの領域を結びつける「汎用ワールドモデル」の開発を支援すると述べています。
シェンシューは、視覚、音声、触覚などのマルチモーダルデータに基づいて構築された汎用ワールドモデルは、大規模言語モデルよりも自然に物理世界の仕組みを捉えると考えています。
ワールドモデル開発の注目ポイント
- アリババクラウドは、ChatGPTのようなチャットボットとは異なる、現実世界をより良く再現するAIに投資。
- 動画や実世界の物理シナリオに基づいた「ワールドモデル」に注力し、既存の言語モデルの限界を認識。
- AI動画生成ツールViduを手掛けるShengShuに対し、アリババなどが約2900万ドルを投資し、汎用ワールドモデル開発を支援。
AIパラダイムシフトの分析・解説
アリババのシェンシューへの投資は、AI開発におけるパラダイムシフトを明確に示すものです。
テキスト中心の大規模言語モデルの限界が認識され、AIが「理解」する対象を現実世界へと拡張する動きは、単なる技術的進歩を超えます。
これは、AIが抽象的な情報処理から、物理法則に基づいた推論へと進化する転換点となるでしょう。
特に注目すべきは、「汎用ワールドモデル」という概念です。
ゲームや動画といったデジタル空間と、自動運転やロボティクスといった現実世界を繋ぐことで、AIはより複雑なタスクを実行できるようになります。
例えば、ロボットが動画から学習し、現実世界で同じ動作を再現するといったことが可能になるのです。
今後、このトレンドはAI競争の新たな軸となり、マルチモーダルデータの活用が鍵を握ると考えられます。
視覚、聴覚、触覚といった多様な情報を統合することで、AIはより人間らしい知性を獲得し、産業界全体に革新をもたらすでしょう。
アリババの投資は、この変化を先取りする戦略的な一手と言えます。
※おまけクイズ※
Q. アリババが投資したシェンシューが開発を進めている「汎用ワールドモデル」は、主にどのような2つの領域を結びつけることを目指している?
ここを押して正解を確認
正解:ゲームやAI生成動画のデジタル世界と、自動運転やロボットの物理世界
解説:記事の後半で、シェンシューが汎用ワールドモデルの開発を通じて、デジタル空間と物理世界を繋げると述べられています。
まとめ

アリババがAI動画生成のスタートアップ、シェンシューに約2900万ドルを投資したニュースですね。ChatGPTのような言語モデルの限界を認識し、現実世界をより忠実に再現できる「ワールドモデル」に注目が集まっているようです。
ゲームや自動運転など、デジタルと現実世界を繋ぐAI開発を支援する今回の投資は、AIの進化における大きな転換点かもしれません。今後は、視覚や触覚など様々な情報を統合したAIが、私たちの生活や産業を大きく変えていくと期待されます。今後の動向に注目していきましょう。


