Skip to content
Kembali ke senarai artikel
AI/AGI11分

マルチモーダル・アクションモデル 2026:Figure 03・1X Neo Gamma・Optimus V3の実装状況

Multimodal Action Models 2026: Figure 03, 1X Neo Gamma, Optimus V3 — Embodied AI State

小林 直樹ロボティクスエンジニア
2026-04-2511分
ヒューマノイドFigure1XOptimusEmbodied AI

Artikel ini diterbitkan dalam Bahasa Jepun. Ringkasan dalam Bahasa Melayu di bawah:

Multimodal Action Models 2026: Figure 03, 1X Neo Gamma, Optimus V3 — Embodied AI Stateヒューマノイドロボット × マルチモーダルAIは、2026年に実証実験フェーズから限定的な商用フェーズへ移りつつある。Figure 03、1X Neo Gamma、Tesla Optimus V3 について公開情報に基づく状況を整理する(ベンチは各社公式を参照)。

マルチモーダル・アクションモデル(映像・音声・身体動作を統合的に出力するモデル)は、2024〜2025年のデモ連発期を経て、2026年には工場・倉庫・家庭(限定)での実証フェーズに入ったという報道が相次いでいる。本稿は Figure AI の Figure 03、1X Technologies の Neo Gamma、Tesla Optimus V3 について公開情報を整理する。各社の性能主張は自己申告が多く、第三者検証のある数字以外は「公式発表」と明示して扱う。

Figure 03(Figure AI)

Figure AI は BMW との工場導入報道で知られ、Figure 03 世代では自社開発の Helix(視覚+言語+動作の統合モデル系)によるタスク学習の進展を公式で発表している。特徴は「人間のデモ映像からタスク学習」方針で、固定ロボットアームとは異なる汎用性を訴求している。2026年時点で商用出荷の一般公開は限定的で、エンタープライズ契約中心と見られる。具体的な処理タスク数やMTBFは公式発表を参照されたい。

1X Neo Gamma(1X Technologies)

OpenAI が出資する 1X は、家庭用ヒューマノイド Neo シリーズを開発してきた。Neo Gamma は家庭想定の筐体で、布・柔らかい素材の筐体やソフトな動作プロファイルが特徴として公式発表されている。家庭への本格普及は安全・規制・価格の3壁が大きく、2026年段階では先行ユーザープログラムや限定展開が現実的な見立てだ。

Tesla Optimus V3

Tesla Optimus は世代ごとにハードウェア更新と学習パイプライン刷新を告知してきた。V3(世代名称は社内呼称含め変遷あり、公式発表を確認されたい)では手先器用性と歩行安定性の改善がアピールされている。Tesla 工場内での内製利用から外販へのロードマップが語られてきたが、一般外販の具体的開始時期・価格は公開情報に揺れがあり、本稿では断定を避ける。

マルチモーダル・アクションモデルの技術的論点

VLA(Vision-Language-Action)モデルは、画像+自然言語指示+ロボット動作を end-to-end で学習する枠組みで、Google RT-2、Figure Helix、Physical Intelligence π0 などが代表例として報じられている。論点は (1) データ収集:人間のデモ映像から学ばせるか、シミュレーションか、実機収集か、(2) 安全性:物理世界のミスは取り返しがつかない、(3) 電源と稼働時間、(4) 価格:100万〜数百万円/台に収まるかが普及のライン。

産業インパクトの現実解

  • 年時点で、ヒューマノイドが人間労働を大規模に置き換える兆しはまだ見えない。代わりに起きているのは、「構造化された倉庫・工場の特定タスク」での限定配備である。アマゾン、BMW、各家電工場などでパイロット運用が報じられており、ROI が立つかどうかは今後数年の観察対象だ。

投資と規制の状況

資金は潤沢だが、規制(特に EU・米国での労働安全基準、日本の労働安全衛生法)が追いついておらず、商用デプロイは各国の実証フレーム頼みになっている。日本市場では介護・物流での期待値が高いが、家庭展開は当面慎重に進むと見るのが妥当だろう。本稿の評価は2026年4月時点の公開情報に基づき、数値・時期は各社公式を一次情報として確認されたい。

ソフトウェアスタックの共通論点

VLA モデル、高レートの制御ループ(100〜1000Hz)、LLM ベースのタスクプランナー、センサ融合を一つのシステムに同居させる設計は、自動運転のスタックに近い。ROS 2、Isaac Sim(シミュレーション)、各社独自の実行基盤が混在し、標準化はまだ途上。特に「LLM の応答遅延(数秒)」と「リアルタイム制御(数ミリ秒)」の階層を明確に分けるアーキテクチャが実機実装では不可欠だ。低頻度の意思決定を LLM が、高頻度の動作制御を別モデル/古典制御が担う分業が主流になっている。

日本企業の位置付け

ソニー、トヨタ(Toyota Research Institute)、ホンダ、川崎重工などがヒューマノイド/モバイルマニピュレータ領域で研究・実証を進めている。日本の強みはハードウェア精度と安全設計の蓄積、弱みは大規模な VLA 学習データ・計算資源でのキャッチアップ速度。Preferred Networks など国内AI勢との組み合わせが現実的な勝ち筋になり得る。

導入検討企業への提言

「人手不足の解決策」として過大評価しないこと。2026年時点のヒューマノイドは「特定タスクを人間より安価または確実に行う」局面でのみ ROI が立つ。導入検討なら (1) 対象タスクの定型度、(2) 環境の構造化度、(3) 安全停止要件、(4) メンテナンス人員の確保の4点を冷静に評価し、PoC を数ヶ月単位で区切って進めることを推奨する。

技術的な課題を一緒に解決しませんか?

KGA IT Solutionsは、AI・クラウド・DevOpsの専門チームがお客様の課題に最適なソリューションを提供します。

お問い合わせ