Skip to content
記事一覧に戻る
AI/AGI10分

2026年4月第2週: モデルローンチ・規制・研究 — Gemma 4・Llama 4・Bezos $10B

AI News Week 15, 2026 — Model Launches, Regulation and Research

高橋 健介Enterprise AI Consultant
2026-04-2410分
AIニュース業界動向AI規制AI/AGI

Google Gemma 4 公開 — 26B MoE、消費者ハードウェアで毎秒85トークン

公開報道による(2026-04時点)。Google は新しいオープンウェイトの MoE フラグシップ「Gemma 4」を公開した。26B パラメータ・量子化後14GBで、消費者向けハードウェアでも毎秒85トークン程度の推論性能を出せる構成という公開資料が示されている。Gemma 系列はライセンス条件が比較的緩く、商用利用のハードルが低いことから、企業内 AI の主力候補として注目されている。

中小企業の自前運用では、推論速度よりも「動かすために必要なGPU VRAM」がボトルネックになりがちだった。14GB という VRAM 要件は、中古の NVIDIA RTX 4090 や中堅の A6000 級でも十分動かせる範囲で、初期投資数十万円規模で本格的な社内 AI を建てる現実解が見えている。

Meta Llama 4 — Scout と Maverick の二段構成

公開報道による(2026-04時点)。Meta の Llama 4 は Scout(109B 総・17B アクティブ・16 エキスパート)と Maverick(400B 総)の二段構成で、両者ともにテキスト・画像・動画のネイティブマルチモーダル対応である。MoE 設計で推論コストを抑えつつ、長文脈と高性能の両立を狙う設計が公開資料に明記されている。

Scout サイズは社内デプロイの現実解、Maverick は API 経由のフラグシップ用途、という棲み分けが想定される。中小企業の業務支援では Scout クラスで十分な性能が得られるケースが多く、月額換算では商用 API の半分以下に収まるケースもある。

Project Prometheus — Bezos 氏が100億ドル調達近づく

公開報道による(2026-04-21時点)。Bloomberg の Financial Times を引用した報道によれば、Jeff Bezos 氏率いる AI スタートアップ「Project Prometheus」は約100億ドルの資金調達を最終段階に入れており、評価額は約380億ドルとされる。OpenAI(122B)・Anthropic(30B)・xAI(20B)・Waymo(16B)といった既存メガラウンドに続く新たな大型プレイヤーの出現である。

中小企業の AI 戦略から見ると、フロンティアモデル提供者の数が増えることはベンダーロックインのリスク分散に寄与する。一方で、これだけ巨額の資金が集中する産業構造の中で、いつどのタイミングで価格戦争が起きるかは不透明である。長期契約を結ぶ前に、複数ベンダーの API を抽象化するレイヤー(LangChain、LiteLLM、Vercel AI SDK 等)を導入しておく備えが効いてくる。

EU AI Act — GPAI 義務は施行中、執行権限は2026年8月から

公開報道による(2026-04時点)。EU AI Act の General-Purpose AI(GPAI)モデル提供者向け義務は2025年8月2日から発効済みであり、技術文書整備・著作権指令準拠・学習データサマリー公表などが求められている。一方、欧州委員会の執行権限(罰金・調査命令・市場制限措置等)は2026年8月2日に発効予定で、現在は実質的な「準備期間」となっている。

日本企業でも、EUに製品やサービスを提供するもしくは欧州顧客のデータを扱う場合、GPAI 規制の射程内に入る可能性がある。AIエージェントを欧州顧客に提供している中小企業は、技術文書(Article 53 に基づく Annex XI 形式)の準備状況を一度棚卸しすべきタイミングである。KGA IT では、輸出関連企業のクライアントに対し、ガバナンス文書整備の支援を進めている。

arXiv 注目論文 — Single-Agent vs Multi-Agent 多段推論

公開報道による(2026-04時点)。arXiv の cs.CL 領域で「Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Under Equal Thinking Token Budgets」という論文が話題となった。同等の「思考トークン予算」のもとでは、シングルエージェントの方がマルチエージェント構成より多段推論タスクで優れるケースがあるという結果である。

実務的なインパクトは大きい。エージェント設計の流行で「複数エージェントが議論する」アーキテクチャが多用されているが、単純にトークン消費が増えるだけで効果が出ていないケースが想定される。中小企業の AI 構築でも、複雑なオーケストレーションを組む前に、単一エージェントで Chain-of-Thought を十分に走らせる構成と性能比較してから判断するのが堅実である。

技術的な課題を一緒に解決しませんか?

KGA IT Solutionsは、AI・クラウド・DevOpsの専門チームがお客様の課題に最適なソリューションを提供します。

お問い合わせ