提供チャネル
| モデル | 提供元 | Tokyo リージョン | | --- | --- | --- | | Claude Opus 4.5/4.7 | Anthropic, Bedrock, Vertex | Bedrock Tokyo, Vertex Tokyo | | GPT-4o | OpenAI, Azure | Azure Japan East | | Gemini 2.5 Pro | Google AI, Vertex | Vertex Tokyo |
価格(USD / 1M tokens, 2026Q2 時点)
| モデル | 入力 | 出力 | | --- | --- | --- | | Claude Opus 4.5 | 15 | 75 | | Claude Opus 4.7 | 15 | 75 | | Claude Sonnet 4.6 | 3 | 15 | | GPT-4o | 5 | 20 | | Gemini 2.5 Pro | 1.25 | 5 |
月間コスト試算(社内 R&D, 月 200M token 処理想定)
| 構成 | 入力 100M | 出力 100M | 合計 | | --- | --- | --- | --- | | Opus 4.5 only | 1,500 | 7,500 | 9,000 USD | | Sonnet 4.6 only | 300 | 1,500 | 1,800 USD | | Gemini 2.5 Pro only | 125 | 500 | 625 USD | | Hybrid (Sonnet + 30% Opus 4.5) | 660 | 3,300 | 3,960 USD |
純粋なコストでは Gemini 2.5 Pro が圧倒的。ただし日本語業務タスクの精度差を加味すると、Sonnet ベース + 必要に応じて Opus / Gemini にルーティング、という Hybrid が最も実務的。
ハイブリッド設計
```yaml routes: - if: task_complexity > 0.7 use: claude-opus-4-5 - if: input_tokens > 300_000 use: gemini-2-5-pro - default: use: claude-sonnet-4-6 ```
LiteLLM Proxy / OpenRouter 経由で実装可能。
データ越境
- Bedrock Tokyo / Vertex Tokyo / Azure Japan East はいずれも国内処理
- 公式 API 直接利用は基本米国経由 → 越境扱い
まとめ
「Sonnet 4.6 ベース + 高難度タスクのみ Opus 4.5 + 長文時は Gemini 2.5 Pro」が 2026 年中盤の標準的なハイブリッド戦略。月間 200M token 規模で約 4,000 USD(60 万円)に収まる構成は、SMB の AI 基盤として現実的なレンジ。