比較条件
- API: Yi-Large (公式 lingyiwanwu.com)、Qwen3-72B-Instruct (公式 dashscope)
- 各タスク 50 ペアずつ評価、ヒト評価員 3 名による 5 段階スコア
- 温度 0.3、上限 1500 トークン
結果サマリ
| タスク | Yi-Large | Qwen3-72B | | --- | --- | --- | | 議事録要約 | 4.1 | 4.2 | | メール下書き | 4.3 | 3.9 | | FAQ 回答 | 4.0 | 4.2 | | コード生成 | 3.7 | 4.1 | | 契約書チェック | 4.2 | 4.1 | | 営業資料作成 | 4.0 | 3.8 |
Yi-Large はビジネス文章(メール・営業資料)の自然さが、Qwen3-72B はコード生成と FAQ の正確性が、それぞれ強みである。
質的観察
Yi-Large は日本語の微妙な敬語使い分け(社内向け vs 社外向け)の精度が高く、Qwen3 はテンプレート的な文型に寄りがちな印象。一方コード生成では Qwen3-72B が型情報・エラーハンドリングを丁寧に書く傾向。
提供形態とコスト
- Yi-Large: 公式 API のみ(中国本土)、月額換算 1M トークン約 1,200 円
- Qwen3-72B: API + オープンウェイト両対応、API は約 800 円 / 1M、セルフホストで月 320 万円から
まとめ
純粋な API 比較なら Qwen3 がコスト面で有利、文章品質を重視する社外向け用途では Yi-Large が魅力的。日本国内データを扱うなら、いずれも越境リスクを評価したうえで Tokyo セルフホスト Qwen3 を本命としたい。