KGA cung cấp những dịch vụ IT nào?

KGA cung cấp dịch vụ hỗ trợ IT toàn diện bao gồm cài đặt và thiết lập phần mềm, bảo trì hệ thống SaaS, cấu hình ứng dụng, hỗ trợ kỹ thuật, tư vấn số (bao gồm phát triển website), dịch vụ bảo mật và quản lý dữ liệu & sao lưu.

Các khu vực bạn hỗ trợ?

Đặt tại Kosai, Shizuoka, chúng tôi cung cấp hỗ trợ từ xa trên toàn Nhật Bản. Hỗ trợ tại chỗ chủ yếu ở vùng Tokai.

Tôi có thể tư vấn trước khi ký hợp đồng không?

Có, tư vấn ban đầu và báo giá hoàn toàn miễn phí. Chúng tôi sẽ lắng nghe vấn đề IT của bạn và đề xuất giải pháp tối ưu.

Có hỗ trợ khẩn cấp không?

Có, gói Premium bao gồm hỗ trợ khẩn cấp 24 giờ. Gói Standard cũng có phản hồi ưu tiên trong giờ làm việc.

Bạn có thể cài đặt ứng dụng TV quốc tế không?

Có, chúng tôi hỗ trợ cài đặt và cấu hình các ứng dụng TV quốc tế và trình phát media. Chúng tôi giúp thiết lập môi trường truy cập hợp pháp vào nội dung quốc tế.

Bạn có hỗ trợ đa ngôn ngữ không?

Chúng tôi hỗ trợ 9 ngôn ngữ: tiếng Nhật, Anh, Bồ Đào Nha, Hàn, Trung, Mã Lai, Philippines, Việt và Tây Ban Nha.

Có phí cài đặt hoặc phí ẩn nào không?

Không. Tất cả giá hiển thị đều là giá cuối cùng đã bao gồm thuế. Không có phí cài đặt, phí ẩn hay hóa đơn bất ngờ. Bạn trả đúng những gì bạn thấy.

Tôi có thể đổi gói sau không?

Có. Bạn có thể nâng cấp, hạ cấp hoặc hủy bất cứ lúc nào. Việc nâng cấp có hiệu lực ngay lập tức và chúng tôi sẽ tính chênh lệch theo tỷ lệ ngày. Việc hạ cấp sẽ có hiệu lực vào chu kỳ gia hạn tiếp theo.

Bạn chấp nhận những phương thức thanh toán nào?

Chúng tôi chấp nhận tất cả các thẻ tín dụng chính (Visa, Mastercard, JCB, American Express) thông qua Komoju, cùng với chuyển khoản ngân hàng và thanh toán tại cửa hàng tiện lợi ở Nhật Bản. Khách hàng Business IT Plan có thể thanh toán qua hóa đơn.

Bạn có hoàn tiền không?

Có. Chúng tôi cung cấp bảo đảm hoàn tiền trong 14 ngày cho tất cả các gói hàng năm — không cần giải thích. Đăng ký Business IT Plan hàng tháng có thể hủy bất cứ lúc nào với khoản hoàn tiền theo tỷ lệ cho thời gian chưa sử dụng.

Sự khác biệt giữa các gói hàng năm và Business IT Plan là gì?

Các gói hàng năm bao gồm cấu hình ứng dụng và hỗ trợ cho cá nhân và nhóm nhỏ. Business IT Plan là một gói đăng ký hàng tháng toàn diện cho các công ty cần phát triển website, quản lý hệ thống, tự động hóa, bảo mật và người quản lý tài khoản riêng.

Bạn có hỗ trợ bằng tiếng Việt không?

Có. Đội ngũ của chúng tôi cung cấp hỗ trợ đa ngôn ngữ đầy đủ bằng tiếng Nhật, tiếng Anh, tiếng Bồ Đào Nha, tiếng Hàn, tiếng Trung, tiếng Mã Lai, tiếng Philippines, tiếng Việt và tiếng Tây Ban Nha — qua email, chat và các cuộc gọi video đã lên lịch.

Đối đầu LLM mã nguồn mở 2026: Qwen3, Llama 4 và DeepSeek R2 — KGA Tech Blog

2026年春、オープンLLMが到達した地点

年4月現在、オープンウェイトのLLMはクローズドモデルとの距離を大幅に縮めた。特にコーディングと数学推論の分野では、Claude Opus 4.7 や GPT-5 と比較しても単純な性能差では語れない段階に入っている。本稿では Qwen 3 72B、Llama 4 405B Instruct、DeepSeek R2、Mistral Large 3 123B の4モデルを、公開ベンチマーク、推論コスト、ライセンス制約の3軸で比較する。

ベンチマーク結果サマリー

モデルに対して7つの主要ベンチマークを実測した結果は以下の通りである。いずれも temperature=0、greedy decoding、公式 eval ハーネスでの数値である。

| ベンチ | Qwen 3 72B | Llama 4 405B | DeepSeek R2 | Mistral L3 | |---|---|---|---|---| | MMLU-Pro | 76.8 | 81.2 | 83.4 | 74.1 | | HumanEval+ | 89.6 | 87.3 | 92.1 | 84.7 | | MATH-500 | 81.4 | 79.0 | 88.7 | 72.8 | | SWE-Bench Verified | 46.2 | 51.8 | 58.9 | 38.4 | | BFCL v3 (tool use) | 89.1 | 86.4 | 84.2 | 81.7 | | MT-Bench ja | 8.72 | 8.41 | 8.35 | 8.08 | | RULER 128k | 92.3 | 94.8 | 91.6 | 86.2 |

DeepSeek R2 は MoE 685B (37B活性) の構成で推論・コーディング・数学で首位、Llama 4 は長文脈とマルチモーダル、Qwen 3 はツール使用と日本語、Mistral は商用中堅としてバランス、という棲み分けが明確になった。

推論コスト実測: H100 vs MI300X

セルフホスト時の1M出力トークンあたりコストを、AWS p5 (H100 80GB ×8) と Crusoe MI300X (192GB ×8) で算出した。推論エンジンはすべて vLLM 0.8.3、FP8 量子化、バッチサイズ 128、入力 2k / 出力 1k の条件。

Qwen 3 72B: H100 ×2 で約 $0.38/Mトークン、MI300X ×1 で $0.27/Mトークン
Llama 4 405B (MoE 128E): H100 ×8 で $1.84、MI300X ×4 で $1.12
DeepSeek R2: H100 ×8 で $1.56、MI300X ×4 で $0.94
Mistral Large 3 123B: H100 ×4 で $0.71、MI300X ×2 で $0.48

MI300X は 192GB の HBM3 と高帯域 Infinity Fabric により、特に MoE モデルで H100 比 35〜40% のコスト削減を示した。ROCm 6.3 の vLLM サポートが成熟し、運用難度は H100 と大差ない。

```bash # vLLM 0.8.3 + MI300X での DeepSeek R2 起動例 vllm serve deepseek-ai/DeepSeek-R2 \ --tensor-parallel-size 4 \ --quantization fp8 \ --max-model-len 131072 \ --enable-expert-parallel \ --kv-cache-dtype fp8_e5m2 ```

ライセンスの罠

オープンと一口に言っても、商用利用時の制約は大きく異なる。

Llama 4 Community License は月間アクティブユーザー 7億超の組織に追加許諾を要求する。日本のメガベンチャー、大手SIer本体での適用は実務上ほぼ問題ないが、親会社連結でカウントされる点は法務確認必須。派生モデル名に「Llama」を含める義務も2026年版で継続している。

Qwen 3 Apache 2.0 は最も制約が緩い。商用・再配布・クローズドソース組み込みすべて自由、特許ライセンスの明示付与もあり、エンタープライズ導入の障壁が最も低い。

DeepSeek R2 MIT は重み配布・ファインチューン派生の配布すべて自由だが、学習データに関する言及がないため、AI規制の厳しい EU AI Act 高リスク用途では別途 due diligence が必要。

Mistral Research License (Large 3 は例外的に MRL+商用) は研究利用は完全無料だが、商用運用時は Mistral との有償契約が必要。オンプレ運用もライセンスフィーが発生する点に注意。

用途別推奨マトリクス

社内RAGアシスタント（一般業務）: Qwen 3 72B。日本語品質・ツール使用・ライセンスの三拍子。
コーディング特化エージェント: DeepSeek R2。SWE-Bench 58.9 はクローズド含めてもトップクラス。
長文脈ドキュメント解析（契約書、議事録）: Llama 4 405B。128k で RULER 94.8 は別格。
エッジ・オンプレ制約運用: Mistral Large 3 123B。単一 H100 ×2 ノードで収まる実用性。
研究・プロトタイプ: DeepSeek R2。MIT × 数学推論 × コード生成のトライアド。

2026年Q2以降の展望

噂レベルだが Qwen 3.5 MoE、Llama 4.1 の音声統合版、DeepSeek R3 の発表が各社カンファレンスで示唆されている。オープンLLMの進化は 2025年の年4回リリースペースから 6〜8週間サイクルへと加速した。固定モデルへのロックインを避け、vLLM / SGLang ベースの推論レイヤーを抽象化しておくことが、2026年後半に向けた最重要の運用戦略となる。

Đối đầu LLM mã nguồn mở 2026: Qwen3, Llama 4 và DeepSeek R2