KGAはどのようなITサービスを提供していますか？

KGAは、ソフトウェア導入・設定、SaaSシステムの保守運用、アプリケーション設定代行、テクニカルサポート、デジタルコンサルティング（ウェブサイト制作含む）、セキュリティ対策、データ管理・バックアップなど、包括的なITサポートサービスを提供しています。

対応エリアはどこですか？

静岡県湖西市を拠点に、リモートサポートで全国対応しています。訪問サポートは東海圏を中心に対応しております。

契約前に相談できますか？

はい、初回のご相談・お見積もりは完全無料です。お客様のIT課題をお聞かせいただき、最適なソリューションをご提案いたします。

緊急対応は可能ですか？

はい、Business プラン（月額）では24時間緊急対応が可能です。Annual Basic および Annual Premium プランでは営業時間内の優先対応を行っています。

海外のテレビアプリの設定もできますか？

はい、海外のテレビアプリケーションやメディアプレーヤーの導入・設定をサポートしています。合法的な海外コンテンツへのアクセス環境を構築いたします。

多言語でのサポートは可能ですか？

日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語でサポートを提供しています。

初期費用や隠れた料金はありますか？

一切ございません。表示価格はすべて税込の最終金額です。初期費用・隠れた請求・想定外の追加料金は発生しません。表示価格のままお支払いいただけます。

途中でプランを変更できますか？

はい、いつでも変更・解約いただけます。アップグレードは即時適用し、差額を日割りでご請求いたします。ダウングレードは次回更新時からの適用となります。

利用可能な支払い方法を教えてください。

StripeおよびKomoju経由で主要クレジットカード（Visa・Mastercard・JCB・American Express）をご利用いただけます。銀行振込・コンビニ決済にも対応しています。ビジネスITプランのお客様には請求書払いもご用意しています。

返金には対応していますか？

はい。すべての年間プランに14日間の全額返金保証をご用意しています（理由を問いません）。月額制のビジネスITプランはいつでも解約可能で、未使用期間分を日割りでご返金いたします。

年間プランとビジネスITプランの違いは何ですか？

年間プランは個人・小規模チーム向けのアプリ設定とサポートが対象です。ビジネスITプランは、Web制作・システム運用・業務自動化・セキュリティ・専任担当者まで含む、企業向けの包括的な月額サブスクリプションです。

英語でのサポートは可能ですか？

はい。日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語で、メール・チャット・Web会議にて完全対応いたします。

AMD MI300X + ROCm 6 で LLM 推論を回す: vLLM 対応状況と実測ベンチ — KGA Tech Blog

MI300X の魅力

GB HBM3 という大容量メモリは、70B-100B クラスの単機推論で大きな利点になる。FP8 演算性能は H100 を超え、価格は単 GPU 比で H100 の 0.7-0.8 倍程度（提供チャネルにより変動）。

ROCm 6 + vLLM

vLLM は ROCm 6 のサポートがメインライン化され、tensor-parallel・FP8・prefix caching が CUDA 版と同様に使える。triton カーネルの互換性も大きく改善し、社内 R&D での運用上の落とし穴は減った。

```bash vllm serve meta-llama/Llama-3.3-70B-Instruct \ --tensor-parallel-size 4 \ --kv-cache-dtype fp8 \ --gpu-memory-utilization 0.92 ```

ベンチ結果（社内 R&D, Llama-3.3-70B, FP8）

| 指標 | H100 80GB ×4 | MI300X ×4 | | --- | --- | --- | | TTFT (4k prompt) | 0.55 s | 0.62 s | | Throughput (concurrent 64) | 1,800 tok/s | 1,950 tok/s | | 同時接続上限 (16k ctx) | 80 | 140 |

メモリ容量の差で同時接続数は明確に MI300X が優位。レイテンシは僅差で H100。

弱点

エコシステム成熟度: PyTorch のマイナー機能、bitsandbytes 系の対応が CUDA より遅い
ドキュメント: 日本語情報が少ない
NCCL 相当の RCCL の安定性: 特定構成でハング報告あり、ROCm 6.2 以降で改善

国内調達性

直販: 限定、代理店経由が現実的
AWS, Oracle Cloud で MI300X インスタンスが東京リージョンに展開
国内 IDC で導入する場合は冷却設計の事前検討が必要

ユースケース適性

70B-100B クラスの大容量モデル単機推論 → MI300X が魅力
一般的な 7B-13B モデルの大量並列 → H100 優位
バッチ翻訳や長文要約のオフピーク推論 → MI300X クラウドオンデマンド

まとめ

MI300X は「大容量メモリで余裕を持って 70B+ を動かしたい」用途で具体的な選択肢になっている。社内 R&D では MI300X クラウドインスタンスをバッチ推論用に併用し、H100 オンプレを低レイテンシ用途に絞る運用パターンが組みやすい。

AMD MI300X + ROCm 6 で LLM 推論を回す: vLLM 対応状況と実測ベンチ

MI300X の魅力

ROCm 6 + vLLM

ベンチ結果（社内 R&D, Llama-3.3-70B, FP8）

弱点

国内調達性

ユースケース適性

まとめ

まずは無料相談から