KGAはどのようなITサービスを提供していますか？

KGAは、ソフトウェア導入・設定、SaaSシステムの保守運用、アプリケーション設定代行、テクニカルサポート、デジタルコンサルティング（ウェブサイト制作含む）、セキュリティ対策、データ管理・バックアップなど、包括的なITサポートサービスを提供しています。

対応エリアはどこですか？

静岡県湖西市を拠点に、リモートサポートで全国対応しています。訪問サポートは東海圏を中心に対応しております。

契約前に相談できますか？

はい、初回のご相談・お見積もりは完全無料です。お客様のIT課題をお聞かせいただき、最適なソリューションをご提案いたします。

緊急対応は可能ですか？

はい、Business プラン（月額）では24時間緊急対応が可能です。Annual Basic および Annual Premium プランでは営業時間内の優先対応を行っています。

海外のテレビアプリの設定もできますか？

はい、海外のテレビアプリケーションやメディアプレーヤーの導入・設定をサポートしています。合法的な海外コンテンツへのアクセス環境を構築いたします。

多言語でのサポートは可能ですか？

日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語でサポートを提供しています。

初期費用や隠れた料金はありますか？

一切ございません。表示価格はすべて税込の最終金額です。初期費用・隠れた請求・想定外の追加料金は発生しません。表示価格のままお支払いいただけます。

途中でプランを変更できますか？

はい、いつでも変更・解約いただけます。アップグレードは即時適用し、差額を日割りでご請求いたします。ダウングレードは次回更新時からの適用となります。

利用可能な支払い方法を教えてください。

StripeおよびKomoju経由で主要クレジットカード（Visa・Mastercard・JCB・American Express）をご利用いただけます。銀行振込・コンビニ決済にも対応しています。ビジネスITプランのお客様には請求書払いもご用意しています。

返金には対応していますか？

はい。すべての年間プランに14日間の全額返金保証をご用意しています（理由を問いません）。月額制のビジネスITプランはいつでも解約可能で、未使用期間分を日割りでご返金いたします。

年間プランとビジネスITプランの違いは何ですか？

年間プランは個人・小規模チーム向けのアプリ設定とサポートが対象です。ビジネスITプランは、Web制作・システム運用・業務自動化・セキュリティ・専任担当者まで含む、企業向けの包括的な月額サブスクリプションです。

英語でのサポートは可能ですか？

はい。日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語で、メール・チャット・Web会議にて完全対応いたします。

エッジ LLM 推論を東京・大阪に分散する: CDN + 推論ノードの設計 — KGA Tech Blog

設計目標

国内全域から p95 TTFT < 300ms
1 拠点障害時も他拠点で継続提供
モデル更新は 5 分以内に全拠点反映

アーキテクチャ

``` ユーザー → Cloudflare (Geo Routing) → 東京 / 大阪 / 名古屋推論クラスタ ↓ 共有 Object Storage (モデル / プロンプトキャッシュ) ```

ノード構成

各拠点で H100 80GB ×4 + vLLM 0.9 + FP8 KV キャッシュ。同一モデルバージョンを全拠点に同期。

モデル同期

S3 互換 Object Storage に重みを置く
各ノードは起動時に rsync 取得、HBM へロード
バージョン更新時は green/blue デプロイ（旧バージョンを停止する前に新バージョン起動）

プロンプトキャッシュ整合性

拠点間で共有しない（拠点ローカルのみ）
キャッシュヒット率は各拠点ごとに監視

ルーティング戦略

通常時: 最近接拠点へ振り分け
ノード障害: GeoDNS 重み減算 + 自動切替
過負荷時: 別拠点に部分流入

計測

拠点別 p95 TTFT
拠点間フェイルオーバ発火数
拠点別キャッシュヒット率
モデル同期 lag

コスト試算

拠点 × H100 80GB ×4 = 月 1,000-1,200 万円。SMB 単独で組むには重いが、業界 SaaS や複数顧客向け基盤として組むと正当化しやすい。

まとめ

エッジ LLM 推論は「全国の SaaS」「IoT デバイスからの推論要求」など低レイテンシ要件のあるユースケースで価値がある。CDN ベンダー（Cloudflare / Fastly）が推論機能をエッジ統合する流れも進んでおり、自前構築の選択肢は今後 1-2 年で広がる。

エッジ LLM 推論を東京・大阪に分散する: CDN + 推論ノードの設計