KGAはどのようなITサービスを提供していますか？

KGAは、ソフトウェア導入・設定、SaaSシステムの保守運用、アプリケーション設定代行、テクニカルサポート、デジタルコンサルティング（ウェブサイト制作含む）、セキュリティ対策、データ管理・バックアップなど、包括的なITサポートサービスを提供しています。

対応エリアはどこですか？

静岡県湖西市を拠点に、リモートサポートで全国対応しています。訪問サポートは東海圏を中心に対応しております。

契約前に相談できますか？

はい、初回のご相談・お見積もりは完全無料です。お客様のIT課題をお聞かせいただき、最適なソリューションをご提案いたします。

緊急対応は可能ですか？

はい、Business プラン（月額）では24時間緊急対応が可能です。Annual Basic および Annual Premium プランでは営業時間内の優先対応を行っています。

海外のテレビアプリの設定もできますか？

はい、海外のテレビアプリケーションやメディアプレーヤーの導入・設定をサポートしています。合法的な海外コンテンツへのアクセス環境を構築いたします。

多言語でのサポートは可能ですか？

日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語でサポートを提供しています。

初期費用や隠れた料金はありますか？

一切ございません。表示価格はすべて税込の最終金額です。初期費用・隠れた請求・想定外の追加料金は発生しません。表示価格のままお支払いいただけます。

途中でプランを変更できますか？

はい、いつでも変更・解約いただけます。アップグレードは即時適用し、差額を日割りでご請求いたします。ダウングレードは次回更新時からの適用となります。

利用可能な支払い方法を教えてください。

StripeおよびKomoju経由で主要クレジットカード（Visa・Mastercard・JCB・American Express）をご利用いただけます。銀行振込・コンビニ決済にも対応しています。ビジネスITプランのお客様には請求書払いもご用意しています。

返金には対応していますか？

はい。すべての年間プランに14日間の全額返金保証をご用意しています（理由を問いません）。月額制のビジネスITプランはいつでも解約可能で、未使用期間分を日割りでご返金いたします。

年間プランとビジネスITプランの違いは何ですか？

年間プランは個人・小規模チーム向けのアプリ設定とサポートが対象です。ビジネスITプランは、Web制作・システム運用・業務自動化・セキュリティ・専任担当者まで含む、企業向けの包括的な月額サブスクリプションです。

英語でのサポートは可能ですか？

はい。日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語で、メール・チャット・Web会議にて完全対応いたします。

LLM 推論の高可用設計: マルチリージョン・サーキットブレーカ・バルクヘッド — KGA Tech Blog

障害シナリオ

プロバイダ障害: Anthropic / OpenAI 全停止（過去にも数時間規模あり）
リージョン障害: Bedrock Tokyo 単独停止
レート制御: TPM/RPM 上限突破
セルフホスト障害: GPU 故障、ネットワーク分断
上流障害: VPC 内の DB / キャッシュ停止

マルチリージョン構成

``` LiteLLM Proxy (Tokyo) ├ primary: Bedrock Tokyo (Claude Sonnet 4.6) ├ secondary: Anthropic 公式 API └ tertiary: Tokyo セルフホスト Qwen3-72B ```

primary 障害時は secondary、secondary も障害時は tertiary に降格しつつ警告を出す。

サーキットブレーカ

```ts class CircuitBreaker { failureCount = 0; state: 'closed' | 'open' | 'half' = 'closed';

async call(fn: () => Promise<any>) { if (this.state === 'open') throw new Error('circuit open'); try { const r = await fn(); this.failureCount = 0; return r; } catch (e) { if (++this.failureCount > 5) this.state = 'open'; throw e; } } } ```

LiteLLM Proxy には組み込みで cooldown_time が設定でき、明示的な実装が不要なケースも多い。

バルクヘッド

テナント単位 / ジョブ種別単位でリクエスト枠を分離。1 テナントの暴走が他テナントに波及しないようにする。Redis ベースの token bucket で実装。

フォールバックモデルの品質

primary が Opus 4.5、tertiary が Qwen3-72B、と品質差が大きいケースでは「フォールバック発火時はクライアントに警告」「機密処理はフォールバック禁止」など別立てのポリシーが必要。

観測

各 fallback level の発火率
リクエストの分布（primary / secondary / tertiary）
p95/p99 レイテンシ（fallback 含む）
SLA 計算: 月次レポート

カオステスト

月 1 回: 計画的にプロバイダ X を遮断し、フォールバックを実地検証
半年に 1 回: フェイルオーバ訓練 + ランブック更新

まとめ

LLM 推論の HA 設計は、従来の Web アプリ HA に加えて「品質の異なるフォールバック」を扱う点が特殊。マルチプロバイダ・マルチリージョン・サーキットブレーカ・バルクヘッドの 4 点セットを最初から組み込むことで、本番運用の安心感が大きく変わる。

LLM 推論の高可用設計: マルチリージョン・サーキットブレーカ・バルクヘッド