KGA提供哪些IT服务？

KGA提供全面的IT支持服务，包括软件安装与配置、SaaS系统维护、应用程序配置代理、技术支持、数字咨询（含网站建设）、安全服务以及数据管理与备份解决方案。

服务覆盖哪些地区？

总部位于静冈县湖西市，为日本全国提供远程支持，现场支持主要覆盖东海地区。

签约前可以咨询吗？

可以，首次咨询与报价完全免费。我们将了解您的IT需求并提供最佳方案。

是否提供紧急支持？

提供。高级方案包含7×24小时紧急响应，标准方案也在营业时间内提供优先响应。

可以配置海外电视应用吗？

可以，我们支持海外电视应用和媒体播放器的安装与配置，帮助搭建合法访问海外内容的环境。

是否提供多语言服务？

我们提供日语、英语、葡萄牙语、韩语、中文、马来语、菲律宾语、越南语和西班牙语共9种语言的支持。

是否有开通费或隐藏费用？

没有。所有显示的价格均为含税的最终金额。没有开通费、隐藏费用或意外账单。您看到的即是您支付的。

之后可以更换方案吗？

可以。您可以随时升级、降级或取消。升级立即生效，差额按天数比例结算。降级将在下一个续费周期生效。

支持哪些支付方式？

我们通过 Komoju 支持所有主要信用卡（Visa、Mastercard、JCB、American Express），并支持日本银行转账和便利店付款。商务 IT 方案客户还可选择发票付款。

是否支持退款？

是的。所有年度方案均提供14天全额退款保证——无需任何理由。按月付费的商务 IT 方案可随时取消，并按未使用期间按比例退款。

年度方案与商务 IT 方案有何区别？

年度方案面向个人和小团队，涵盖应用配置与支持。商务 IT 方案是一项面向企业的综合月度订阅服务，包含网站开发、系统管理、业务自动化、安全服务以及专属客户经理。

是否提供中文支持？

是的。我们的团队通过邮件、聊天和预约视频会议，以日语、英语、葡萄牙语、韩语、中文、马来语、菲律宾语、越南语和西班牙语9种语言提供完整的多语言支持。

故障响应自动化：从PagerDuty到Slack Bot的全链路设计 — KGA Tech Blog

インシデント対応の現実

深夜3時にPagerDutyのアラートが鳴る。寝ぼけ眼でSlackを開き、ダッシュボードを確認し、原因を特定し、修正を適用する。この一連の作業にかかる時間は平均45分——しかしその80%は「状況把握」と「定型的な対応手順の実行」だ。

KGAではクライアント10社以上のインシデント対応体制を構築してきた。その経験から断言できるのは、インシデント対応の大部分は自動化可能だということだ。完全な自動化ではない。判断が必要な部分は人間が行う。しかし情報収集、初期診断、定型対応は確実に自動化できる。

PagerDutyを中心としたインシデント管理

KGAの標準構成: アラートソースはDatadog（インフラ/APMメトリクス）、Sentry（アプリケーションエラー）、CloudWatch（AWSリソース）をPagerDuty Event APIv2に集約。エスカレーションはLevel 1（即時→当番SRE）、Level 2（10分後→SREリーダー）、Level 3（30分後→VP of Engineering）。Level 1応答率97%（SLA目標95%）。

アラート品質管理が最重要だ。対応不要アラートが月間10%を超えたらルールを見直す。ノイズ率を月次追跡し、現在は対応不要率5.2%まで改善した。

Slack Botによる自動診断

インシデント発生時、KGA開発のSlack Bot「Watchdog」が30秒以内に以下を自動実行する。Datadogからエラー率・レイテンシ・リソース使用率のグラフを投稿。GitHub APIから直近1時間のデプロイ履歴と変更サマリーを取得。CloudWatch Logs Insightsでエラーログ上位5件を抽出。過去のインシデントDBから類似事象と対応手順を提示。

これによりSREのダッシュボード巡回時間を平均15分削減している。

自動ランブックとAuto-remediation

ランブックはAWS Systems Manager Automation Documentで実装。YAMLで定義し、条件分岐、承認ステップ、ロールバック手順を含む。「Podのメモリ不足」ランブック: 対象Pod特定（自動）→ メモリ確認（自動）→ Pod再起動（承認後自動）→ メモリリミット引き上げ提案（自動、適用は承認後）→ 再発監視設定（自動）。

承認はSlackボタンUIで、スマートフォンからも可能。実績: 全インシデントの38%がランブック全自動実行で解決、27%が承認1回の半自動で解決、手動介入は35%に削減。

Auto-remediationパターン: ディスク85%超過→自動ログローテーション+一時ファイル削除。SSL証明書→30日前に自動更新。Pod OOMKill→自動再起動+メモリリミット1.5倍調整。鉄則は「安全性の証明」。データベース操作や顧客データに影響する処理は絶対に対象にしない。

ポストモーテム文化

KGAのポストモーテムテンプレート: インシデント概要、タイムライン、根本原因分析（5 Whys）、対策（短期・中期・長期）、教訓。最重要原則は「blame-free」。「なぜ○○さんがミスをしたか」ではなく「なぜシステムがそのミスを許容したか」を問う。

全ポストモーテムを社内Wikiに公開し、月1回の読書会で過去のインシデントから学ぶ。この文化的投資がMTTRを1年間で65%改善した最大の要因だ。

故障响应自动化：从PagerDuty到Slack Bot的全链路设计

インシデント対応の現実

PagerDutyを中心としたインシデント管理

Slack Botによる自動診断

自動ランブックとAuto-remediation

ポストモーテム文化

携手解决您的技术挑战