KGA提供哪些IT服务？

KGA提供全面的IT支持服务，包括软件安装与配置、SaaS系统维护、应用程序配置代理、技术支持、数字咨询（含网站建设）、安全服务以及数据管理与备份解决方案。

服务覆盖哪些地区？

总部位于静冈县湖西市，为日本全国提供远程支持，现场支持主要覆盖东海地区。

签约前可以咨询吗？

可以，首次咨询与报价完全免费。我们将了解您的IT需求并提供最佳方案。

是否提供紧急支持？

提供。Business 套餐（按月）包含 7×24 小时紧急响应，Annual Basic 与 Annual Premium 套餐在营业时间内提供优先响应。

可以配置海外电视应用吗？

可以，我们支持海外电视应用和媒体播放器的安装与配置，帮助搭建合法访问海外内容的环境。

是否提供多语言服务？

我们提供日语、英语、葡萄牙语、韩语、中文、马来语、菲律宾语、越南语和西班牙语共9种语言的支持。

是否有开通费或隐藏费用？

没有。所有显示的价格均为含税的最终金额。没有开通费、隐藏费用或意外账单。您看到的即是您支付的。

之后可以更换方案吗？

可以。您可以随时升级、降级或取消。升级立即生效，差额按天数比例结算。降级将在下一个续费周期生效。

支持哪些支付方式？

我们通过 Stripe 和 Komoju 支持所有主要信用卡（Visa、Mastercard、JCB、American Express），并支持日本银行转账和便利店付款。商务 IT 方案客户还可选择发票付款。

是否支持退款？

是的。所有年度方案均提供14天全额退款保证——无需任何理由。按月付费的商务 IT 方案可随时取消，并按未使用期间按比例退款。

年度方案与商务 IT 方案有何区别？

年度方案面向个人和小团队，涵盖应用配置与支持。商务 IT 方案是一项面向企业的综合月度订阅服务，包含网站开发、系统管理、业务自动化、安全服务以及专属客户经理。

是否提供中文支持？

是的。我们的团队通过邮件、聊天和预约视频会议，以日语、英语、葡萄牙语、韩语、中文、马来语、菲律宾语、越南语和西班牙语9种语言提供完整的多语言支持。

AI品質リグレッション検出パイプライン：カナリアeval・McNemar検定・Holm-Bonferroni補正 — KGA Tech Blog

AI製品の品質リグレッションは、単一メトリクスの平均値比較では検出できないことが多いです。理由は3つあります。1つ目、evalデータセット内のタスクごとにノイズ分布が異なる。2つ目、同じプロンプトでも温度サンプリングにより結果がばらつく。3つ目、多数のタスクを同時に評価するため、偶然の有意差（false positive）が累積します。本稿では、カナリアeval・McNemar検定・Holm-Bonferroni補正を組み合わせた実運用パイプラインを解説します。

カナリアeval集合の設計

カナリアevalとは、本番デプロイ前に必ず通すゴールデンセットです。設計の要点は4つ。(1) 代表性：本番トラフィックから層化サンプリング。(2) 安定性：ラベルが時間で揺れないよう人手確定済み。(3) 境界事例：過去に事故を起こしたケースを必ず含める（regression anchor）。(4) サイズ：McNemar検定で検出力0.8を確保するには、効果量にもよりますが最低300〜500件が目安です。

Fênix社内では、カナリアを「コア（200件・不変）」「ドリフト（300件・四半期更新）」「ホットフィックス（可変・直近インシデント由来）」の3層に分け、各デプロイで全層を走らせます。

McNemar検定による対応ありサンプル比較

旧モデルと新モデルを同じevalで評価すると、各サンプルは「旧正・新正」「旧正・新誤」「旧誤・新正」「旧誤・新誤」の4セルに分類されます。独立二標本の比率検定（z検定）を使うのは誤りで、正しくはMcNemar検定です。帰無仮説は「不一致セル b と c が等しい」で、統計量は (b - c)² / (b + c) をカイ二乗分布（自由度1）と比較します。

```python from statsmodels.stats.contingency_tables import mcnemar # table = [[両方正, 旧正新誤], [旧誤新正, 両方誤]] result = mcnemar(table, exact=False, correction=True) ```

Holm-Bonferroni補正：多重比較問題

カナリアを10カテゴリ（要約・翻訳・コード・QA・…）で分割評価する場合、各カテゴリでp<0.05を独立に判定すると、全体のfamily-wise error rateは約40%まで膨らみます。Bonferroniは保守的すぎるため、Holm（1979）のステップダウン法を推奨します。p値を昇順に並べ、i番目を α/(m-i+1) と比較していく方式で、検出力を維持しつつFWERを制御できます。scipy.stats.false_discovery_control または statsmodels.stats.multitest.multipletests(method='holm') で実装できます。

CI/CDへの組み込み

GitHub ActionsでモデルPRごとにカナリアを走らせ、(1) カテゴリ別McNemar p値、(2) Holm補正後の棄却判定、(3) regression anchor（過去事故セット）の全通過を必須チェックとします。anchorに1件でも退行が出た場合はpを問わずブロック。これで「平均は上がったが重要ケースは壊した」という典型的な事故を防げます。

AI品質リグレッション検出パイプライン：カナリアeval・McNemar検定・Holm-Bonferroni補正

カナリアeval集合の設計

McNemar検定による対応ありサンプル比較

Holm-Bonferroni補正：多重比較問題

CI/CDへの組み込み

技術的な課題を一緒に解決しませんか？