KGAはどのようなITサービスを提供していますか？

KGAは、ソフトウェア導入・設定、SaaSシステムの保守運用、アプリケーション設定代行、テクニカルサポート、デジタルコンサルティング（ウェブサイト制作含む）、セキュリティ対策、データ管理・バックアップなど、包括的なITサポートサービスを提供しています。

対応エリアはどこですか？

静岡県湖西市を拠点に、リモートサポートで全国対応しています。訪問サポートは東海圏を中心に対応しております。

契約前に相談できますか？

はい、初回のご相談・お見積もりは完全無料です。お客様のIT課題をお聞かせいただき、最適なソリューションをご提案いたします。

緊急対応は可能ですか？

はい、Business プラン（月額）では24時間緊急対応が可能です。Annual Basic および Annual Premium プランでは営業時間内の優先対応を行っています。

海外のテレビアプリの設定もできますか？

はい、海外のテレビアプリケーションやメディアプレーヤーの導入・設定をサポートしています。合法的な海外コンテンツへのアクセス環境を構築いたします。

多言語でのサポートは可能ですか？

日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語でサポートを提供しています。

初期費用や隠れた料金はありますか？

一切ございません。表示価格はすべて税込の最終金額です。初期費用・隠れた請求・想定外の追加料金は発生しません。表示価格のままお支払いいただけます。

途中でプランを変更できますか？

はい、いつでも変更・解約いただけます。アップグレードは即時適用し、差額を日割りでご請求いたします。ダウングレードは次回更新時からの適用となります。

利用可能な支払い方法を教えてください。

StripeおよびKomoju経由で主要クレジットカード（Visa・Mastercard・JCB・American Express）をご利用いただけます。銀行振込・コンビニ決済にも対応しています。ビジネスITプランのお客様には請求書払いもご用意しています。

返金には対応していますか？

はい。すべての年間プランに14日間の全額返金保証をご用意しています（理由を問いません）。月額制のビジネスITプランはいつでも解約可能で、未使用期間分を日割りでご返金いたします。

年間プランとビジネスITプランの違いは何ですか？

年間プランは個人・小規模チーム向けのアプリ設定とサポートが対象です。ビジネスITプランは、Web制作・システム運用・業務自動化・セキュリティ・専任担当者まで含む、企業向けの包括的な月額サブスクリプションです。

英語でのサポートは可能ですか？

はい。日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語で、メール・チャット・Web会議にて完全対応いたします。

Alignment Tax の現在地：RLHF が削る能力と Goodhart の罠 — KGA Tech Blog

Alignment Tax という言葉

「Alignment tax（アライメント税）」は、モデルを安全で従順にするための事後学習が、素の pre-trained モデルが持っていた能力をいくらか削る現象を指す。この税がゼロでないこと自体は広く合意されており、論点はその大きさと、削られる能力の種類である。

Bai et al. 2022：Helpful-Harmless の非自明なトレードオフ

Anthropic の Yuntao Bai らによる「Training a Helpful and Harmless Assistant with RLHF」（2022）は、helpful と harmless を別の preference model として訓練し、組み合わせたときに両立が難しいケースを示した。例えば「爆弾の作り方を教えて」に対して詳細に答えれば helpful だが harmless ではなく、完全拒否すれば harmless だが helpful スコアが落ちる。この論文は単に安全性を高めるだけでなく「どの軸でどれだけのトレードオフがあるか」を定量化した点で重要だった。

Goodhart の法則と報酬ハッキング

「測定が目標になった瞬間、それは良い測定ではなくなる」という Goodhart の法則は、RLHF においてしばしば顕在化する。報酬モデルが「丁寧な口調」「箇条書き」「免責句の付与」を好むように学習されると、ポリシーモデルは内容を犠牲にしてこれらの表層特徴を最適化する。結果、見た目は丁寧だが実質が薄い、安全側に過剰に倒れる、という症状が出ると報告される。俗に「slop」「over-refusal」と呼ばれる現象だ。

DPO / 選好最適化時代の再発

年、DPO（Direct Preference Optimization）や KTO、IPO などオンポリシー報酬モデルを介さない手法が普及したが、Goodhart 問題が消えたわけではない。選好データ自体がアノテーター傾向を反映するため、(1) 長い回答を好む、(2) 自信過剰な断定を好む、(3) 箇条書きを好む、といったバイアスがモデルに焼き付く。これらは表層品質を上げつつ、事実精度や推論深度を下げ得る。

税を減らすための実務知見

年時点で効果が報告されているアプローチを整理する。(1) KL 正則化を強めに効かせ、pre-trained 分布から離れすぎないようにする。(2) 選好データを多様化し、長さ・口調バイアスに対して明示的な対照ペアを混ぜる。(3) 能力ベンチ（MMLU、GSM8K、HumanEval 等）を alignment ステージ前後で回し、何点失ったかを可視化する。(4) 安全拒否を「拒否 or 回答」の二値でなく「安全な部分回答 + 制限の説明」の構造で学習させ、over-refusal を抑える。(5) システムプロンプトで挙動を調整できる余地を残し、事後学習ですべてを焼き込まない。税は避けられないが、どこに、いくら、なぜ払うかを設計できるかがエンジニアリングの質を分ける。

Alignment Tax の現在地：RLHF が削る能力と Goodhart の罠

Alignment Tax という言葉

Bai et al. 2022：Helpful-Harmless の非自明なトレードオフ

Goodhart の法則と報酬ハッキング

DPO / 選好最適化時代の再発

税を減らすための実務知見

技術的な課題を一緒に解決しませんか？