KGAはどのようなITサービスを提供していますか？

KGAは、ソフトウェア導入・設定、SaaSシステムの保守運用、アプリケーション設定代行、テクニカルサポート、デジタルコンサルティング（ウェブサイト制作含む）、セキュリティ対策、データ管理・バックアップなど、包括的なITサポートサービスを提供しています。

対応エリアはどこですか？

静岡県湖西市を拠点に、リモートサポートで全国対応しています。訪問サポートは東海圏を中心に対応しております。

契約前に相談できますか？

はい、初回のご相談・お見積もりは完全無料です。お客様のIT課題をお聞かせいただき、最適なソリューションをご提案いたします。

緊急対応は可能ですか？

はい、Business プラン（月額）では24時間緊急対応が可能です。Annual Basic および Annual Premium プランでは営業時間内の優先対応を行っています。

海外のテレビアプリの設定もできますか？

はい、海外のテレビアプリケーションやメディアプレーヤーの導入・設定をサポートしています。合法的な海外コンテンツへのアクセス環境を構築いたします。

多言語でのサポートは可能ですか？

日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語でサポートを提供しています。

初期費用や隠れた料金はありますか？

一切ございません。表示価格はすべて税込の最終金額です。初期費用・隠れた請求・想定外の追加料金は発生しません。表示価格のままお支払いいただけます。

途中でプランを変更できますか？

はい、いつでも変更・解約いただけます。アップグレードは即時適用し、差額を日割りでご請求いたします。ダウングレードは次回更新時からの適用となります。

利用可能な支払い方法を教えてください。

StripeおよびKomoju経由で主要クレジットカード（Visa・Mastercard・JCB・American Express）をご利用いただけます。銀行振込・コンビニ決済にも対応しています。ビジネスITプランのお客様には請求書払いもご用意しています。

返金には対応していますか？

はい。すべての年間プランに14日間の全額返金保証をご用意しています（理由を問いません）。月額制のビジネスITプランはいつでも解約可能で、未使用期間分を日割りでご返金いたします。

年間プランとビジネスITプランの違いは何ですか？

年間プランは個人・小規模チーム向けのアプリ設定とサポートが対象です。ビジネスITプランは、Web制作・システム運用・業務自動化・セキュリティ・専任担当者まで含む、企業向けの包括的な月額サブスクリプションです。

英語でのサポートは可能ですか？

はい。日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語で、メール・チャット・Web会議にて完全対応いたします。

SWE-Bench Verified：2026 Q2 リーダーボード解読と Pro 移行の論点 — KGA Tech Blog

SWE-Bench Verified の経緯

元の SWE-Bench は Princeton の Carlos Jimenez らが 2023 年に発表し、実際の GitHub issue と PR を使ってモデルが本物のバグ修正を行えるかを測った。2024 年 8 月、OpenAI が「Introducing SWE-bench Verified」で 500 問の人手検証済みサブセットを公開し、ノイズ問題（テストが曖昧、issue が不完全等）を除いた版が事実上の主流ベンチになった。

2026 Q2 の上位スコア

公開情報によれば (2026-04 時点)、SWE-Bench Verified は Claude Mythos Preview が 93.9%、GPT-5.3 Codex が 85.0%、Claude Opus 4.5 が 80.9% と報告される。年初に 60% 台だった上位スコアが半年以内に 80-90% に跳ね、ベンチが急速に飽和に向かっている。OpenAI は 2026 年初頭に Verified の自社スコア更新を停止し、Scale が運営する SWE-Bench Pro を推奨する姿勢に転じたと報告される。

Verified と Pro のギャップ

同じモデルが Verified で 93.9% を取りつつ、SWE-Bench Pro では 45.9% にとどまるという報告（Scale Labs リーダーボード）が、ベンチ飽和の本質を露わにした。Pro は (1) 学習データに含まれにくいリポジトリ、(2) より長い修正系列、(3) 隠されたテストケース、で構成され、汚染と暗記による上振れを抑制する設計だ。実務的に「Verified 90% 超」と「Pro 45%」のどちらが本番性能を予測するかは、後者であることが多いと示唆される。

スコアを鵜呑みにしないための着眼点

発表スコアを評価するときに確認すべき項目を挙げる。第一に scaffold（エージェント実装、ツール、リトライ回数）が公開されているか。SWE-Bench は素のモデル能力ではなく「モデル + エージェント + ツール」のシステム能力を測る。第二に pass@k の k が 1 か複数か。第三にコスト・実行時間。1 問あたり数十ドル消費する scaffold で得たスコアは、本番運用に即つながらない。第四にリポジトリ分布が学習カットオフ以降か（汚染リスクの間接的指標）。

採用判断への接続

KGA IT のような SI が顧客向けにコード生成エージェントを評価する場合、(1) Verified スコアでベースライン、(2) Pro で汚染抑制版、(3) 顧客リポジトリ由来の私的ホールドアウト、の三段で並べる。ベンダー資料の Verified 単体での「90% 越え」をそのまま提案書に転載するのは、2025 年以前の実務水準であり、2026 年では避けるべき形に変わった。

ベンチ進化の次のステップ

SWE-Bench Pro 以降、コミュニティでは「複数リポジトリにまたがる修正」「設計変更を含む大規模リファクタ」「セキュリティパッチの適用」など、より長期・横断的なタスクをカバーする後継ベンチの議論が進むと報告される。Verified のスコアが落ち着く一方、エージェント・ツール・コストの観点で評価軸が増えていくのが 2026 年後半の方向だ。

SWE-Bench Verified：2026 Q2 リーダーボード解読と Pro 移行の論点