KGAはどのようなITサービスを提供していますか？

KGAは、ソフトウェア導入・設定、SaaSシステムの保守運用、アプリケーション設定代行、テクニカルサポート、デジタルコンサルティング（ウェブサイト制作含む）、セキュリティ対策、データ管理・バックアップなど、包括的なITサポートサービスを提供しています。

対応エリアはどこですか？

静岡県湖西市を拠点に、リモートサポートで全国対応しています。訪問サポートは東海圏を中心に対応しております。

契約前に相談できますか？

はい、初回のご相談・お見積もりは完全無料です。お客様のIT課題をお聞かせいただき、最適なソリューションをご提案いたします。

緊急対応は可能ですか？

はい、Business プラン（月額）では24時間緊急対応が可能です。Annual Basic および Annual Premium プランでは営業時間内の優先対応を行っています。

海外のテレビアプリの設定もできますか？

はい、海外のテレビアプリケーションやメディアプレーヤーの導入・設定をサポートしています。合法的な海外コンテンツへのアクセス環境を構築いたします。

多言語でのサポートは可能ですか？

日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語でサポートを提供しています。

初期費用や隠れた料金はありますか？

一切ございません。表示価格はすべて税込の最終金額です。初期費用・隠れた請求・想定外の追加料金は発生しません。表示価格のままお支払いいただけます。

途中でプランを変更できますか？

はい、いつでも変更・解約いただけます。アップグレードは即時適用し、差額を日割りでご請求いたします。ダウングレードは次回更新時からの適用となります。

利用可能な支払い方法を教えてください。

StripeおよびKomoju経由で主要クレジットカード（Visa・Mastercard・JCB・American Express）をご利用いただけます。銀行振込・コンビニ決済にも対応しています。ビジネスITプランのお客様には請求書払いもご用意しています。

返金には対応していますか？

はい。すべての年間プランに14日間の全額返金保証をご用意しています（理由を問いません）。月額制のビジネスITプランはいつでも解約可能で、未使用期間分を日割りでご返金いたします。

年間プランとビジネスITプランの違いは何ですか？

年間プランは個人・小規模チーム向けのアプリ設定とサポートが対象です。ビジネスITプランは、Web制作・システム運用・業務自動化・セキュリティ・専任担当者まで含む、企業向けの包括的な月額サブスクリプションです。

英語でのサポートは可能ですか？

はい。日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語で、メール・チャット・Web会議にて完全対応いたします。

DeepSeek の日本語性能を測る: JMMLU・JCommonSenseQA・AI王の独自検証 — KGA Tech Blog

なぜ独自検証が必要か

公式リーダーボードの英語スコアは充実してきたが、日本語タスクは依然として情報が散逸している。本稿では Stability-AI の lm-evaluation-harness 日本語ブランチをベースに、DeepSeek V3.2 / R1 を含む 5 モデルを共通条件で測定した結果を共有する。

評価条件

データセット: JMMLU (50 サブジェクト)、JCommonSenseQA、AI王 dev split
few-shot: 5-shot for JMMLU, 0-shot for JCommonSenseQA, 0-shot for AI王
温度 0、トップ-p 1、最大出力 256 トークン
評価器: 厳密一致 + 正規化（記号・空白・全角半角）

結果

| モデル | JMMLU | JCommonSenseQA | AI王 | | --- | --- | --- | --- | | DeepSeek V3.2 | 73.4 | 84.1 | 71.8 | | DeepSeek R1 | 75.2 | 85.6 | 73.3 | | Qwen2.5-72B-Instruct | 71.6 | 82.4 | 69.5 | | Claude 3.5 Sonnet | 78.9 | 88.7 | 76.4 | | GPT-4o-mini | 70.1 | 81.3 | 68.2 |

DeepSeek 系列は同価格帯（GPT-4o-mini）と比較すると明確に上位、Qwen2.5-72B-Instruct とほぼ同等で R1 がやや優位、上限の Claude 3.5 Sonnet には 3-5 ポイント届かない、というのが社内 R&D での結論である。

質的観察

古文・漢文の知識は Qwen2.5 がやや強い
数学・物理は R1 が圧倒的に安定（推論プロセスを内部で展開する効果）
法律・医療の専門タスクは Claude 3.5 Sonnet が抜きん出る
日常会話の自然さは GPT-4o-mini が依然として高い

プロンプト設計の留意点

DeepSeek 系列は日本語の few-shot 例が「答えのみ短文」のフォーマットを好む傾向があり、説明込みの few-shot を渡すと回答が冗長化しがちである。`Final Answer:` プレフィックスでの末尾抽出を強く推奨する。

```python SYSTEM = "あなたは日本語の試験問題を解くアシスタントです。説明は不要です。" USER = """問題: {question} 選択肢: A. {a} B. {b} C. {c} D. {d} Final Answer:""" ```

まとめ

DeepSeek 系列は日本語タスクでも「2026年時点で API 単価あたりの精度がほぼ最強」という位置づけで、コスト最適化を優先する SMB 案件には素直に選びやすい。最高精度が必要なら Claude 3.5 Sonnet/Opus 4.5、知識特化型は Qwen2.5、汎用日常会話は GPT-4o-mini、という棲み分けが運用上は機能する。

DeepSeek の日本語性能を測る: JMMLU・JCommonSenseQA・AI王 の独自検証

なぜ独自検証が必要か

評価条件

結果

質的観察

プロンプト設計の留意点

まとめ

まずは無料相談から

DeepSeek の日本語性能を測る: JMMLU・JCommonSenseQA・AI王の独自検証