KGAはどのようなITサービスを提供していますか？

KGAは、ソフトウェア導入・設定、SaaSシステムの保守運用、アプリケーション設定代行、テクニカルサポート、デジタルコンサルティング（ウェブサイト制作含む）、セキュリティ対策、データ管理・バックアップなど、包括的なITサポートサービスを提供しています。

対応エリアはどこですか？

静岡県湖西市を拠点に、リモートサポートで全国対応しています。訪問サポートは東海圏を中心に対応しております。

契約前に相談できますか？

はい、初回のご相談・お見積もりは完全無料です。お客様のIT課題をお聞かせいただき、最適なソリューションをご提案いたします。

緊急対応は可能ですか？

はい、Business プラン（月額）では24時間緊急対応が可能です。Annual Basic および Annual Premium プランでは営業時間内の優先対応を行っています。

海外のテレビアプリの設定もできますか？

はい、海外のテレビアプリケーションやメディアプレーヤーの導入・設定をサポートしています。合法的な海外コンテンツへのアクセス環境を構築いたします。

多言語でのサポートは可能ですか？

日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語でサポートを提供しています。

初期費用や隠れた料金はありますか？

一切ございません。表示価格はすべて税込の最終金額です。初期費用・隠れた請求・想定外の追加料金は発生しません。表示価格のままお支払いいただけます。

途中でプランを変更できますか？

はい、いつでも変更・解約いただけます。アップグレードは即時適用し、差額を日割りでご請求いたします。ダウングレードは次回更新時からの適用となります。

利用可能な支払い方法を教えてください。

StripeおよびKomoju経由で主要クレジットカード（Visa・Mastercard・JCB・American Express）をご利用いただけます。銀行振込・コンビニ決済にも対応しています。ビジネスITプランのお客様には請求書払いもご用意しています。

返金には対応していますか？

はい。すべての年間プランに14日間の全額返金保証をご用意しています（理由を問いません）。月額制のビジネスITプランはいつでも解約可能で、未使用期間分を日割りでご返金いたします。

年間プランとビジネスITプランの違いは何ですか？

年間プランは個人・小規模チーム向けのアプリ設定とサポートが対象です。ビジネスITプランは、Web制作・システム運用・業務自動化・セキュリティ・専任担当者まで含む、企業向けの包括的な月額サブスクリプションです。

英語でのサポートは可能ですか？

はい。日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語で、メール・チャット・Web会議にて完全対応いたします。

DeepSeek + 日本語埋め込みで作る業務 RAG: チャンク戦略から評価まで — KGA Tech Blog

前提と設計方針

社内文書 5 万件規模の業務 RAG を、DeepSeek V3.2 を生成側に、日本語に強い埋め込みモデルを検索側に置いて構築する。要件は (1) 月額 100 万円以下、(2) Tokyo 完結、(3) 検索精度 nDCG@10 で 0.65 以上、の 3 つ。

アーキテクチャ

``` 社内ドキュメント → Unstructured → チャンク → Sarashina-Embedding 1.3B ↓ Qdrant (Tokyo VPC) ↑ ユーザー質問 → クエリ拡張 → ハイブリッド検索 (BM25 + Dense) → リランカー (bge-reranker-ja-large) → DeepSeek V3.2 (回答生成) ```

チャンク戦略

固定長 512 トークンの単純分割では文意が切れる事故が多いため、Recursive splitter で見出し・段落・文の階層を尊重しつつ、最大 800 トークン / オーバーラップ 80 トークンを採用。表は別チャンクとして markdown table のまま保持し、メタデータに `type=table` を付与する。

埋め込みモデルの選定

| モデル | 次元 | nDCG@10 (内部) | レイテンシ | | --- | --- | --- | --- | | multilingual-e5-large | 1024 | 0.61 | 速い | | Sarashina-Embedding-v1-1B | 1792 | 0.68 | 中 | | bge-m3 | 1024 | 0.63 | 速い | | OpenAI text-embedding-3-large | 3072 | 0.64 | 遅い |

社内 R&D の評価セット（業務 FAQ 1,200 ペア）では Sarashina-Embedding が最も高かった。ただし Sarashina は埋め込みのみライセンスを確認の上で利用すること。

ハイブリッド検索とリランキング

BM25（Tantivy）と Dense Retrieval の上位 50 件をマージし、bge-reranker-ja-large で 10 件に絞る。Reranker は CPU でも十分速く、社内 R&D では p95 が 220ms 程度に収まった。

生成プロンプト

```text あなたは社内 FAQ 担当です。以下の参考文書のみを根拠に回答してください。参考文書に答えが含まれない場合は「該当する社内資料が見つかりませんでした」と答えてください。

# 参考文書 {retrieved_chunks}

# 質問 {question}

# 回答（参考文書の引用元IDを末尾に付与すること） ```

評価

nDCG@10 / Recall@10: 検索品質
Faithfulness（参考文書に基づくか）: LLM-as-a-Judge で 5 段階評価
Answer Relevance: 同上
Latency p50/p95

社内 R&D の最終構成で nDCG@10 = 0.71、Faithfulness 平均 4.4/5、p95 レイテンシ 3.8 秒。

まとめ

DeepSeek V3.2 を生成側に据えた日本語 RAG は、埋め込みとリランカーの選定さえ正しく行えば、Claude / GPT-4o ベースに見劣りしない品質を月額 80-120 万円で実現できる。最大の差分は埋め込みモデルの日本語対応度なので、ここに 2 週間ほど評価工数を割く価値がある。

DeepSeek + 日本語埋め込みで作る業務 RAG: チャンク戦略から評価まで