KGAはどのようなITサービスを提供していますか？

KGAは、ソフトウェア導入・設定、SaaSシステムの保守運用、アプリケーション設定代行、テクニカルサポート、デジタルコンサルティング（ウェブサイト制作含む）、セキュリティ対策、データ管理・バックアップなど、包括的なITサポートサービスを提供しています。

対応エリアはどこですか？

静岡県湖西市を拠点に、リモートサポートで全国対応しています。訪問サポートは東海圏を中心に対応しております。

契約前に相談できますか？

はい、初回のご相談・お見積もりは完全無料です。お客様のIT課題をお聞かせいただき、最適なソリューションをご提案いたします。

緊急対応は可能ですか？

はい、Business プラン（月額）では24時間緊急対応が可能です。Annual Basic および Annual Premium プランでは営業時間内の優先対応を行っています。

海外のテレビアプリの設定もできますか？

はい、海外のテレビアプリケーションやメディアプレーヤーの導入・設定をサポートしています。合法的な海外コンテンツへのアクセス環境を構築いたします。

多言語でのサポートは可能ですか？

日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語でサポートを提供しています。

初期費用や隠れた料金はありますか？

一切ございません。表示価格はすべて税込の最終金額です。初期費用・隠れた請求・想定外の追加料金は発生しません。表示価格のままお支払いいただけます。

途中でプランを変更できますか？

はい、いつでも変更・解約いただけます。アップグレードは即時適用し、差額を日割りでご請求いたします。ダウングレードは次回更新時からの適用となります。

利用可能な支払い方法を教えてください。

StripeおよびKomoju経由で主要クレジットカード（Visa・Mastercard・JCB・American Express）をご利用いただけます。銀行振込・コンビニ決済にも対応しています。ビジネスITプランのお客様には請求書払いもご用意しています。

返金には対応していますか？

はい。すべての年間プランに14日間の全額返金保証をご用意しています（理由を問いません）。月額制のビジネスITプランはいつでも解約可能で、未使用期間分を日割りでご返金いたします。

年間プランとビジネスITプランの違いは何ですか？

年間プランは個人・小規模チーム向けのアプリ設定とサポートが対象です。ビジネスITプランは、Web制作・システム運用・業務自動化・セキュリティ・専任担当者まで含む、企業向けの包括的な月額サブスクリプションです。

英語でのサポートは可能ですか？

はい。日本語・英語・ポルトガル語・韓国語・中国語・マレー語・フィリピン語・ベトナム語・スペイン語の9言語で、メール・チャット・Web会議にて完全対応いたします。

NIMカスタマイズ実践：LoRAホットスワップ・PEFT統合・BYOMパターン — KGA Tech Blog

NIMを採用するかの議論で必ず挙がるのが「カスタマイズ余地」だ。NVIDIAの公開ドキュメントとNIM CLIの仕様から読み取れる範囲で、実運用に効くカスタマイズパターンを4つ整理する。

LoRAアダプタのホットスワップ

NIMはマルチLoRA推論に対応しており、起動時に`NIM_PEFT_SOURCE`でローカルディレクトリまたはNGCレジストリを指定すると、複数のLoRAアダプタをロードできる。リクエスト時に`model`フィールドで`base-model:lora-adapter-id`の形で指定すれば、同一ベースモデル上で異なるアダプタを同時に推論できる。内部的にはTensorRT-LLMのmulti-LoRA kernelが、バッチ内で異なるアダプタ重みをswapしながらGEMMを実行する方式だ。この仕組みがあるので、顧客別・タスク別の微調整モデルを数百規模で運用しても、GPUインスタンスを分割する必要がない。

PEFTワークフロー統合

HuggingFace PEFT（`peft`ライブラリ）で生成した`adapter_model.safetensors`と`adapter_config.json`を、NIMが期待するディレクトリ配置に置くだけでロード可能なケースが多い。NeMo Frameworkでトレーニングした場合は`.nemo`形式からの変換スクリプトも提供されている。実運用では、MLflow等のモデルレジストリにadapterをアーティファクトとして登録し、CIで`NIM_PEFT_SOURCE`配下に同期するパイプラインを組むのが定石だ。

カスタムトークナイザとシステムプロンプト

NIMコンテナには`tokenizer.json`と`tokenizer_config.json`が同梱されるが、チャットテンプレート（`chat_template`）を組織固有のものに差し替えたい場合は、モデルディレクトリをマウントで上書きする。OpenAI互換APIの`messages`配列からrawプロンプトへの組立ロジックがここに依存するので、社内用の「常時システムプロンプト」を混ぜ込む実装ポイントとしても有効だ。

BYOMとengineの再ビルド

NGCにないモデル（社内で事前学習したLlamaアーキテクチャ派生など）をNIMフォーマットで動かすには、`trtllm-build`でTensorRT-LLM engine planをビルドし、NIMが期待するメタデータを添えてコンテナに同梱する必要がある。ビルド時にbatch size/sequence length/parallelism（TP・PP）を決め打ちするため、プロファイル設計が重要だ。典型的にはシングルGPU向けとTP=2・TP=4のプロファイルを用意し、起動時のGPU数に応じて選択させる。

注意点

LoRAのランク・ターゲットモジュールがベースモデルの対応範囲外だと、ロード時にエラーまたは性能劣化を起こす。対応モジュール一覧はベースごとに異なるので、事前確認が必須。また、量子化済みベースモデル（FP8/INT4）上でのLoRA適用は制約が多いため、重要な変更は再コンパイルも検討したほうが良い。

NIMカスタマイズ実践：LoRAホットスワップ・PEFT統合・BYOMパターン

LoRAアダプタのホットスワップ

PEFTワークフロー統合

カスタムトークナイザとシステムプロンプト

BYOMとengineの再ビルド

注意点

技術的な課題を一緒に解決しませんか？