Apakah perkhidmatan IT yang KGA tawarkan?

KGA menyediakan perkhidmatan sokongan IT yang menyeluruh termasuk pemasangan dan penyediaan perisian, penyelenggaraan sistem SaaS, konfigurasi aplikasi, sokongan teknikal, perundingan digital (termasuk pembangunan laman web), perkhidmatan keselamatan serta pengurusan data & sandaran.

Kawasan manakah yang anda sokong?

Berpangkalan di Kosai, Shizuoka, kami menyediakan sokongan jarak jauh di seluruh Jepun. Sokongan di tapak tertumpu di rantau Tokai.

Bolehkah saya berunding sebelum menandatangani kontrak?

Ya, perundingan awal dan anggaran adalah percuma sepenuhnya. Kami akan mendengar cabaran IT anda dan mencadangkan penyelesaian terbaik.

Adakah sokongan kecemasan tersedia?

Ya, pelan Business (bulanan) merangkumi sokongan kecemasan 24 jam. Pelan Annual Basic dan Annual Premium menyediakan respons keutamaan semasa waktu bekerja.

Bolehkah anda menyediakan aplikasi TV antarabangsa?

Ya, kami menyokong pemasangan dan konfigurasi aplikasi TV antarabangsa serta pemain media. Kami membantu menyediakan persekitaran akses sah kepada kandungan antarabangsa.

Adakah anda menyediakan sokongan berbilang bahasa?

Kami menyokong 9 bahasa: Jepun, Inggeris, Portugis, Korea, Cina, Melayu, Filipino, Vietnam dan Sepanyol.

Adakah terdapat yuran pemasangan atau caj tersembunyi?

Tidak. Semua harga yang dipaparkan adalah harga akhir dan termasuk cukai. Tiada yuran pemasangan, caj tersembunyi atau invois mengejut. Anda bayar tepat seperti yang dipaparkan.

Bolehkah saya menukar pelan kemudian?

Boleh. Anda boleh menaik taraf, menurun taraf atau membatalkan pada bila-bila masa. Naik taraf berkuat kuasa serta-merta dan kami akan mengira perbezaan secara pro-rata. Turun taraf berkuat kuasa pada kitaran pembaharuan seterusnya.

Kaedah pembayaran apakah yang anda terima?

Kami menerima semua kad kredit utama (Visa, Mastercard, JCB, American Express) melalui Stripe dan Komoju, serta pindahan bank dan pembayaran kedai serbaneka di Jepun. Pembayaran melalui invois tersedia untuk pelanggan Business IT Plan.

Adakah anda menawarkan bayaran balik?

Ya. Kami menawarkan jaminan bayaran balik 14 hari untuk semua pelan tahunan — tanpa soalan. Langganan bulanan Business IT Plan boleh dibatalkan pada bila-bila masa dengan bayaran balik pro-rata untuk tempoh yang tidak digunakan.

Apakah perbezaan antara pelan tahunan dan Business IT Plan?

Pelan tahunan merangkumi konfigurasi aplikasi dan sokongan untuk individu dan pasukan kecil. Business IT Plan ialah langganan bulanan menyeluruh untuk syarikat yang memerlukan pembangunan laman web, pengurusan sistem, automasi, keselamatan dan pengurus akaun khusus.

Adakah anda menyediakan sokongan dalam Bahasa Melayu?

Ya. Pasukan kami menyediakan sokongan berbilang bahasa yang lengkap dalam bahasa Jepun, Inggeris, Portugis, Korea, Cina, Melayu, Filipina, Vietnam dan Sepanyol — melalui e-mel, sembang dan panggilan video yang dijadualkan.

NIMカスタマイズ実践：LoRAホットスワップ・PEFT統合・BYOMパターン — KGA Tech Blog

NIMを採用するかの議論で必ず挙がるのが「カスタマイズ余地」だ。NVIDIAの公開ドキュメントとNIM CLIの仕様から読み取れる範囲で、実運用に効くカスタマイズパターンを4つ整理する。

LoRAアダプタのホットスワップ

NIMはマルチLoRA推論に対応しており、起動時に`NIM_PEFT_SOURCE`でローカルディレクトリまたはNGCレジストリを指定すると、複数のLoRAアダプタをロードできる。リクエスト時に`model`フィールドで`base-model:lora-adapter-id`の形で指定すれば、同一ベースモデル上で異なるアダプタを同時に推論できる。内部的にはTensorRT-LLMのmulti-LoRA kernelが、バッチ内で異なるアダプタ重みをswapしながらGEMMを実行する方式だ。この仕組みがあるので、顧客別・タスク別の微調整モデルを数百規模で運用しても、GPUインスタンスを分割する必要がない。

PEFTワークフロー統合

HuggingFace PEFT（`peft`ライブラリ）で生成した`adapter_model.safetensors`と`adapter_config.json`を、NIMが期待するディレクトリ配置に置くだけでロード可能なケースが多い。NeMo Frameworkでトレーニングした場合は`.nemo`形式からの変換スクリプトも提供されている。実運用では、MLflow等のモデルレジストリにadapterをアーティファクトとして登録し、CIで`NIM_PEFT_SOURCE`配下に同期するパイプラインを組むのが定石だ。

カスタムトークナイザとシステムプロンプト

NIMコンテナには`tokenizer.json`と`tokenizer_config.json`が同梱されるが、チャットテンプレート（`chat_template`）を組織固有のものに差し替えたい場合は、モデルディレクトリをマウントで上書きする。OpenAI互換APIの`messages`配列からrawプロンプトへの組立ロジックがここに依存するので、社内用の「常時システムプロンプト」を混ぜ込む実装ポイントとしても有効だ。

BYOMとengineの再ビルド

NGCにないモデル（社内で事前学習したLlamaアーキテクチャ派生など）をNIMフォーマットで動かすには、`trtllm-build`でTensorRT-LLM engine planをビルドし、NIMが期待するメタデータを添えてコンテナに同梱する必要がある。ビルド時にbatch size/sequence length/parallelism（TP・PP）を決め打ちするため、プロファイル設計が重要だ。典型的にはシングルGPU向けとTP=2・TP=4のプロファイルを用意し、起動時のGPU数に応じて選択させる。

注意点

LoRAのランク・ターゲットモジュールがベースモデルの対応範囲外だと、ロード時にエラーまたは性能劣化を起こす。対応モジュール一覧はベースごとに異なるので、事前確認が必須。また、量子化済みベースモデル（FP8/INT4）上でのLoRA適用は制約が多いため、重要な変更は再コンパイルも検討したほうが良い。

NIMカスタマイズ実践：LoRAホットスワップ・PEFT統合・BYOMパターン

LoRAアダプタのホットスワップ

PEFTワークフロー統合

カスタムトークナイザとシステムプロンプト

BYOMとengineの再ビルド

注意点

技術的な課題を一緒に解決しませんか？