Anong mga IT services ang inaalok ng KGA?

Nagbibigay ang KGA ng komprehensibong IT support services kabilang ang software installation at setup, SaaS system maintenance, application configuration, technical support, digital consulting (kabilang ang website development), security services, at data management & backup solutions.

Saan kayo nagse-serve?

Nakabase sa Kosai, Shizuoka, nagbibigay kami ng remote support sa buong Japan. Available ang on-site support pangunahin sa Tokai region.

Maaari ba akong kumonsulta bago pumirma ng kontrata?

Oo, libreng-libre ang initial consultation at estimates. Pakikinggan namin ang IT challenges ninyo at magmumungkahi ng pinakamainam na solusyon.

May emergency support ba?

Oo, kasama sa Business plan (buwanan) ang 24-oras na emergency support. May priority response ang Annual Basic at Annual Premium plans sa oras ng negosyo.

Pwede ba kayong mag-setup ng international TV apps?

Oo, sinusuportahan namin ang pag-install at configuration ng international TV applications at media players. Tinutulungan naming mag-setup ng legal na access sa international content.

May multilingual support ba kayo?

Sumusuporta kami sa 9 na wika: Japanese, English, Portuguese, Korean, Chinese, Malay, Filipino, Vietnamese, at Spanish.

May setup fee ba o nakatagong singil?

Wala. Lahat ng ipinapakitang presyo ay final at kasama na ang buwis. Walang setup fee, walang nakatagong singil, at walang surprise invoice. Ang nakikita mo ang eksaktong babayaran mo.

Maaari ba akong magpalit ng plano mamaya?

Oo. Maaari kang mag-upgrade, mag-downgrade, o mag-cancel anumang oras. Ang upgrade ay agad na magkakabisa at iko-compute namin ang difference nang pro-rated. Ang downgrade ay magkakabisa sa susunod na renewal cycle.

Anong mga paraan ng pagbabayad ang tinatanggap ninyo?

Tinatanggap namin ang lahat ng pangunahing credit card (Visa, Mastercard, JCB, American Express) sa pamamagitan ng Stripe at Komoju, pati na rin ang bank transfer at convenience store payment sa Japan. Available ang invoicing para sa mga customer ng Business IT Plan.

Oo. Nag-aalok kami ng 14-day money-back guarantee sa lahat ng annual plan — walang tatanungin. Ang monthly subscription ng Business IT Plan ay maaaring i-cancel anumang oras na may pro-rated refund para sa hindi nagamit na serbisyo.

Ano ang pagkakaiba ng annual plans at Business IT Plan?

Sinasakop ng annual plans ang app configuration at suporta para sa mga indibidwal at maliliit na team. Ang Business IT Plan ay isang komprehensibong monthly subscription para sa mga kumpanyang nangangailangan ng website development, system management, automation, security at dedicated account manager.

Nagbibigay ba kayo ng suporta sa Filipino?

Oo. Ang aming team ay nagbibigay ng buong multilingual na suporta sa Hapon, Ingles, Portuges, Koreano, Intsik, Malay, Filipino, Vietnamese at Espanyol — sa pamamagitan ng email, chat at scheduled video calls.

オンデバイスSLM 2026：Phi-4・Gemma 3・Llama 3.3 8B量子化で8GB RAMに何が載るか — KGA Tech Blog

オンデバイスSLMは「全てをクラウドに投げる」アーキテクチャからの離脱点として注目を集めている。レイテンシ、プライバシー、オフライン動作、そしてコストの4点で上位モデルに勝ち目があるからだ。2026年時点で実用レンジに入った代表格が Microsoft Phi-4（14B／mini 3.8B）、Google Gemma 3（4B／12B／27B）、Meta Llama 3.3 8B 系統である。本稿ではこれらを「8GB RAM の民生機に載る」前提で比較する。

量子化とメモリ消費の基本

FP16（半精度）での重みサイズはおおむね「パラメータ数 × 2 バイト」。8Bモデルなら約16GBで、8GB RAM には載らない。ここで登場するのが量子化である。INT8 で約半分、Q4_K_M（llama.cpp の4bit量子化）で概ね 1/4 まで縮む。8Bモデルの Q4_K_M は約4.5〜5.2GB 程度が目安で、KVキャッシュとOS常駐分を含めて 8GB RAM ギリギリに収まる。Phi-4 mini（3.8B）なら Q4 で 2〜2.5GB 程度となり、余裕がある。

Phi-4（Microsoft）

Microsoft が2024年末に公開した Phi-4 は合成データ重視のトレーニングで、数学・推論ベンチで同クラスを上回る傾向が公式テクニカルレポートで報告されている（未検証の独自ベンチではない）。mini 版（3.8B）はモバイル・組み込みを明確に意識した位置づけで、ライセンスは MIT 系に近い寛容な条件。日本語は「通じる」が、母語話者レベルの自然さはまだ物足りない印象で、翻訳用途や要約用途に寄せるのが無難だ。

Gemma 3（Google）

Gemma 3 は 4B／12B／27B の3サイズ展開で、4B がオンデバイスの主力候補。公式発表ではマルチモーダル対応（画像入力）と 128K コンテキストが特徴とされ、8GB RAM でも Q4 量子化で動作が可能とされている（実測は環境依存）。ライセンスは Gemma Terms of Use で、商用利用に追加条件がある点は事前確認が必須。日本語の自然さは Phi-4 より優位との評価が散見されるが、用途により逆転もある。

Llama 3.3 8B 系統

Meta の Llama 3.3 は 70B が主力だが、派生・ファインチューン版で 8B 級のバリアントが流通している。Llama.cpp・Ollama・LM Studio 等のエコシステムが最も成熟しており、ツール連携・プロンプト資産の再利用性で実務上の優位がある。ライセンスは Llama Community License で、月間アクティブユーザー7億超の企業には別契約が要る。

性能の天井

SLM はいずれも「長文の論理的破綻」「マルチステップのツール呼び出し精度」「専門知識の深さ」で上位モデルに届かない。エージェント的運用をオンデバイスで回すのは2026年時点ではまだ厳しく、用途は要約、下書き、翻訳、分類、RAG のリーダー役などに限定した方がいい。ルーティング（簡単なものはSLM、難しいものはクラウド）構成が現実解である。

選び方の指針

日本語の自然さ重視なら Gemma 3 4B、軽量さと数学/推論なら Phi-4 mini、エコシステム・ツール資産を活かすなら Llama 3.3 8B 派生。いずれも本番投入前には自社タスクでの実測が必須で、公開ベンチマークだけで決めるのは禁物だ。

実行環境の選択

macOS 環境では Apple Silicon の Metal アクセラレーションに最適化された llama.cpp／MLX が事実上の標準。Windows は CUDA が使えるなら llama.cpp か Ollama、CPU のみなら量子化レベルを Q4 より下げる必要がある場合もある。Linux サーバでは vLLM や TGI がスループット重視で強いが、単一クライアントの会話用途なら llama.cpp で十分なことが多い。モバイル（iOS／Android）では MLC LLM や llama.cpp の派生ビルドが選択肢になる。

KVキャッシュとコンテキスト長

忘れがちなのが KVキャッシュのメモリ消費だ。8Bモデルで 8K トークンのコンテキストを保持すると、キャッシュだけで 1〜2GB 程度食う場合があり、RAM の見積もりが狂う。長文要約や RAG で大きなコンテキストを張る用途では、コンテキスト長を現実的な範囲に絞るか、量子化レベルをさらに下げるトレードオフが発生する。

ライセンスとオフライン配布

オンデバイス配布では「アプリにモデルを同梱するか」「初回起動時にダウンロードするか」の設計も重要だ。モデルファイルは数GB級になり、アプリサイズと配信コストに直結する。Phi-4 の MIT 系寛容ライセンスは再配布も含めて最も扱いやすい部類で、Gemma・Llama は条件付きのため、配布形態を含めた法務確認を最初のスプリントに入れることを推奨する。

オンデバイスSLM 2026：Phi-4・Gemma 3・Llama 3.3 8B量子化で8GB RAMに何が載るか