Quais serviços de TI a KGA oferece?

A KGA oferece serviços abrangentes de suporte de TI, incluindo instalação de software, manutenção de sistemas SaaS, configuração de aplicativos, suporte técnico, consultoria digital (incluindo criação de sites), serviços de segurança e gerenciamento de dados e backup.

Quais áreas vocês atendem?

Sediados em Kosai, Shizuoka, oferecemos suporte remoto em todo o Japão. Atendimento presencial concentrado na região de Tokai.

É possível consultar antes de contratar?

Sim, a consulta inicial e orçamentos são completamente gratuitos. Ouviremos seus desafios de TI e proporemos a solução ideal.

Há suporte de emergência?

Sim, o plano Business (mensal) inclui suporte de emergência 24 horas. Os planos Annual Basic e Annual Premium oferecem atendimento prioritário em horário comercial.

Vocês configuram apps de TV internacionais?

Sim, oferecemos suporte para instalação e configuração de aplicativos de TV internacionais e media players. Ajudamos a configurar ambientes para acesso legal a conteúdo internacional.

Oferecem suporte em múltiplos idiomas?

Atendemos em 9 idiomas: japonês, inglês, português, coreano, chinês, malaio, filipino, vietnamita e espanhol.

Existe alguma taxa de setup ou custo oculto?

Não. Todos os preços exibidos são finais e incluem impostos. Não há taxas de setup, cobranças ocultas ou faturas-surpresa. O valor que você vê é exatamente o que paga.

Posso trocar de plano depois?

Sim. Você pode fazer upgrade, downgrade ou cancelar a qualquer momento. Upgrades entram em vigor imediatamente e a diferença é calculada proporcionalmente. Downgrades valem a partir do próximo ciclo de renovação.

Quais formas de pagamento vocês aceitam?

Aceitamos todos os principais cartões de crédito (Visa, Mastercard, JCB, American Express) via Stripe e Komoju, além de transferência bancária e pagamento em lojas de conveniência no Japão. Pagamento via boleto/fatura está disponível para clientes do Business IT Plan.

Vocês oferecem reembolso?

Sim. Oferecemos garantia de reembolso de 14 dias em todos os planos anuais — sem perguntas. Assinaturas mensais do Business IT Plan podem ser canceladas a qualquer momento, com reembolso proporcional do período não utilizado.

Qual a diferença entre os planos anuais e o Business IT Plan?

Os planos anuais cobrem configuração e suporte de apps para indivíduos e pequenas equipes. O Business IT Plan é uma assinatura mensal abrangente para empresas que precisam de desenvolvimento web, gerenciamento de sistemas, automação, segurança e um gerente de conta dedicado.

Vocês oferecem suporte em português?

Sim. Nossa equipe oferece suporte multilíngue completo em japonês, inglês, português, coreano, chinês, malaio, filipino, vietnamita e espanhol — por e-mail, chat e videochamadas agendadas.

Mac で動かすローカル LLM 完全比較 2026: M4 Max 128GB と M4 Ultra (M3 Ultra 256GB) の実力 — KGA Tech Blog

なぜいま Mac でローカル LLM なのか

Apple Silicon の Unified Memory アーキテクチャは、CPU と GPU が同一の物理メモリプールを参照するため、巨大モデルを「VRAM 不足」で諦める必要がない。NVIDIA GeForce 系が 24〜32GB で詰まる中、M4 Max は 128GB、M3 Ultra Mac Studio は 256GB の Unified Memory を提供する。2026 年春時点で、これは 70B 級を Q4_K_M で完全オンメモリ実行できる、最も静かでコンパクトな選択肢である。

M4 Max / M4 Pro / M3 Ultra のスペック整理

公開情報によれば (2026-04時点) 各構成のメモリ帯域とコア数は以下の通り。

| チップ | 最大メモリ | メモリ帯域 | GPU コア | TDP 目安 | |---|---|---|---|---| | M4 (MacBook Air) | 32GB | 約 120 GB/s | 10 | 〜20W | | M4 Pro | 48GB | 約 273 GB/s | 16〜20 | 〜35W | | M4 Max | 128GB | 約 546 GB/s | 32〜40 | 〜60W | | M3 Ultra (Mac Studio) | 256GB | 約 819 GB/s | 60〜80 | 〜180W |

注意点として、2026 年 4 月時点の Mac Studio 上位は M3 Ultra のままで、M4 Ultra は未発表の前提で記述する。M4 Max 128GB の 546 GB/s は RTX 4090 の約半分の帯域だが、容量が約 5 倍ある点が決定的に重要だ。

実測トークン/秒: Llama 3.1 8B / 70B Q4_K_M

複数の公開ベンチを集約すると以下のレンジに収まる。

\`\`\`text Llama 3.1 8B Q4_K_M (llama.cpp / MLX) - M4 Pro 48GB: 約 35〜45 tok/s - M4 Max 128GB: 約 50〜60 tok/s - M3 Ultra 256GB: 約 70〜85 tok/s - 参考 RTX 4090: 約 130 tok/s

Llama 3.1 70B Q4_K_M (約 42GB) - M4 Max 128GB: 約 9〜12 tok/s - M3 Ultra 256GB: 約 14〜18 tok/s - 参考 RTX 5090 1枚: 約 22〜28 tok/s \`\`\`

tok/s 前後あれば対話 UX として実用的である。M4 Max 128GB は 70B Q4 をロードした後も 80GB 以上の余裕があり、長コンテキスト (32k〜128k) や RAG のドキュメント保持にも対応できる。

MLX か llama.cpp か

Apple Silicon 向けには 2 系統の主要ランタイムがある。

\`llama.cpp\` / \`Ollama\`: GGUF フォーマット、Metal バックエンド、Linux/Win との互換性が高い
\`mlx-lm\` / \`MLX\`: Apple 純正、PyTorch 風 API、量子化と推論がやや高速な場面あり

ベンチによっては MLX が llama.cpp 比 10〜20% 高速というケースが報告されているが、エコシステムの広さでは GGUF + Ollama が依然優勢である。中小企業の社内導入では Ollama + Open WebUI の組み合わせが運用コストの面で最も無難だ。

Mac Studio M3 Ultra 256GB は誰のためか

GB 構成は約 ¥1,500,000 前後と高価だが、Llama 4 405B Q4 (約 220GB) や Qwen 3 235B 級を 1 台で回せる、業務用としては破格の選択肢である。Mac Studio は 240W TDP 級、騒音も最小限で、オフィスのデスクサイドに置ける「個人持ち AGI 級ワークステーション」として唯一無二だ。法人 IT として導入する場合、MDM / FileVault / Apple Business Manager の整備が前提となる点には注意したい。

ボトルネックと割り切り: プロンプト処理速度

Mac の弱点はプロンプト処理 (prefill) の遅さである。NVIDIA GPU 比で 1/3 〜 1/5 程度しか出ず、長い RAG コンテキストを毎回投げる用途では待ち時間が顕在化する。対策としては (1) KV キャッシュの再利用、(2) 文脈の圧縮 / 要約、(3) サマライザを別の小モデルに分離、といったアーキテクチャ工夫が有効である。

結論: Mac は「静音・大容量・省電力」のスイートスポット

電源容量・騒音・設置場所の制約がある中小企業の現場では、M4 Max 128GB MacBook Pro + Ollama という構成が、70B 級ローカル LLM の最短導入ルートである。サーバー室を持たないお客様向けに、KGA IT でも Mac ベースのローカル LLM 構築支援を提供している。NVIDIA GPU との使い分けは、推論スループット要件と稼働モデル数で判断すれば良い。

Mac で動かすローカル LLM 完全比較 2026: M4 Max 128GB と M4 Ultra (M3 Ultra 256GB) の実力