KGA cung cấp những dịch vụ IT nào?

KGA cung cấp dịch vụ hỗ trợ IT toàn diện bao gồm cài đặt và thiết lập phần mềm, bảo trì hệ thống SaaS, cấu hình ứng dụng, hỗ trợ kỹ thuật, tư vấn số (bao gồm phát triển website), dịch vụ bảo mật và quản lý dữ liệu & sao lưu.

Các khu vực bạn hỗ trợ?

Đặt tại Kosai, Shizuoka, chúng tôi cung cấp hỗ trợ từ xa trên toàn Nhật Bản. Hỗ trợ tại chỗ chủ yếu ở vùng Tokai.

Tôi có thể tư vấn trước khi ký hợp đồng không?

Có, tư vấn ban đầu và báo giá hoàn toàn miễn phí. Chúng tôi sẽ lắng nghe vấn đề IT của bạn và đề xuất giải pháp tối ưu.

Có hỗ trợ khẩn cấp không?

Có, gói Premium bao gồm hỗ trợ khẩn cấp 24 giờ. Gói Standard cũng có phản hồi ưu tiên trong giờ làm việc.

Bạn có thể cài đặt ứng dụng TV quốc tế không?

Có, chúng tôi hỗ trợ cài đặt và cấu hình các ứng dụng TV quốc tế và trình phát media. Chúng tôi giúp thiết lập môi trường truy cập hợp pháp vào nội dung quốc tế.

Bạn có hỗ trợ đa ngôn ngữ không?

Chúng tôi hỗ trợ 9 ngôn ngữ: tiếng Nhật, Anh, Bồ Đào Nha, Hàn, Trung, Mã Lai, Philippines, Việt và Tây Ban Nha.

Có phí cài đặt hoặc phí ẩn nào không?

Không. Tất cả giá hiển thị đều là giá cuối cùng đã bao gồm thuế. Không có phí cài đặt, phí ẩn hay hóa đơn bất ngờ. Bạn trả đúng những gì bạn thấy.

Tôi có thể đổi gói sau không?

Có. Bạn có thể nâng cấp, hạ cấp hoặc hủy bất cứ lúc nào. Việc nâng cấp có hiệu lực ngay lập tức và chúng tôi sẽ tính chênh lệch theo tỷ lệ ngày. Việc hạ cấp sẽ có hiệu lực vào chu kỳ gia hạn tiếp theo.

Bạn chấp nhận những phương thức thanh toán nào?

Chúng tôi chấp nhận tất cả các thẻ tín dụng chính (Visa, Mastercard, JCB, American Express) thông qua Komoju, cùng với chuyển khoản ngân hàng và thanh toán tại cửa hàng tiện lợi ở Nhật Bản. Khách hàng Business IT Plan có thể thanh toán qua hóa đơn.

Bạn có hoàn tiền không?

Có. Chúng tôi cung cấp bảo đảm hoàn tiền trong 14 ngày cho tất cả các gói hàng năm — không cần giải thích. Đăng ký Business IT Plan hàng tháng có thể hủy bất cứ lúc nào với khoản hoàn tiền theo tỷ lệ cho thời gian chưa sử dụng.

Sự khác biệt giữa các gói hàng năm và Business IT Plan là gì?

Các gói hàng năm bao gồm cấu hình ứng dụng và hỗ trợ cho cá nhân và nhóm nhỏ. Business IT Plan là một gói đăng ký hàng tháng toàn diện cho các công ty cần phát triển website, quản lý hệ thống, tự động hóa, bảo mật và người quản lý tài khoản riêng.

Bạn có hỗ trợ bằng tiếng Việt không?

Có. Đội ngũ của chúng tôi cung cấp hỗ trợ đa ngôn ngữ đầy đủ bằng tiếng Nhật, tiếng Anh, tiếng Bồ Đào Nha, tiếng Hàn, tiếng Trung, tiếng Mã Lai, tiếng Philippines, tiếng Việt và tiếng Tây Ban Nha — qua email, chat và các cuộc gọi video đã lên lịch.

AWS Bedrock trong môi trường sản xuất: Thực tiễn thiết kế và vận hành — KGA Tech Blog

なぜBedrockを選ぶのか

直接APIを叩けばいいのに、なぜAWS Bedrockを介する必要があるのか。この疑問は正当だが、本番環境を運用するとBedrockの価値が見えてくる。VPC内からプライベートエンドポイント経由でアクセスできる（データが公衆インターネットを通らない）、IAMによる細かいアクセス制御、CloudTrailによる全API呼び出しの監査ログ、既存のAWSインフラとのシームレスな統合。特に金融・医療・官公庁系のクライアントでは、これらのコンプライアンス要件が直接API利用を不可能にしている。

モデル選定の実際

年6月時点でBedrockが提供するモデル: Amazon Titan（Text/Embedding/Image）、Anthropic Claude 3.5 Sonnet/Haiku/Opus、Meta Llama 3.1 8B/70B/405B、Mistral Large/Small、Cohere Command R/R+、AI21 Jamba。

KGAの本番環境でのモデル使い分けを示す。メインの対話・分析: Claude 3.5 Sonnet（品質と速度のバランス最良）。大量バッチ処理: Claude 3.5 Haiku（コスト1/10で80%の品質）。コード生成: Llama 3.1 70B（Bedrockではオンデマンド課金で利用可能）。Embedding: Amazon Titan Embeddings v2（1024次元、日本語対応、$0.02/100万トークン）。

重要な注意点として、Bedrockでの利用にはモデルアクセスの有効化申請が必要だ。Claude Opusは現在も一部リージョンで利用制限がある。東京リージョン（ap-northeast-1）で利用可能なモデルは米国リージョンより少ないため、レイテンシとモデル選択肢のトレードオフを事前に確認すべきだ。

Guardrailsの設計

Bedrock Guardrailsは、LLMの入出力にポリシーベースのフィルタリングを適用する機能だ。KGAでは以下の4層のGuardrailsを設定している。

Content filters: 有害コンテンツ（暴力、性的表現、差別等）をHIGH感度でブロック。Denied topics: クライアント固有の禁止トピック（例: 競合他社の推奨、投資アドバイス等）をカスタム定義。Word filters: 機密用語、社内コードネーム等のブロックリスト。PII filter: 個人情報（氏名、電話番号、メールアドレス、マイナンバー等）の検出と自動マスキング。

特にPII filterは実用性が高い。ユーザーが入力に個人情報を含めてしまった場合でも、Guardrailsが自動的にマスキングしてからモデルに送信する。KGAのクライアント環境では月間約2,000件のPII含有リクエストを検出・マスキングしており、情報漏洩リスクの低減に大きく貢献している。

Guardrailsのレイテンシオーバーヘッドは入力フィルタリングで約50ms、出力フィルタリングで約30msだ。トータル80msの追加レイテンシは、ストリーミング応答では体感上ほぼ影響ない。

Knowledge BasesによるRAG構築

Bedrock Knowledge Basesは、マネージドRAGソリューションだ。S3にドキュメントをアップロードし、データソースを指定するだけで、チャンキング、Embedding生成、ベクトルDB格納、検索、プロンプト拡張までを自動処理する。

KGAが本番で使用している構成: データソース: S3（PDF、Word、HTML、約15,000ドキュメント）。チャンキング: Hierarchical chunking（親チャンク1500トークン、子チャンク300トークン）。Embedding: Amazon Titan Embeddings v2。ベクトルDB: Amazon OpenSearch Serverless。検索: Hybrid search（ベクトル検索 + キーワード検索の組み合わせ）。

Hierarchical chunkingが重要なポイントだ。検索時は子チャンクで精密にマッチングし、LLMへのコンテキスト注入時は親チャンクで広い文脈を提供する。固定サイズチャンキングと比較して、回答の文脈適合率が34%向上した。

コスト最適化

Bedrockのコストは「モデル推論」+「Knowledge Bases」+「Guardrails」の3要素で構成される。KGAの月間コスト実績を共有する。Claude 3.5 Sonnet推論（月間200万リクエスト）: $8,500。Claude 3.5 Haiku推論（月間500万リクエスト）: $1,200。Titan Embedding（月間1,000万チャンク）: $200。OpenSearch Serverless（ベクトルDB）: $700。Guardrails（月間700万評価）: $525。合計: 約$11,125/月。

コスト削減の最大レバレッジはモデルの使い分けだ。全リクエストをSonnetで処理していた初期は月額$22,000だったが、Haikuへのルーティング導入で約50%削減した。Provisioned Throughputも検討したが、KGAの利用パターンでは日中と夜間のトラフィック差が大きく、オンデマンド課金の方が有利だった。

AWS Bedrock trong môi trường sản xuất: Thực tiễn thiết kế và vận hành

なぜBedrockを選ぶのか

モデル選定の実際

Guardrailsの設計

Knowledge BasesによるRAG構築

コスト最適化

Cùng giải quyết các thách thức kỹ thuật của bạn.