Skip to content
返回项目列表
AI / 机器学习Beta

AIRA — AI 聊天机器人平台

AIRA — Multi-tenant Conversational AI Platform

多租户 RAG 架构的 AI 聊天机器人研发原型,整合 pgvector、HyDE 检索、LLM 网关与 OpenTelemetry 可观测性,用于探索客服自动化的技术边界。

2026 内部研发中 2026-03
#RAG#Vector Search#LLM Gateway#Streaming#Observability#Multi-tenant

在线演示

实际应用界面预览

DEMO
app.aira.jp/dashboard
本日の対話数
2,847
+12%
平均応答時間
1.2秒
-45%
解決率
94.2%
+8%
満足度
4.8/5
+0.3

AIRA アシスタント

オンライン

感情: ポジティブ

注文した商品がまだ届きません。追跡番号はTK-29384です。

お問い合わせありがとうございます。追跡番号TK-29384を確認いたしました。現在、お荷物は配送センター(大阪)を出発し、本日18:00〜20:00の間にお届け予定です。配送状況をリアルタイムで確認できるリンクをお送りしますね。

ありがとう!それと、返品したい商品もあるのですが。

かしこまりました。返品についてお手伝いいたします。ご購入履歴を確認したところ、以下の商品が返品対象期間内です: • ワイヤレスヘッドホン WH-200(¥12,800) • USBハブ 7ポート(¥3,980) どちらの商品の返品をご希望ですか?

挑战

在内部仿真场景下,当月咨询量假设达到 10 万条以上时,平均响应时间会超过 48 小时,客服人力成本也会出现结构性膨胀。

解决方案

基于 GPT 构建聊天核心,并集成 FAQ 学习、情感分析与自动升级机制,形成内部试点系统。管理后台实时追踪响应率与 CSAT 指标,目前正使用内部数据集进行迭代调优。

成果

  • 内部验证数据显示响应时间由 48 小时降至 30 秒
  • 仿真场景下客服成本预计可降低约 62%
  • 内部测试中 CSAT 指标提升 34%
  • 试点环境已通过月均 15 万条咨询的压力测试
Key Metrics

Measured Impact

検索 nDCG@10

0.88

+42%

回答根拠提示率

94.2%

+31pt

平均TTFT

780ms

-36%

月次コスト変動

±8%

Features

What it does

検索と生成

ハイブリッド検索

密ベクトル + BM25 + HyDE書き換えで略語や社内用語にも強い検索を実現。

引用付き応答

回答文の各主張に対して出典ドキュメントIDと該当箇所のスパンを返却。

プラットフォーム

LLM Gateway

OpenAI / Anthropic / Bedrock / Ollamaを統一インターフェースで扱い、重み付きフォールバックを実現。

マルチテナント隔離

PostgresのRLSとネームスペース付きHNSWインデックスでテナント境界を強制。

運用性

プロンプトトレーシング

全リクエストをOpenTelemetryスパンで記録し、DatadogとSentryに連携。

コスト可視化

トークン数とモデル別コストをリアルタイムで集計し、テナント別に制限可能。

Architecture

System Layers

Layered architecture showing components, responsibilities, and data flow.

L1

Layer

Edge / API

認証、レート制限、テナント解決を担うエッジ層。Streamed Server Actionsで段階的UI更新をサポート。

Next.js App RoutertRPCEdge Middleware
L2

Layer

Orchestration

LangGraphの有向グラフで検索→再ランキング→ツール実行→合成の多段ワークフローを管理。

LangGraphLLM GatewayTool Router
L3

Layer

Retrieval

密ベクトルと疎ベクトルのハイブリッド検索。日本語はSudachiで形態素分割した独自トークナイザを採用。

pgvector HNSWBM25 (tsvector)Cross-encoder Reranker
L4

Layer

Data & State

会話履歴はPostgres、セマンティックキャッシュはRedis、生ドキュメントはS3で管理。

PostgreSQL 16Redis StreamsS3互換オブジェクトストレージ
L5

Layer

Observability

全リクエストにtrace-idを付与し、プロンプト・コンテキスト・コスト・レイテンシを相関分析。

OpenTelemetryDatadog APMSentryPrompt Logs
Development Process

How we built it

01

Discovery

社内FAQとSlackログから頻出質問カテゴリを抽出し、対話AIで解決可能なユースケースを定量評価。

Deliverables

  • ユースケース優先度マップ
  • ROI見積もり
  • 制約ドキュメント
02

Offline評価基盤

LLMjudge + 人手ラベリングのハイブリッド評価基盤を構築し、CIで回帰検出できるようにした。

Deliverables

  • 評価データセット v1
  • CI統合テスト
  • 品質ダッシュボード
03

Architecture & Spike

LangGraph vs 自作オーケストレータ、pgvector vs Qdrantのスパイク検証で技術選定。

Deliverables

  • ADR集 (6本)
  • ベンチマーク結果
  • コスト試算表
04

Implementation

検索コアとLLM Gatewayを先に実装し、フロントエンドは薄いストリーミングクライアントに限定。

Deliverables

  • tRPCサービス
  • LLM Gatewayライブラリ
  • Next.jsクライアント
05

QA & Red Team

プロンプトインジェクションとPII漏洩のレッドチーム演習を実施し、検出できなかった攻撃を回帰テスト化。

Deliverables

  • 脅威モデル
  • Red Teamレポート
  • ガードレール設定
06

Soft Launch

社内10名の限定公開でフィードバックループを高速化。トレースから失敗パターンを自動収集。

Deliverables

  • ソフトローンチKPI
  • 失敗事例カタログ
07

Iteration

週次で検索品質 / コスト / レイテンシのトレードオフを評価し、LLM Gatewayの重みを調整。

Deliverables

  • 週次レビュー議事録
  • 可観測性改善PR
Roadmap

Delivery Timeline

  • P0Done2026-03-05

    検索評価ベンチマーク構築

    社内FAQ 3,200件を正解付きクエリセットとして整備し、Recall@k / nDCG@k の自動計測パイプラインを構築。

  • P1Done2026-03-18

    ハイブリッド検索パイプライン

    pgvector + BM25 + HyDE を統合した検索コアを実装。クエリ書き換えエージェントを組み込み。

  • P2In Progress2026-04-10

    LLM Gateway と観測性

    プロバイダ非依存のルーティング層と OpenTelemetry によるプロンプトトレーシングを導入。

  • P3In Progress2026-04-22

    マルチテナント隔離

    Row-level Security + ネームスペース付きベクトル分離でテナント境界を強制。

  • P4Planned2026-05

    パートナー向け限定公開

    静岡県内の協業5社を対象にしたクローズドベータ。SLAとコストダッシュボードを提供。

Team

Who built it

3engineers

Roles

  • MLエンジニア
  • バックエンド/プラットフォーム
  • フルスタック
技术栈

Tools & Platforms

Frontend

Next.js 16TypeScripttRPC

Backend

PythonFastAPILangGraphOpenAI APIAnthropic Claude

Data

PostgreSQL 16pgvectorRedis

Infrastructure

OpenTelemetryDatadogKubernetesTerraform
Build with KGA

正在考虑类似的项目?

我们将为您的业务需求提供最优解决方案。

咨询您的项目