返回文章列表

AI 助手平台从 0 到 1 工程复盘

复盘 LLM 集成、RAG 检索、Agent 编排、流式 UI 与 5000+ 日对话量的 AI 助手平台落地过程。

项目背景

团队需要一套内部 AI 助手,支持文档问答、代码生成、Tool Calling,日目标 5000+ 对话。

核心难点

  • 多模型切换(GPT-4 / Claude / 本地模型)的统一抽象
  • RAG 检索准确率不足,幻觉问题严重
  • 流式 UI 的状态管理(工具调用中间态、多轮上下文)
  • Token 成本不可控

架构设计

Chat UI

AI SDK 层

Agent 编排

RAG 检索

MCP 工具

LLM API

向量库

关键决策

决策方案原因
流式协议SSE + AI SDK浏览器兼容好
检索Hybrid Search向量 + 关键词互补
工具协议MCP标准化、可扩展
状态管理Agent 状态机多步推理可控

结果收益

  • 日对话量 5200+,P99 延迟 2.3s
  • RAG 准确率从 62% 提升到 89%
  • Token 成本通过缓存和模型降级降低 40%

反思

Prompt 版本管理应该第一天就建立,而不是后期补;评测集是 AI 产品质量的基石。