返回文章列表

AI 助手平台从 0 到 1 工程复盘

复盘 LLM 集成、RAG 检索、Agent 编排、流式 UI 与 5000+ 日对话量的 AI 助手平台落地过程。

2026/06/252 min 阅读

项目背景

团队需要一套内部 AI 助手，支持文档问答、代码生成、Tool Calling，日目标 5000+ 对话。

核心难点

多模型切换（GPT-4 / Claude / 本地模型）的统一抽象
RAG 检索准确率不足，幻觉问题严重
流式 UI 的状态管理（工具调用中间态、多轮上下文）
Token 成本不可控

架构设计

关键决策

决策	方案	原因
流式协议	SSE + AI SDK	浏览器兼容好
检索	Hybrid Search	向量 + 关键词互补
工具协议	MCP	标准化、可扩展
状态管理	Agent 状态机	多步推理可控

结果收益

日对话量 5200+，P99 延迟 2.3s
RAG 准确率从 62% 提升到 89%
Token 成本通过缓存和模型降级降低 40%

反思

Prompt 版本管理应该第一天就建立，而不是后期补；评测集是 AI 产品质量的基石。