优先围绕引用溯源与定位能力做验证
对于企业知识库场景,回答是否可信、是否能定位到原文,比单纯生成答案更直接影响客户对方案可用性的判断
- 先只关注通用问答效果
- 等方案稳定后再补引用与预览体验
参与某省电信数据中心知识平台从 Demo 验证推进到立项评估,围绕引用溯源、图文回答、PDF 预览定位等能力进行设计、测试与问题收敛
面向某省电信数据中心建设与运维资料场景,参与「筑云智库知识平台」需求对齐、原型设计、测试推进、客户演示支持与立项材料整理,推动项目从 Demo 验证走向正式立项评估
项目需要围绕图纸、规范、参数、表格等复杂非结构化资料场景,验证 AI 知识库问答的可用性、引用可信度和演示稳定性,并在较短周期内形成可展示、可评估的方案能力
围绕多文档联合引用、专有名词识别、图文混合回答、PDF 预览清晰度与引用定位准确性设计测试样本和问题集;结合业务要求持续优化提示词规则、评估口径与问题清单,推动 Demo 版本持续收敛并支撑立项评估
对于企业知识库场景,回答是否可信、是否能定位到原文,比单纯生成答案更直接影响客户对方案可用性的判断
通过结构化问题集和问题归因,可以更快定位错召回、漏召回、图片模糊、定位不准等关键问题,避免优化方向发散
系统参与了 AI 知识库项目从需求对齐、原型设计、测试推进到问题收敛与演示支持的完整过程,形成了企业知识库场景下的产品与评估方法认知
项目面向某省电信数据中心建设与运维资料场景,需要围绕图纸、规范、参数和表格等复杂资料,验证 AI 知识库问答能力是否具备立项价值。除回答质量外,客户同样关注引用可信、图文混合回答效果以及 PDF 预览定位体验。
在项目中,我主要参与了下面几类工作:
Demo 阶段累计沉淀 32 条问题清单,其中本人提出或跟进 21 条,重点覆盖:
这些问题帮助团队逐步明确了召回命中率、引用回答覆盖率和响应时延等关键验收口径。
这个项目让我第一次系统参与企业知识库产品从需求、原型、测试、Bad Case 收敛到演示支持的完整链路,也让我对 RAG 产品真正需要解决的“可用、可信、可追溯”问题有了更具体的理解。