跳转至

知识库配置指南

本页以 智能体平台为准,整理“零基础也能照做”的知识库配置流程。

如果你还没有创建智能体,请先完成:快速开始


1. 一句话先讲明白:知识库解决什么问题?

当模型对你们企业/产品/设备的知识不足时,会出现:

  • 回答过时
  • 细节胡编
  • 参数/规格说错

知识库(RAG)的作用是:把你提供的资料作为检索来源,再让模型“基于资料回答”

智能体回答错误处理

模型知识不足导致回答错误

问题描述:

智能体对特定企业或专业领域的问题回答错误,如企业基本信息、产品参数等,原因是模型本身的知识储备不够新或不够专业。

解决方案:

  1. 使用知识库补充专业信息

    • 将企业信息、产品资料等添加到知识库
    • 确保知识库文件解析完成并关联到智能体
    • 通过Q&A格式精确配置关键信息
  2. 优化提示词

    • 在系统提示词里明确:回答必须基于知识库内容
    • 找不到资料就说“不知道”,不要猜

注意事项:

  • 小模型的知识更新相对滞后,建议优先通过知识库补充
  • 网络搜索需要设备保持联网状态

2. 傻瓜式配置:从 0 到 1 做一个可用的知识库

2.1 新建知识库

  1. 登录 智能体平台。
  2. 进入 资源库 / Resource Library
  3. 创建 知识库 / Knowledge
  4. 为知识库起一个可识别的名字,例如:设备说明书-2025Q4

2.2 上传文件并等待解析

  1. 上传文件(建议先用小文件验证流程)。
  2. 等待解析完成后再继续下一步。

建议的文件准备方式

  • 单文件建议控制在 5MB 内
  • 大文件先拆分(按章节拆)
  • 纯文本优先用 md/txt,内容更干净

2.3 把知识库关联到智能体

  1. 回到 智能体编辑页
  2. 在“知识 / Knowledge”区域选择刚创建的知识库。
  3. 保存。

2.4 验证是否生效

用 3 类问题验证:

  1. 资料里有标准答案的(例如规格参数)
  2. 资料里有步骤的(例如配网/复位)
  3. 资料里没有的(例如“你们公司上市了吗?”)——它应该回答不知道

文件解析问题与解决

文件解析失败或速度慢

问题描述:

上传到知识库的文件显示"解析中"状态,进度极慢(如0.22%、0.64%),长时间无法完成解析。

解决方案:

  1. 检查文件大小和格式

    • 几十MB的大文件容易出现解析失败
    • 建议将大文件拆分成多个小文件
    • 支持的格式:PDF、Word、TXT、MD等
  2. 优化文件内容

    • 清除文件中的特殊字符和格式
    • 简化复杂的排版结构
    • 确保文本内容清晰可读
  3. 分批上传处理

    • 避免同时上传多个大文件
    • 逐个上传并等待解析完成
    • 选择非高峰时段进行操作
  4. 解析卡住的处理

    • 其他用户卡住可能导致队列阻塞
    • 建议等待系统恢复或避开高峰时段重试
    • 如超过 24 小时无变化,建议记录文件信息并联系技术支持

注意事项:

  • 解析时间与文件大小成正比
  • 网络状况会影响解析速度
  • 建议在平台稳定期进行操作
  • 平台维护期间可能影响解析服务

Q&A格式配置

Q&A格式说明

当普通切片方式无法准确分割内容时,推荐使用Q&A格式实现精确的知识点管理。

支持的文件格式:

  • Excel文件(.xlsx、.xls)
  • CSV/TXT文件
  • JSON格式文件

格式要求:

Excel/CSV/TXT格式

  • 第一列:问题
  • 第二列:答案
  • 无需表头:直接从第一行开始填写问答内容

JSON格式

知识库内容支持JSON格式编写,需要按照结构化数据格式:

{
  "title": "知识库标题",
  "content": [
    {
      "question": "问题内容",
      "answer": "对应答案"
    }
  ]
}

示例文件: 参考"知识库入门示例demo.md"文件,了解具体的格式要求和编写规范。

Excel示例:

问题 答案
公司全称是什么? 丽水金迈科智能科技有限公司
统一社会信用代码? 91331101MA2J0XXX
公司地址在哪里? 浙江省丽水市莲都区XXX

注意事项:

  • 每行代表一个独立的问答对
  • 避免在问题或答案中包含换行符
  • 建议一个问题对应一个简洁明确的答案

多条件问题处理

问题描述:

需要根据不同条件返回不同答案(如血压值120以上回答偏高,120以下回答正常)。

解决方案:

知识库本身不支持条件判断,需要通过设置多个独立问题来实现:

  1. 创建多个问题变体

    • "血压120以上怎么办"
    • "血压120以下正常吗"
    • "血压偏高是什么情况"
  2. 分别配置答案

    • 每个问题对应相应的答案和建议
    • 确保答案内容准确且有用
  3. 使用同义词扩展

    • 添加相似表达方式的问题
    • 提高匹配率和用户体验

注意事项:

  • 知识库是基于关键词匹配的检索系统
  • 不具备LLM的推理和判断能力
  • 需要预先考虑所有可能的问法

知识库关联智能体

配置步骤

  1. 创建知识库:在 智能体平台资源库创建并上传文档。
  2. 关联智能体:在智能体编辑页选择知识库并保存。
  3. 测试验证:用“资料内问题 / 资料外问题”各测 3 条。

常见错误处理

错误:知识库中未找到答案

  • 检查知识库是否关联成功
  • 验证文件解析是否完成
  • 尝试使用问题中的关键词搜索

错误:返回"ERROR: 知识库名称"

  • 确认知识库名称拼写正确
  • 检查知识库权限设置
  • 重新绑定智能体和知识库

智能体网络搜索能力

问题描述:

当知识库中没有答案时,智能体是否会搜索网络上的答案进行回答?

解决方案:

是的,智能体具备网络搜索能力:

  1. 网络搜索机制

    • 知识库匹配失败时,自动启用网络搜索
    • 搜索互联网上的相关信息
    • 结合搜索结果生成回答
  2. 搜索优先级

    • 优先匹配知识库内容
    • 知识库无答案时搜索网络
    • 综合多个来源提供完整答案
  3. 使用场景

    • 知识库未覆盖的问题
    • 需要最新信息的查询
    • 开放性问题的补充回答

注意事项:

  • 网络搜索需要设备联网
  • 搜索结果可能存在时效性差异
  • 建议定期更新知识库减少依赖网络搜索

最佳实践

文件准备建议

  1. 内容结构化

    • 使用清晰的标题和段落
    • 避免冗余和重复信息
    • 保持内容简洁明了
  2. 问答对优化

    • 问题符合用户日常表达习惯
    • 答案准确且信息完整
    • 一个知识点一个问答对
  3. 定期维护

    • 及时更新过时信息
    • 根据用户反馈补充内容
    • 清理无效或重复的问答

性能优化

  • 控制单个文件大小在5MB以内
  • 知识库条目数量适中(建议不超过1000条)
  • 定期清理无用数据和过期文件

知识库文件显示"Task is queued..."超过一天怎么办?

问题描述:

上传到知识库的文件已超过一天,但解析进度仍显示"Task is queued...",状态持续时间超过87391秒(约24.3小时),怀疑解析是否异常。

问题分析:

  1. 队列阻塞现象

    • 任务长时间停留在队列中无法开始处理
    • 持续时间显示相同进度无变化
    • 可能是系统任务调度出现异常
  2. 可能原因

    • 服务器资源不足,处理队列积压
    • 解析服务出现异常或故障
    • 大文件处理导致后续任务阻塞
    • 系统维护或升级影响处理能力

解决方案:

  1. 检查文件状态

    • 确认文件上传是否完整
    • 验证文件大小是否符合限制要求
    • 检查文件格式是否在支持范围内
  2. 重新上传处理

    • 删除当前卡住的文件任务
    • 将大文件拆分成多个小文件
    • 选择非高峰时段重新上传
    • 等待当前队列清空后再操作
  3. 平台状态确认

    • 查看平台公告确认系统状态
    • 联系技术支持查询当前服务情况
    • 确认是否为已知问题正在修复
  4. 替代方案

    • 使用Q&A格式替代大文件
    • 先完成基础功能配置,后续再添加知识库

操作建议:

  • 文件大小建议控制在5MB以内
  • 避免同时上传多个大文件
  • 上传后耐心等待,不要重复操作
  • 保留文件副本,便于重新上传
  • 如超过24小时无变化,说明存在异常

注意事项:

  • "Task is queued"表示任务尚未开始解析
  • 正常解析时间根据文件大小可能需要数小时
  • 如超过24小时无变化,说明存在异常
  • 建议记录具体时间和文件信息便于排查