Skip to content

向量知识库

向量知识库是 CueMate 的核心功能之一,用于管理和检索面试相关的所有知识内容。系统使用语义向量搜索技术,能够智能匹配相关内容,为面试训练提供精准的知识支持。

IMPORTANT

向量知识库的核心价值

  • 使用 FastEmbed BGE-small-zh-v1.5 模型进行语义理解
  • 支持跨 4 个集合的智能搜索(岗位、简历、押题、其他文件)
  • 面试时自动检索相关度 ≥ 80% 的知识内容
  • 所有面试答案都基于向量库中的知识生成

WARNING

数据同步的重要性

  • 必须同步:所有数据必须同步到向量库后才能被检索
  • 自动记录:面试过程中使用的知识会自动保存为 AI 向量记录
  • 定期维护:建议定期检查同步状态,确保数据一致性

TIP

推荐工作流程

  1. 在各功能页面添加基础数据(岗位、简历、押题)
  2. 上传或添加项目资料到"其他文件"
  3. 执行"一键同步所有数据"
  4. 开始面试训练,系统自动检索知识
  5. 查看"AI 向量记录"了解知识使用情况

1. 页面概览

1.1 进入向量知识库

顶部导航菜单

点击顶部导航菜单的"向量知识库",进入向量知识库管理页面。

向量知识库页面

1.2 六个主要标签页

页面提供六个功能标签页,满足不同的知识管理需求:

六个主要标签页

岗位信息

  • 管理岗位描述的向量数据
  • 支持语义搜索岗位内容
  • 查看岗位的相关简历和押题

简历信息

  • 管理简历内容的向量数据
  • 搜索技能和经验匹配
  • 查看简历的相关岗位和押题

面试押题

  • 管理面试题目和答案
  • 支持按标签分类筛选
  • 面试训练的核心知识来源

同步状态

  • 查看所有数据的同步状态
  • 执行一键同步或清空操作
  • 确保向量库与数据库一致

其他文件

  • 上传项目文档、技术资料等文件
  • 添加自定义文本内容
  • 为面试提供补充知识来源

AI 向量记录

  • 查看面试过程中使用的知识记录
  • 包含模拟面试、面试训练、AI 提问的记录
  • 分析知识使用情况和效果

2. 岗位信息管理

2.1 搜索岗位信息

在"岗位信息"标签页中,可以搜索和浏览所有同步的岗位数据:

岗位信息搜索

搜索功能

  • 输入岗位关键词进行语义搜索
  • 系统自动匹配相关岗位内容
  • 结果按相关度排序显示

2.2 查看岗位详情

点击"详情"按钮查看岗位完整信息:

岗位详情

详情页面包含

  • 岗位信息:ID、类型、来源、创建时间、完整内容
  • 相关简历:显示匹配该岗位的简历列表
  • 相关押题:显示针对该岗位的面试题目

自适应布局

  • 内容区域自动占满屏幕
  • 支持滚动查看长文本
  • 多标签页切换查看不同信息

3. 简历信息管理

3.1 搜索简历信息

在"简历信息"标签页中,可以搜索和浏览所有同步的简历数据:

简历信息搜索

搜索特性

  • 支持技能、经验等关键词搜索
  • 语义匹配相关简历
  • 显示相关度百分比

3.2 查看简历详情

点击"详情"按钮查看简历完整内容:

简历详情

详情标签页

  • 简历信息:完整的简历内容
  • 相关岗位:该简历匹配的岗位
  • 相关押题:针对该简历的面试题

4. 面试押题管理

4.1 搜索面试押题

在"面试押题"标签页中,搜索和管理面试题目:

押题搜索

搜索功能

  • 输入面试问题关键词
  • 查看相关度评分
  • 支持按标签筛选

重要说明

  • 只有相关度 ≥ 80% 的押题会在面试中使用
  • 可以在这里测试押题的检索效果
  • 建议优化低相关度的押题描述

4.2 标签筛选

面试押题支持按标签筛选:

标签筛选

筛选选项

  • 下拉选择押题标签
  • 结合关键词搜索使用
  • 快速定位特定类型题目

4.3 查看押题详情

点击"详情"查看押题完整信息:

押题详情

详情内容

  • 押题信息:问题、答案、标签
  • 相关岗位:押题对应的岗位
  • 相关简历:押题对应的简历

5. 同步状态管理

5.1 查看同步状态

切换到"同步状态"标签页,查看所有数据的同步情况:

同步状态

状态显示

  • 岗位信息:总数、已同步、未同步
  • 简历信息:总数、已同步、未同步
  • 面试押题:总数、已同步、未同步

5.2 一键同步所有数据

这是确保数据可用的关键操作!

点击"一键同步所有数据"按钮:

一键同步

同步流程

  1. 点击"一键同步所有数据"按钮
  2. 系统弹出确认对话框
  3. 点击"确认同步"开始执行
  4. 显示"正在同步..."加载提示
  5. 同步完成后显示成功提示

同步说明

  • 新增:数据库有但向量库没有 → 插入向量库
  • 更新:数据库和向量库都有 → 更新向量库
  • 清理:数据库没有但向量库有 → 从向量库删除
  • 一致性:确保向量库与数据库完全同步

使用场景

  • 添加新的岗位、简历或押题后
  • 修改现有数据内容后
  • 上传新的其他文件后
  • 定期维护数据一致性时
  • 初次使用向量搜索功能时

5.3 一键清空所有数据

点击"一键清空所有数据"按钮可以清空向量库:

清空数据

警告提示

  • 此操作将永久删除向量库中的所有数据
  • 清空后无法恢复,需要重新同步
  • 不影响原始数据库,只清空向量数据

使用场景

  • 重新构建向量索引
  • 清理测试数据
  • 解决数据不一致问题

6. 其他文件管理

6.1 功能概述

"其他文件"标签页用于管理项目资料、技术文档等补充知识:

其他文件

主要功能

  • 上传文件:支持 PDF、Word、文本等格式
  • 添加文本:直接输入文本内容
  • 向量化存储:自动转换为向量数据
  • 面试使用:为面试提供补充知识来源

6.2 上传文件

点击"上传文件"按钮上传文档:

上传文件

上传步骤

  1. 点击"上传文件"按钮
  2. 选择本地文件(支持 PDF、DOCX、TXT 等)
  3. 文件自动上传并解析
  4. 系统提取文本内容并向量化
  5. 显示"上传成功"提示

文件要求

  • 文件大小:≤ 10MB
  • 支持格式:PDF、DOCX、TXT、MD 等
  • 文件名建议使用有意义的描述

6.3 添加文本内容

点击"添加文本"按钮添加自定义内容:

添加文本

添加步骤

  1. 点击"添加文本"按钮
  2. 在弹出对话框中输入标题
  3. 输入文本内容(支持多行)
  4. 点击"添加"按钮保存
  5. 系统自动向量化并存储

使用场景

  • 添加项目经验描述
  • 记录技术要点
  • 补充面试知识点
  • 存储常用答案模板

6.4 查看和删除

其他文件列表显示所有上传的内容:

列表信息

  • 文件名称或标题
  • 内容预览(前 200 字符)
  • 创建时间
  • 操作按钮:详情、删除

删除文件

  1. 点击"删除"按钮
  2. 确认删除对话框
  3. 从向量库和文件系统中删除

删除文件列表

7. AI 向量记录

7.1 功能概述

"AI 向量记录"标签页展示面试过程中使用知识的记录:

AI 向量记录

记录来源

  • 模拟面试(mock):AI 模拟面试官时使用的知识
  • 面试训练(training):面试训练中使用的知识
  • AI 提问(voice_qa):语音提问时使用的知识

记录内容

  • 提问问题:用户或面试官的问题
  • 候选人回答:用户的实际回答(仅 mock/training)
  • AI 参考答案:AI 生成的答案
  • 使用的知识:押题答案、岗位信息、简历信息、其他文件
  • AI 分析:优点、缺点、建议(仅 mock/training)

7.2 搜索和筛选

支持关键词搜索和类型筛选:

记录搜索

搜索功能

  • 输入关键词搜索记录内容
  • 按类型筛选:模拟面试/面试训练/AI 提问
  • 按时间范围筛选

7.3 查看记录详情

点击"详情"按钮查看完整记录:

记录详情

详情页面包含

  • 基本信息:类型、创建时间、ID
  • 提问问题:原始问题内容
  • 候选人回答:用户的回答(如有)
  • AI 参考答案:AI 生成的答案
  • 押题内容:使用的押题问题和答案
  • 其他文件内容:使用的补充资料
  • AI 分析结果:评价、优点、缺点、建议、考察点

功能特点

  • 完整记录知识使用情况
  • 分析答案质量和效果
  • 帮助优化知识库内容

7.4 删除记录

删除记录:

删除记录

管理功能

  • 查看详情:完整展示记录信息
  • 删除记录:清理无用或过期记录
  • 分析统计:了解知识使用频率

8. 数据分块说明

8.1 为什么需要分块

分块原因

  • 长文本可能超过模型最大输入长度(512 tokens)
  • 分块可以更精确地匹配文本片段
  • 提高搜索准确性和效率
  • 支持大文档的处理

8.2 分块信息

在搜索结果中会显示:

  • 分块索引:当前是第几块(从 0 开始)
  • 总分块数:文档总共分成几块
  • 示例:分块 1/3 表示第 2 块,共 3 块

8.3 查看完整内容

由于分块,搜索可能只显示部分内容:

  • 点击"详情"查看完整文档
  • 系统会合并所有分块显示
  • 多个分块匹配时,选择相关度最高的

9. 常见问题

9.1 面试时没有使用押题

问题:面试训练中,AI 总是实时生成答案,没有使用押题库。

解决方案

  1. 检查同步状态

    • 切换到"同步状态"标签
    • 确认"面试押题"显示"已同步"
    • 如果未同步,执行"一键同步所有数据"
  2. 测试押题相关度

    • 切换到"面试押题"标签
    • 输入面试问题关键词
    • 查看相关度是否 ≥ 80%
    • 相关度太低需要优化押题描述
  3. 确认岗位匹配

    • 确保押题关联的岗位正确
    • 面试时只检索当前岗位的押题

9.2 删除失败

问题:点击删除按钮时提示"网络错误: TypeError: Failed to fetch"。

解决方案

  1. 检查 RAG 服务是否运行:docker ps | grep rag-service
  2. 确认 CORS 配置是否正确
  3. 查看浏览器控制台错误信息
  4. 检查网络连接
  5. 尝试重启服务:docker restart cuemate-rag-service

9.3 搜索无结果

问题:输入关键词后显示"未找到相关结果"。

解决方案

  1. 检查数据是否已同步
  2. 降低相关度阈值(如 >0%)
  3. 使用更通用的关键词
  4. 清除其他筛选条件
  5. 确认数据已添加到数据库

9.4 上传文件失败

问题:上传文件时提示失败。

解决方案

  1. 检查文件大小是否 ≤ 10MB
  2. 确认文件格式是否支持
  3. 检查文件是否损坏
  4. 确认网络连接正常
  5. 查看后端服务日志

9.5 同步速度慢

问题:同步数据时等待很长时间。

解决方案

  1. 这是正常现象,需要向量化所有数据
  2. 数据量大时需要更长时间
  3. 可以在后台运行,不影响其他操作
  4. 首次同步时间较长,后续更新较快

9.6 清空后无法恢复

问题:误点击清空按钮,数据丢失。

解决方案

  1. 不用担心,原始数据仍在数据库
  2. 执行"一键同步所有数据"恢复
  3. 等待同步完成即可
  4. 只是向量数据被清空,原始数据未受影响

10. 最佳实践

10.1 定期同步策略

建议同步时机

  • 立即同步:添加或修改押题后
  • 每日同步:如果频繁添加数据
  • 每周同步:定期维护数据一致性
  • 问题后同步:发现检索问题时

10.2 押题优化技巧

提高检索效果

  1. 使用多种问法添加押题变体
  2. 在问题中包含关键技能词
  3. 答案要详细完整
  4. 定期测试检索效果
  5. 根据实际面试调整内容

10.3 其他文件管理

有效使用建议

  1. 上传项目文档和技术资料
  2. 添加常用的答案模板
  3. 整理行业知识和经验
  4. 定期更新补充内容
  5. 删除过期或无用文件

10.4 AI 向量记录分析

改进知识库

  1. 定期查看 AI 向量记录
  2. 分析哪些知识被频繁使用
  3. 找出检索效果不好的问题
  4. 根据记录优化押题内容
  5. 补充缺失的知识点

10.5 搜索技巧

高效搜索建议

  1. 使用专业术语和技能关键词
  2. 组合多个关键词提高准确性
  3. 适当设置相关度阈值
  4. 利用时间筛选缩小范围
  5. 查看详情了解完整内容

10.6 性能优化

优化建议

  1. 避免一次性上传大量大文件
  2. 定期清理无用的向量数据
  3. 保持合理的数据量
  4. 监控同步耗时
  5. 必要时清空重建索引

11. 应用场景

11.1 面试准备(核心场景)

完整工作流程

步骤 1:准备基础数据

  1. 岗位列表添加目标岗位
  2. 面试押题准备常见题目
  3. 上传项目文档到"其他文件"

步骤 2:同步到向量库

  1. 到向量知识库页面
  2. 切换到"同步状态"标签
  3. 执行"一键同步所有数据"
  4. 确认所有数据显示"已同步"

步骤 3:测试检索效果

  1. 切换到"面试押题"标签
  2. 设置相关度 >80%
  3. 输入可能的面试问题
  4. 验证能否检索到押题
  5. 优化低相关度的押题

步骤 4:开始面试训练

  1. 模拟面试面试训练
  2. 选择岗位开始训练
  3. 系统自动检索向量库
  4. AI 基于检索到的知识生成答案
  5. 完成后查看"AI 向量记录"分析效果

11.2 知识库维护

日常维护流程

  1. 定期检查同步状态
  2. 清理过期或错误数据
  3. 补充新的知识内容
  4. 分析 AI 向量记录
  5. 优化押题和资料

相关页面

Released under the GPL-3.0 License.