CherryStudio 开源大模型工具带来知识库啦, step by step 的教程!

查看 66|回复 7
作者:wangshushu   
在 0.91 版本中,CherryStudio 带来了期待已久的知识库功能。
下面我们将按步骤呈现 CherryStudio 的详细使用说明。
添加嵌入模型
[ol]
  • 在模型管理服务中查找模型,可以点击“嵌入模型”快速筛选;
  • 找到需要的模型,添加到我的模型。
    [/ol]

    创建知识库
    [ol]
  • 知识库入口:在 CherryStudio 左侧工具栏,点击知识库图标,即可进入管理页面;
  • 添加知识库:点击添加,开始创建知识库;
  • 命名:输入知识库的名称并添加嵌入模型,以 bge-m3 为例,即可完成创建。
    [/ol]


    添加文件并向量化
    [ol]
  • 添加文件:点击添加文件的按钮,打开文件选择;
  • 选择文件:选择支持的文件格式,如 pdf ,docx ,pptx ,xlsx ,txt ,md ,mdx 等,并打开;
  • 向量化:系统会自动进行向量化处理,当显示完成时(绿色✓),代表向量化已完成。
    [/ol]



    添加多种来源的数据
    CherryStudio 支持多种添加数据的方式:
    [ol]
  • 文件夹目录:可以添加整个文件夹目录,该目录下支持格式的文件会被自动向量化;
  • 网址链接:支持网址 url ,如 https://docs.siliconflow.cn/introduction ;
  • 站点地图:支持 xml 格式的站点地图,如 https://docs.siliconflow.cn/sitemap.xml ;
  • 纯文本笔记:支持输入纯文本的自定义内容。
    [/ol]

    搜索知识库
    当文件等资料向量化完成后,即可进行查询:
    [ol]
  • 点击页面下方的搜索知识库按钮;
  • 输入查询的内容;
  • 呈现搜索的结果;
  • 并显示该条结果的匹配分数。
    [/ol]


    对话中引用知识库,并生成回复
    [ol]
  • 创建一个新的话题,在对话工具栏中,点击知识库,会展开已经创建的知识库列表,选择需要引用的知识库;
  • 输入并发送问题,模型即返回通过检索结果生成的答案 ;
  • 同时,引用的数据来源会附在答案下方,可快捷查看源文件。
    [/ol]


    结语
    在 LLM 技术浪潮中,CherryStudio 顺应趋势,推出知识库与 RAG 功能,注入更卓越的检索与信息调用能力,也进一步拓宽了 CherryStudio 在多元生产力场景中的应用版图。
    诚然,受限于现阶段语言模型的基础能力,体验尚未臻于完美,但随着技术的不断迭代革新,RAG 技术必将成为 AI 应用的明珠,未来可期。
  • SilentOrFight   
    支持👍
    wangshushu
    OP
      
    忘记放链接了 https://github.com/kangfenmao/cherry-studio/releases
    unco020511   
    感谢,用上了.之前上传附件的功能,也是用的 RAG 吗
    wangshushu
    OP
      
    @unco020511 是的,但是那个只能跟单一文件对话,而且检索匹配能力很弱,新版本是专用的嵌入模型和向量数据库处理的,处理大量文件优势非常明显
    unco020511   
    @wangshushu #4 请问背后是使用类似 dify 之类的编排框架吗,最近也在调研 RAG 这块如何和我们的业务结合起来
    kangfenmao   
    @unco020511 有源代码,你可以去看一下处理流程
    kangfenmao   
    @unco020511 https://github.com/kangfenmao/cherry-studio/blob/main/src/main/services/KnowledgeService.ts
    您需要登录后才可以回帖 登录 | 立即注册

    返回顶部