求推荐一个轻量 RAG LLM chat 的部署方案

查看 40|回复 0
作者:GrayXu   
需求:
[ol]
  • 构建英文 pdf 知识库,一次对话讨论可以涉及多个文件
  • 向量数据库最好本地化
  • 不需要本地部署模型,所有 embed, rerank, chat models 都用 api
  • 不需要用户管理等冗余功能
    [/ol]
    看好多方案,ragflow fastgpt langchain-chatchat ,不知道实际用起来如何?或者有其他推荐的方案?
    ChatGPT-Next-Web-langchain 感觉在上游的简单前端框架下加 rag 的逻辑,还是有点勉强了。
  • 您需要登录后才可以回帖 登录 | 立即注册

    返回顶部