喂饭级教程 —— Dify x OceanBase seekdb 使用指南

查看 26|回复 1
作者:missroad   
各位大佬大家好!我是 OceanBase seekdb 数据库的研发工程师。
在上个帖子里,对我最新数据库项目 seekdb 进行了简单的介绍(详见: [开源自荐] 我做了一个对开发者友好,支付宝背后数据库 OceanBase 的 AI Lite 版本 —— seekdb )。在帖子发出之后,有些网友添加了我的好友,并说希望能让 Dify 尽快接入 seekdb 。

前几天和 Dify 的研发团队进行了沟通,并协助支持了 Dify 底层数据库的 MySQL 兼容。
现在 Dify 最新的 1.10.1 版本,不仅为 seekdb 做了 MySQL 兼容,还借助 seekdb 实现了将元数据、向量和全文索引能力集于一身的能力,大大简化了 Dify 的部署复杂度,同时也提升了 Dify 混合检索的能力。

下面简单介绍两句 Dify 等 AI 应用构建平台的诸多痛点~
传统的 Agentic RAG 的痛点
传统的 Agentic RAG 依赖关系型数据库 + 向量数据库 + 全文检索多个异构组件,导致运维复杂、数据同步困难、一致性风险高。在典型实践中,为了支撑测试环境和生产环境的稳定运行,用户往往需要同时管理和协调以下几大组件:
  • 关系型数据库,主要用于存储用户、应用配置、Agent 任务状态、知识库文档的元数据,这些是强事务性、结构化的业务数据。
  • 向量数据库,负责存储 Context Chunks 经过 Embedding Model 向量化后的高维向量。这是实现语义搜索的基础,让 Agent 能理解文本的深层含义。
  • 全文检索,负责构建知识库内容的倒排索引,以支持基于关键词的稀疏检索。这保证了用户或 Agent 能进行精确的文本匹配或模糊搜索。

    这些组件各自在其领域内都是成熟、专业的产品方案。但一旦被组合成一个应用的数据层,随之而来的就是巨大的运维压力和成本。你需要为每套系统独立管理备份、升级、监控。任何一个环节出问题,都可能导致整个 Agentic RAG 链路的全局性故障。系统越复杂,人力投入就越大,风险越高。
    Dify v1.10.1 版本
    作为业界领先的开源智能体平台,Dify 在国内企业应用中已获得广泛部署。然而,由于官方此前缺乏 MySQL 兼容支持,大多数企业被迫在源码层面进行定制改造,导致维护困难且难以及时反馈社区。为解决 Dify 部署维护复杂度高及 MySQL 兼容性问题,OceanBase 开源团队与顺丰 AI 技术平台组基于 OceanBase 强大的 SQL 兼容能力,联合完成了 Dify MySQL 兼容开发,为社区及企业用户提供开箱即用的解决方案,显著降低部署运维成本。
    在解决了 MySQL 兼容性问题后,Dify 也开始思考更深层次的架构优化。OceanBase 在提供 MySQL 兼容性的同时,也具备将元数据、向量和全文索引能力集于一身的能力,这为解决多组件架构带来的 Scale 复杂性、实现架构简化提供了新的思路。因此,在日前发布的 v1.10.1 这一版本中,Dify 开始尝试 一体化数据库,并选择了 OceanBase 作为首个实践对象。

    从 Dify v1.10.1 版本开始,Dify 正式兼容和支持 MySQL / OceanBase / seekdb 作为 Dify 的元数据库,极大地便利了广大的 MySQL 技术栈用户。在元数据库和向量数据库的配置选项中,新增了基于 OceanBase 一体化数据库及 OceanBase AI 原生数据库 seekdb ,用以简化 Agentic RAG 部署复杂度。
    同时,还支持将 OceanBase / seekdb 用于对业务元数据、语义向量和全文索引进行统一的存储和检索,实现了数据层的彻底精简,确保事务一致性,极大简化运维负担。

  • MetaDB 层:
  • Dify 已适配 MySQL 型 MetaDB ,引入 DB_TYPE ,一套迁移脚本兼容 PostgreSQL / MySQL / OceanBase ,OceanBase / seekdb 可以直接当 Dify 元数据库用。

  • 向量 & 检索层:
  • OceanBase 已经是 Dify 官方 VectorStore:支持向量检索、Hybrid Search (向量+全文)、metadata 过滤、score 阈值控制,并有多语言 fulltext parser 选项。

  • 运行环境 & 质量:
  • Docker Compose 里有专门的 OB profile ,起容器即可用; CI 里有真机 OB 实例跑向量相关测试保障。



    今天,我专门写了一篇技术文章,详见:《喂饭级教程 II —— Dify x OceanBase seekdb 使用指南》
    在文章中,会为大家介绍:如何配置 Dify 的元数据库 / 向量数据库为 OceanBase seekdb ,以达到简化 Dify 部署复杂度,提升混合检索效果的目的(以及如何通过 Dify 快速构建 AI 应用)。
    文章共分为三个部分,大家可以选择性地进行阅读:
  • 第一部分是简单介绍 Agentic RAG 多组件依赖的痛点,以及 Dify v1.10.1 版本对应的解决方案。
  • 第二部分是如何配置 Dify 的元数据库 / 向量数据库为 OceanBase seekdb ,以达到快速简化 Dify 多组件部署复杂度,和提高 AI 应用依赖的向量数据库混合检索效果的目的。
  • 第三部分是如何通过 Dify x OceanBase seekdb 快速构建 AI 应用。

    欢迎各位老师也能根据文章中的步骤尝试快速使用 Dify x seekdb 搭建属于您自己的 AI 应用,也欢迎大家踊跃在评论区批评、指正~

    dify, seekdb, MySQL

  • missroad
    OP
      
    《喂饭级教程 II —— Dify x OceanBase seekdb 使用指南》访问连接: https://mp.weixin.qq.com/s/HtBDm8cSqMTpiPta2WQvAA?token=812433895&lang=zh_CN
    您需要登录后才可以回帖 登录 | 立即注册

    返回顶部