企业 AI 知识资产平台。自动采集、智能关联、随时复用。
员工和 AI 的每一次对话,都是企业的知识资产。人走,知识留下。
[Github]( https://github.com/Vincent-chao-lang/AIHub)
https://aihub.dabuside.top/
一、产品定位
AI Memory Hub 是一个企业级 AI 知识资产管理平台。它自动采集、整理、关联员工与 AI ( ChatGPT 、Claude 、DeepSeek 等)的所有高质量对话,将其转化为可检索、可关联、可复用的结构化知识资产,实现 **"人走,知识留下,价值继续"**。
二、企业为什么需要它
2.1 一个新问题的出现
2023 年开始,你的员工每天都在和 AI 对话:
研发 → ChatGPT 讨论架构方案
运维 → Claude 解决部署故障
产品 → DeepSeek 做竞品分析
设计 → Gemini 找设计灵感
运营 → Kimi 写内容策略
这些对话里藏着:
· 技术决策的推演过程
· 故障排查的完整思路链
· 对业务的深度思考
· 反复验证过的最佳实践
2.2 一个老问题的新形式
传统离职交接:
员工写一份交接文档(如果有的话)
→ 只记录了"结论",丢失了"思考过程"
→ AI 对话中的试错、推演、对比全部消失
→ 新人面对同样问题,从零开始和 AI 聊
结果:
张三用 AI 花 3 天解决了部署问题,离职了。
李四入职遇到同样的故障,再花 3 天从零开始。
知识在,但不可见。
经验在,但无法复用。
2.3 量化损失
假设一个 50 人的技术团队,每人每天和 AI 进行 5 次有价值的对话:
日均知识产出: 50 × 5 = 250 条 AI 决策/推演记录
月均知识产出: 250 × 22 = 5,500 条
年均知识产出: 5,500 × 12 = 66,000 条
如果 80% 随员工流动而不可检索,每年损失:
→ 约 52,800 条有价值的知识碎片
→ 无数可复用的决策链、故障排查路径、方案对比
每一片碎片背后,都是员工花时间与 AI 碰撞出的认知成果。
三、解决方案
3.1 一句话说清楚
员工用 AI 的同时,系统自动记录、理解、关联每一次对话,构建企业自有 AI 知识图谱。
人来,知识自动汇聚;人走,知识结构化管理,随时被新人检索和复用。
3.2 核心能力
┌──────────────────────────────────────────────────────┐
│ 自动采集(零门槛) │
│ 浏览器扩展静默运行,员工正常使用 AI ,对话自动入库。 │
│ 不需要手动粘贴,不需要额外操作,不改变工作习惯。 │
└──────────────────────────┬───────────────────────────┘
│
┌──────────────────────────┴───────────────────────────┐
│ 智能理解(结构化) │
│ 每条对话 → 自动生成标题、标签、摘要 │
│ 跨平台语义搜索 → 用自然语言找到任何历史对话 │
│ 知识图谱 → 自动发现对话之间的深层关联 │
└──────────────────────────┬───────────────────────────┘
│
┌──────────────────────────┴───────────────────────────┐
│ 知识复用(价值闭环) │
│ 新人遇到问题 → 搜索关键词 → 看到前辈的完整 AI 决策链 │
│ AI 回答时 → 注入历史上下文 → 基于团队知识积累来回答 │
│ 团队知识 → 按人/按项目/按主题 → 随时检索和复用 │
└──────────────────────────────────────────────────────┘
四、关键场景
场景 1:新人入职
传统方式:
新人花 2-4 周熟悉项目,遇到问题问同事或自己摸索和 AI 对话
→ 其实前辈早就和 AI 深入讨论过同样的问题
AI Memory Hub:
新人搜索"微服务部署" → 看到:
· 张三 3 个月前与 ChatGPT 的完整架构讨论
· 李四 1 个月前与 Claude 的故障排查全过程
· 系统自动生成的关联对话:CI/CD 配置、容器化方案
→ 新人在 AI 提问时,注入前辈的上下文
→ AI 基于团队已有认知来回答,而非从零开始
效果:新人上手速度 2x 提升,避免重复踩坑
场景 2:员工离职
传统方式:
张三离职 → 写交接文档 → 文档里的结论,丢失了 90% 的思考过程
→ 那场"和 AI 反复讨论了 3 个小时才搞定的故障排查"彻底消失
AI Memory Hub:
张三的所有 AI 对话早已自动归档,按主题分类,图谱关联完整
→ 李四搜索同一问题 → 直接看到张三当时的完整认知链
→ 不只是结论,还有:
· 张三问了什么
· AI 给了哪些方案
· 张三做了什么取舍
· 最终为什么选了方案 A 而不是 B
效果:知识保留率从 10% → 95%,真正的"人走知识留"
场景 3:跨部门经验复用
传统方式:
研发团队用 AI 解决了性能问题
运维团队可能永远不知道这个方案
→ 遇到类似问题各自重新摸索
AI Memory Hub:
搜索"数据库性能" → 跨部门、跨平台、跨时间维度的所有相关对话汇聚一处
→ 研发的架构思路 + 运维的实战经验 + 产品的业务视角
→ 知识自动缝合,打破信息孤岛
效果:团队越用越聪明,知识自适应组织
场景 4:企业 AI 审计与合规
传统方式:
员工和 AI 聊了什么 → 无从知晓
是不是把内部代码贴给了 ChatGPT → 无法审查
大模型使用有没有合规风险 → 没法管理
AI Memory Hub:
所有 AI 对话完整记录,按人、平台、时间可检索
→ 管理员可以看到:谁、在什么平台、讨论了什么话题
→ 敏感信息自动标记(可配置关键词告警)
→ 满足企业对 AI 使用的审计和合规需求
效果:AI 使用透明化,安全与效率兼得
五、5 分钟跑起来
git clone https://github.com/Vincent-chao-lang/AIHub.git
cd AIHub
./start.sh
# 加载浏览器扩展
Chrome → chrome://extensions → 开发者模式 → 加载已解压 → 选择 extension/ 目录
# 打开任意 AI 平台 → 正常聊天 → 点击 🧠 图标 → 检索记忆
# 或访问 http://localhost:5173 → Web 面板
数据完全在本地。 不注册、不联网、不上传。你拥有全部数据。
六、 部署模式
[td]模式[/td]
[td]适合[/td]
[td]配置[/td]
个人本地
个人使用
零配置,./start.sh
局域网共享
团队 5-50 人
改 host 为 0.0.0.0
Docker
标准化部署
docker-compose up
HTTPS + 反向代理
远程团队
Nginx + Let's Encrypt
详细部署指南 → USAGE.md
七、 存储与扩展
默认 SQLite + ChromaDB + 本地 BGE 模型,零配置开箱即用。
随着团队规模增长,可平滑升级:
SQLite + ChromaDB → PostgreSQL + pgvector → Milvus
零配置 改一行 .env 独立集群
100 万条
Embedding 模型同样支持一行配置切换:
本地 BGE-small ( 512 维) → BGE-large / 其他本地模型 → OpenAI / 智谱 API
默认 改模型名 改 EMBEDDING_PROVIDER
切换 embedding 后运行 python backend/rebuild_index.py 即可全量重建向量索引。
详细升级路径 → docs/STORAGE.md
八、 项目结构
AIHub/
├── start.sh # 一键启动
├── backend/ # FastAPI + SQLite + ChromaDB
│ ├── api/routes.py # 10 个 API 端点
│ ├── db/ # 数据库 + 向量存储( ChromaDB/pgvector )
│ ├── models/ # 数据模型
│ └── services/ # embedding · 摘要 · 搜索 · 上下文生成
├── extension/ # Chrome 扩展 (Manifest V3)
│ ├── content/ # 5 平台 DOM 监听
│ ├── sidepanel/ # 侧边栏 UI + 逻辑
│ └── options/ # 设置页
├── frontend/ # React + Vite + TypeScript + D3.js
│ └── src/pages/ # 时间线 · 项目 · 上下文 · 图谱
└── landing/ # 营销页面(中英双语)
九、API
[td]方法[/td]
[td]路径[/td]
[td]说明[/td]
POST
/messages
上传消息(自动 embedding + 摘要)
GET
/timeline
时间线(按对话聚合,支持 ?user_id= 筛选)
GET
/conversations/{id}
对话详情
GET
/conversations/{id}/related
相关对话推荐
POST
/search
语义搜索(向量 + 关键词回退)
POST
/context
图谱驱动上下文生成(含 max_tokens 智能截断)
GET
/projects
项目聚合
GET
/graph
知识图谱数据
GET
/stats
统计(总数/平台分布/用户统计/向量索引数/embedding 信息)
十、 设计原则
[ol]
[/ol]

