十个大脑的烦恼
过往这些年,我积累了大量知识,散落在各个年代的工具里(你大概也是)。最早是 Evernote ,印象当年还有个 Markdown 插件(马克飞象 https://maxiang.io/ ,竟然还在),能一边写一边同步到印象笔记中。
那个年代还折腾过 emacs 的 org-mode 。后来因为清爽简洁、原生支持 Markdown ,用了 Bear 。又因为功能强大、丰富的 Emoji ,迁到了 Notion 。再到工作中各种各样的企微文档、飞书文档。当然,还有在硬盘中保存的各种 Word 、PPT 、Excel 、PDF 甚至是 xmind 。
去年因为工作需要,深入调研了各类录音硬件,也实际落地推广应用了一些。像 Plaud 、Limitless 这些,特别是 Limitless Pendent ,特地没有设计开关录音键,带上就自动录音始终在线,理念是"你只管带着,其他不用管,需要用的时候来问我"。

这些产品平台每一个都在称自己是"第二大脑"。但实际上大脑越来越多。当你有 10 个大脑后,问题就变成了:我该用哪个脑子?这是个非常令人惆怅的事情。
文本:AI 时代最扎实的底座
所以,把这些散落在各个地方的内容标准化,以一个统一的、平台无关的格式放在一起,就变得格外有意义。应该用什么格式好?
Markdown 、JSON 、XML 、私有协议( Notion 、飞书)、HTML ,似乎都能满足。但当我真正走到这一步的时候,直接选择了 Markdown ,完全没犹豫。如果再精确一点,是 Markdown + YAML——Markdown 负责人类可读的内容,YAML 负责机器可读的骨架。这个小组合可以非常好地满足 local-first 、标准化、AI 友好这些诉求。
在这种选择上,极简和克制是个好东西。谁能想到,2004 年问世的 Markdown 会在 AI 时代焕发新的活力。而 Word 、PDF 这些"富格式"文档的结构化解析,至今仍是大模型落地的实际瓶颈——即便视觉语言模型在文档理解上已经大幅进步,面对复杂排版时仍然会产生难以察觉的幻觉,且缺乏可靠的置信度反馈。

Pierre-Carl Langlais 在一张半开玩笑的 AI 时间线里,"PDF parsing is solved" 被放在了通向 AGI 之前必须攻克的关键节点上。纯文本,反而成了 AI 时代最扎实的底座。
封存的记忆重新连成线
第二个有意义的事,是把这些不同平台的内容拉回来,拉到一个统一的地方。
这件事非常繁琐复杂,全是脏活累活——要去适配各个完全不一样的平台、不一样的工具、不一样的格式、不一样的版本。但在做这个事的过程中,我发现每接入一个平台,就像打通了一处封存的记忆。
我先把 Bear 的笔记接入了,发现我拥有了 2015 到 2018 年的记忆;
然后又把 Notion 接入了,2018 到 2022 年的记忆回来了;
然后接入飞书、印象笔记,再到支持硬盘上的各种文档。
我很惊喜地看到最近十多年来的心路历程连成了一条线。它好像非常懂我,甚至比我自己记得还清楚。
一些有意思的场景
这些事情都做完,有几个让我觉得很有意思、想要分享,甚至有点震撼的的场景:
[ol]

[/ol]
Luminite
这些体验让我确信这条路走对了。所以,我把在自我数字化的实践沉淀下来,打造成了一个工具,它是一个 AI Native 的知识工作台,可以在本地帮你搭一个随时能用的数字大脑:
Luminite https://github.com/luminite-md/luminite


支持的资料库
产品背后的选择
Local-First 数据在本地:向量化语义索引都在本地运行跑,文件以纯文本存在你的磁盘里,不在云端。只有主动发起询问时,才会通过配置好的 API 发送到大模型。产品本身自带了 DeepSeek 的 API (前期测试我来买单),为了长久使用,你也可以选择配置自己的 API Key ( Bring Your Own Key )
Markdown 是一等公民:不管原始数据来自哪,统一解析成带元数据的标准 Markdown 。不锁定任何平台,十年后依然能读,随时能迁走。
Agentic 检索:它会像一个研究员一样反复查、反复想——读完整篇文档、交叉引用多份材料、自己判断还需要补什么信息,直到拼出一个经得起推敲的结论。
多个平台一次接入:Notion 、飞书、Apple Notes 等等,增量同步,后台静默执行。
试试看
如果你也有散落在五六个平台里的记忆,想让它们重新为你工作——试试 Luminite 。
产品目前在内测阶段,完全免费。我很想知道,当你把自己的十年记忆接进来之后,它会帮你想起什么。
欢迎加我微信 luminite-md,聊聊你的数字大脑是怎么长出来的。

