1 、只擅长识别简单的文字类型,遇到金融那种嵌套表格、图片的 PPT 、PDF 等等复杂格式就歇菜;
2 、上下文窗口虽大,理解范围却不大,永远是从头第一个字开始解析,超字数了就开始演失忆,把前面的忘光光;
3 、遇到没有的信息可能会瞎编。比方说你提问里包含该公司的资产折旧,明明财报里没这项,AI 硬是给你编了个数字出来。你想核实或证伪还得二次三次提问逐个验证,很麻烦。
4 、没有逻辑层级,张冠李戴。财报里面有很多类目的名称很像,比方说固定投资收入有 100 万,然后下面的 A 项 X 万,B 项 XX 万,C 项 XX 万。C 项下面又分为几类,A 类 XX 万,B 类 XX 万。。。遇到这种很相似的类目名称,AI 很容易搞混,因为理解的时候可能超字数了嘛,就容易把 A 类的收入套到 A 项身上去。
还有就是,财报里面不止一个分析角度,同样的资产,可能在这一章是按虚拟和非虚拟来分的,下一章又是按盈亏来划分的了,AI 很容易混淆,然后给你报个好看的数字。你一看,哎呀不错嘛,一切稳中向好啊,那叫一个勃勃生机万物竞发,等你一真投钱你就完了,今年的绩效都套进去了。
所以,我专门给 AI 搞了一个解析工具,文件会先经过工具理一遍,然后再给到 AI 和 agent 去理解、爬取、输出答案。你可以理解为一种像 RAG 一样的分块处理,但使用的技术要比传统的 RAG 好得多,因为它里面采用了像思维导图一样的树形结构,确保每一个结构层级都被保留了,AI 爬取的时候自然可以“顺杆爬”,更顺畅也更可追溯。如果是传统的 RAG ,它更多是按字数打断的,简单粗暴,上下文没法连贯,所以切片更碎也更难追溯,幻觉也就这么来了。
以及上文提到的,Excel 、PDF 、PPT 格式,它都能解析。出来的结果,每一条都能溯源。加上了解析工具的大模型,输出的准确率高达 90%以上,远超之前单独跑的时候的 60%。(亲测)
https://imgur.com/a/Guu8GR2
所以,各位老哥觉得有用的,不妨尝试一下。链接在这了: https://knowhereto.ai/?utm_source=V2EX

