今天看了百度Ai开发者大会,其中的演示让我想到一个问题,普通的知识内容,AI直接就能给出答案,但是一些数据性的内容是需要更新的,AI也还是要从源网站爬取得来,但是百度流量都不导给网站了,网站就没有生存的基础了,也就没人做网站了,那么他还能从哪里获得数据呢? 数据, 网站
大模型的数据是有延后性的,训练截止时间23年,那大模型的数据来源就停留在23年,所以大模型会不断的更新,结合最新的数据来训练,但总是会有一段时间的延迟。也有部分大模型比如kimi是可以联网搜索的,他会结合最新搜索到的数据来生成回答,弊端就搜索到的数据来源可能极不稳定甚至是错误的