大模型底下的踩和赞是如何进一步影响到大模型的

查看 15|回复 0
作者:weishao666   
大模型了解的比较模糊,主流的大模型平台对话框底下的踩和赞应该就是 RLHF 的前置步骤,即数据的收集,收集了之后一般是怎么影响到模型的呢,是不是还要隔一段时间将数据处理成指令数据集的格式,进行一轮微调?
您需要登录后才可以回帖 登录 | 立即注册

返回顶部