训练类 ChatGPT 模型时如何避免模型自己生成的样本?

查看 44|回复 0
作者:satoru   
随着越来越多的人在网上部分或全部使用这类模型生成的文本,用爬虫抓训练数据时可能得到大量模型自己生成的文本影响训练的效果。怎样可以避免这类“自产自销”的样本?
您需要登录后才可以回帖 登录 | 立即注册

返回顶部