[机器学习相关] 含有大量标签错误的数据如何建模?

查看 68|回复 4
作者:TongDu   
想问问各位大佬,在二分类任务中,原始数据很多标签错误(假阳性超 90%),没法通过基于人工或者规则的方法清洗数据,有什么好的算法或者策略来识别出标签错误数据呢?
发现这里没有 AI 算法相关节点,而大家都用 python ,我就发现这里吧。

标签, 错误, 算法, 数据

thinkershare   
没啥好办法,我也想要支持知道。
leimao   
0/1 二元分类,标签错误 90%
那你 flip 一下标签,标签正确率不就是 90%了么
leimao   
我仔细看了下,你说的是 false positive 90%,不好意思。
leimao   
好多年前碰过这个 loss function 对 noisy label 比较 robust 。
https://arxiv.org/abs/1805.07836
这些年可能还有新的进展。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部