毒瘤盗版网站

查看 150|回复 15
作者:150530   
由于英语不好不常用谷歌,百度自然成为首选,用了浏览器插件可以屏蔽大部分广告,但是经常有一些盗版爬虫网站排名特别靠前,经常出现在搜索第一页,这种网站的爬虫每时每刻都在爬数据,几乎每分钟都会爬取新文章,导致搜索时不知道哪个关键词就命中了特别烦人,而且盗的文章很多图片都显示不出来,代码格式更是一坨一坨的,一点看下去的欲望都没有。
我专门去百度搜了一下,这种网站还真不少,都是换皮的,特别是第一个这个淘嘟嘟,搜索关键词 dockerhub mycat pxc 第一页都有它。另外问一下有没有方法可以屏蔽这种网站,最好在百度中不会展示出来
http://www.taodudu.cc
https://www.xdnf.cn
https://www.rstk.cn
http://www.mfbz.cn
https://www.xjx100.cn
https://www.syrr.cn
http://www.hqwc.cn
https://www.exyb.cn
http://dgrt.cn
http://www.cbww.cn

爬虫, 百度, 网站, 盗版

littiefish   
确认挺烦,有时候十几页都是一样的内容。
目前只能改变关键词来处理
JayZXu   
https://greasyfork.org/zh-TW/scripts/14178
用这个脚本,然后 block 这些站点或者添加到屏蔽列表就行了
dfkjgklfdjg   
所以退而求其次用 bing.com 不好吗……
150530
OP
  
@JayZXu 多谢 我去了解下
justxiaoxiao   
油猴脚本:AC-baidu-重定向优化(带过滤、Block 的功能)
https://greasyfork.org/en/scripts/14178
+
浏览器扩展:终结内容农场(有内容农场屏蔽规则)
https://github.com/danny0838/content-farm-terminator
justxiaoxiao   
tampermonkey 脚本:AC 重定向优化(带过滤、Block 的功能)
https://greasyfork.org/en/scripts/14178
+
扩展:终结内容农场(有内容农场屏蔽规则)
https://github.com/danny0838/content-farm-terminator
150530
OP
  
@justxiaoxiao 感谢分享
ChenSino   
谷歌也不影响搜中文啊
gdb   
@justxiaoxiao 你这个插件不错啊!多谢分享,我也去 Firefox 下面试用一下看看。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部