做采集站两个多月的分享

查看 176|回复 19
sfjio   
好技术啊哈哈
硝烟弥漫天堂   
中国最帅的男人 发表于 2023-6-14 09:54
内容不匹配,两种方式,第一,判断标题是否有自己需要的关键词。第二,

大佬,第二呢?
bug   
第二个就是图片太多了,过滤掉头条图片,自己写一个火车头插件生成一张小图
散落漫天   
感谢分享。大佬更新频率是多少啊
张益达   

感谢分享 学习了
张益达   
大佬这个是已BA域名吧
相依   
图直接引用
無剑   
选词的再加个过滤  加上收录结果小于多少的效果还更好
小贝   
关键词这个,可以用分词组件,或者走百度分词接口
我用的分词组件分标题,然后用分词组件把内容都分词,把内容前几的关键词和标题相匹配去开源网站api配图,这种 准确可以达70%。
小贝   
你这效果比我好,我一个多月了,二万条,就收了一千五。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部