首页
论坛
Yoo趣儿
›
Geek
›
站长
›
做采集站两个多月的分享
做采集站两个多月的分享
查看
373
|
回复
19
sfjio
2023-6-15 06:09:10
好技术啊哈哈
硝烟弥漫天堂
2023-6-15 06:09:49
中国最帅的男人 发表于 2023-6-14 09:54
内容不匹配,两种方式,第一,判断标题是否有自己需要的关键词。第二,
大佬,第二呢?
bug
2023-6-15 06:10:32
第二个就是图片太多了,过滤掉头条图片,自己写一个火车头插件生成一张小图
散落漫天
2023-6-15 06:11:17
感谢分享。大佬更新频率是多少啊
张益达
2023-6-15 06:11:50
感谢分享 学习了
张益达
2023-6-15 06:12:33
大佬这个是已BA域名吧
相依
2023-6-15 06:13:03
图直接引用
無剑
2023-6-15 06:13:55
选词的再加个过滤 加上收录结果小于多少的效果还更好
小贝
2023-6-15 06:14:46
关键词这个,可以用分词组件,或者走百度分词接口
我用的分词组件分标题,然后用分词组件把内容都分词,把内容前几的关键词和标题相匹配去开源网站api配图,这种 准确可以达70%。
小贝
2023-6-15 06:15:25
你这效果比我好,我一个多月了,二万条,就收了一千五。
1
2
/ 2 页
返回列表
您需要登录后才可以回帖
登录
|
立即注册
发表回复
搜索
热门主题
一个连收录都没有的站都会被盯上?
TransOne: macOS 原生菜单栏翻译工具
2026 开一个公司,经验分享篇
微软 2FA 好像可以云备份了
大佬们,现在哪种cms程序自动采集还能快速
胡润财富报告:全国每100户家庭中 就有一户
做一个怀旧网,卖一些怀旧老物件,大家觉得
我感觉 Codex 的编码能力还没有到足够强大
分享一个自用的专门针对飞书消息渠道展示优
有没有支持下行 PD/PPS 供电+数据的扩展坞/
热门板块
问与答
分享发现
分享创造
奇思妙想
分享邀请码
商业推广
优惠信息
Python
PHP
Java
JavaScript
Node.js
Go语言
C++
HTML
公告
网站帮助 - Yoo趣儿
2022-03-27
我们的愿景
2022-03-27
在 Yoo趣儿 投放广告
2022-03-27
Yoo趣儿网站用户应遵守规则
2022-03-24
返回顶部