采集工具是自动识别文章数据结构吗,还是需要提前设定好

查看 67|回复 5
作者:干得漂亮   
好多站长都做过采集吧,我不太明白采集是什么意思,是随便给一个链接,利用采集工具就能分析出网页html的正文、作者、发布时间吗。还是说每一个网站都需要提前写好针对这个网站的内容提取规则。

数据结构, 自动识别

QQiPpq4   
有能直接识别文章正文的,有需要写规则定位的
逅倁逅   
有能直接识别文章正文的,有需要写规则定位的
真厉害seo   
火车头 很好用  试试吧
蓝天有月   
利用页面种固定的源代码,前后截取,这种最常见!
前方   
采集就是类似人工操作
您需要登录后才可以回帖 登录 | 立即注册

返回顶部