求一个稳定的定向爬取wx公众号文章方案

查看 60|回复 4
作者:一念苍穹变   
大佬们,之前一直是通过中间人代{过}{滤}理去抓取指定公众号的文章列表,链接如下:https://mp.weixin.qq.com/mp/profile_ext?action=home&__biz=MzI4NjQyMTM2Mw==&scene=124#wechat_redirect,最近爬取公众号数量增到500个左右,直接封了wx号这个链接的访问权限。
然后查到了一个方案,通过注册公众号,根据文章创作草稿箱去检索指定的公众号文章。方案链接如下:https://blog.csdn.net/jingyoushui/article/details/131613819。这种方案个人感觉有风险,容易封号。并且cookie和token暂时没方案自动更新,需要在失效时人工替换。
所以发帖请问大佬们现在有没有什么比较成熟的方案?主要需求就是实时/定时爬取指定公众号的最新文章/文章链接,先谢过大佬

公众, 方案

baliao   

我上次获取一个公众号2000+视频就是采用你说的 注册公众号,根据文章创作草稿箱去检索 公众号文章, 将文章链接写入到excel中, 然后读excel 后另外再去下载视频.  爬取太多了就会提示远程关闭访问,就需要重来.
如果公众号固定,更新的不多, 每次爬取的也不多.
阿伟de大长腿   

我有做这个东西,不封号,可以定时获取最新的文章,感兴趣私我看
一念苍穹变
OP
  


baliao 发表于 2024-6-18 21:25
我上次获取一个公众号2000+视频就是采用你说的 注册公众号,根据文章创作草稿箱去检索 公众号文章, 将文章 ...

更新确实不多,但是基本上每天每个公众号最少得抓一次列表。重来别的都好说,就这个扫码登录这步太无解了。
HalaTest   

五百就封了,啧啧啧
您需要登录后才可以回帖 登录 | 立即注册

返回顶部