上来要大佬给我写爬虫,自己捣鼓出来了!!!

查看 33|回复 1
作者:芭啦啦能量   
不过,
不太智能,,需要手动整理 tbody 里面数据贼乱,用正则 json啥的都筛选不出来!!!
工具是万能的 PY
1.模拟登录请求。
2.手动获取表单文件,将表单中的fileid存到tempfileid.txt中  /使用notepad++替换
3.执行 getAccessory.py 生成对应的fileid的getAccessory.do文件,并获取真实的fileid值
3.提取getAccessory.do文件真实的fileid值,重命名为getAccessory.txt  //使用notepad++替换
4.运行 down.py 拼接网址保存为getdownload.txt,并下载!!!!
有大佬帮我优化一下嘛!!!
现在好几个文件!!!!!

大佬, 文件, 表单

mhsl   
不说预算没
您需要登录后才可以回帖 登录 | 立即注册

返回顶部