QQ截图20230211144654.jpg (28.61 KB, 下载次数: 0)
下载附件
2023-2-11 15:19 上传
wordpress网站更适合发表博客,自带目录功能。discuz侧更注重于交流,所以回复功能较为丰富,正文区域功能稍弱。
在wordpess模板做的网站上,经常看到一篇文章中自带目录。但是这种目录下,只显示当前章
(目录文字会显示浅色)
的内容,其余内容需要一个个点击打开新标签页。
如果能把这些目录的超链接保存下来,然后按照顺序去依次访问,并且获取正文内容,存储到文件中,那么就可以一键保存多章节的文章了。
首先写一个函数文件,定义好各个功能:(
hanshu.py
)
daima1.jpg (96.66 KB, 下载次数: 0)
下载附件
2023-2-11 15:19 上传
daima2.jpg (115.58 KB, 下载次数: 0)
下载附件
2023-2-11 15:19 上传
然后写一个主程序函数进行调用
zhuchengxu.py
[Python] 纯文本查看 复制代码from hanshu import get_biaoti, getmulu, get_neirong, get_and_write
import os
url=input('输入网址(多章节选择第一章的地址):\n')
if not os.path.exists("txt_dir"):
os.makedirs("txt_dir") #新建一个文件夹 txt_dir ,保存文档
biaoti=get_biaoti(url)
print(biaoti)
filename=os.path.join("txt_dir",biaoti)+'.txt'
mulu_list=getmulu(url)
get_and_write(filename, mulu_list )
input('下载完毕,按回车键退出——')
微信截图_20230211150038.png (25.92 KB, 下载次数: 0)
下载附件
2023-2-11 15:19 上传
提示有敏感内容,只好发成截图了,不影响看。