批量将下载的公众号文章html转pdf,合并pdf文件

查看 172|回复 14
作者:susheng   
最近用python写了个html转换工具html2pdf.exe https://wwk.lanzouf.com/iSpV90fbtpqh   ,代码如下:
[Asm] 纯文本查看 复制代码def to_pdf():
    import pdfkit
    htmls = []
    for root, dirs, files in os.walk('.'):
     for name in files:
      if name.endswith(".html"):
       print(name)
       try:
        pdfkit.from_file(name, 'pdf/'+name.replace('.html', '')+'.pdf')
       except Exception as e:
        print(e)
工具依赖wkhtmltopdf,先从https://wkhtmltopdf.org/downloads.html 下载,然后将wkhtmltopdf.exe加入环境变量,直接运行html2pdf.exe,导出的pdf文件在pdf目录:


image.png (361.55 KB, 下载次数: 0)
下载附件
2022-12-8 20:50 上传

然后用这个pdf合并工具 https://wwn.lanzouf.com/irAGD089czyj 将所有pdf合成一个文件,比如我将莫言老师的所有文章合成了一个pdf文件,看文章方便多了:


image.png (266.81 KB, 下载次数: 0)
下载附件
2022-12-8 21:37 上传



image.png (323.57 KB, 下载次数: 0)
下载附件
2022-12-8 21:38 上传

下载次数, 文件

susheng
OP
  


zhousong21 发表于 2022-12-10 11:52
谢谢分享,不过这跟CTRL+P比,有啥区别?

批量啊,几百篇文章怎么ctrl+p
ZMC0635   

按步骤来做了,但是打开第一个exe程序就闪退了。
chaoxu680   

什么叫“wkhtmltopdf.exe加入环境变量”?
无敌小儿   


acecttgd 发表于 2022-12-9 08:44
听说有个软件可以在线收藏的,好象是什么笔记。功能差不多吧

为知笔记吧
aocun   

那应该如何下载下载公众号文章呢?
cbkxh   

网页上图片较多时,加载有延迟的所有图片,转成Pdf后,图片都无法显示,不知如何解决
tianyagd   

这个可以有,可以单独现在某一篇,也可以批量下载。我在CSDN下载就用过这种方法
diaoshuai   

好东西,值得收藏
lzs105   

感谢楼主分享
您需要登录后才可以回帖 登录 | 立即注册

返回顶部