众所周知,科学文库打印限制100页,而且在代码中,图片被脚本分成了6份,但是我在打印图书的时候,发现打印的页面有时会损坏,一定是获取图片失败的征兆,所以我尝试获取那些图片
https://book.sciencereading.cn/shop/book/Booksimple/show.do?id=B6252986009463779E053020B0A0A2867000
比如这本书,点击打印的时候,打开DevTools:
[i]
发现网页在调取很多xhr,随便点开一个,右键->在新标签页中打开,这时神奇的事情发生了,我们获取到了完整的图片:
[i]
(规律:第一张图片是0,第二张是1...依此类推)
最后使用Python合并图片即可,对于清晰度问题,可发现后面的数字是100,改成1000有奇效哦