笔趣阁小说爬取程序,100线程秒速下载

查看 118|回复 11
作者:pnnhnjh   
笔趣阁小说爬取程序,100线程极速下载,示例的小说610章,128万字,15秒左右下载完成!运行后打开网站,选取你喜欢的小说,打开小说的目录页面(
[color=]小说目录页
),复制网址(
[color=]如:
https://www.bigee.cc/book/59507/
[color=])
后粘贴到输入提示窗口回车即可。
[color=]注:不输入任何内容直接回车则开始示例小说下载!
[Python] 纯文本查看 复制代码import os
import re
import random
import time
import requests
import threading
from queue import Queue
from lxml import etree
import logging
import colorlog
from requests.adapters import HTTPAdapter
# 配置日志
handler = colorlog.StreamHandler()
handler.setFormatter(colorlog.ColoredFormatter(
    '%(log_color)s%(asctime)s - %(levelname)s - %(message)s',
    log_colors={
        'DEBUG': 'cyan',
        'INFO': 'green',
        'WARNING': 'yellow',
        'ERROR': 'red',
        'CRITICAL': 'bold_red',
    }
))
logger = logging.getLogger()
logger.addHandler(handler)
logger.setLevel(logging.INFO)
user_agents = [
    'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 Edge/18.18363',
    'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36',
    'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:66.0) Gecko/20100101 Firefox/66.0',
    'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36',
    'Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1'
]
# 增加连接池大小
session = requests.Session()
adapter = HTTPAdapter(pool_connections=100, pool_maxsize=100)  # 设置连接池大小为100
session.mount('http://', adapter)
session.mount('https://', adapter)
def get_chaptercontent(chapter_url, temp_file, queue, semaphore, session, max_retries=5):
    semaphore.acquire()  # 获取信号量
    try:
        retry_count = 0
        chaptercontent = ''
        while retry_count

章节, 线程

开创者   


pnnhnjh 发表于 2024-11-27 15:12
类似的网站都可以,自己修改一下哪几个读取标题、章节、内容的解析地址就可以了

随便下了一个:
总耗时:292.13秒 一共:第1271章
能不能改成像火车头那样。写成一个通用的,从列表获取文章链接,下载。重点是防封。感觉PY好麻烦。火车头的方式是一个通吃。这种基本上一个站写一个
pnnhnjh
OP
  


qiaoyingchao 发表于 2024-11-27 19:02
小白问一下:怎么运行?

链接:https://pan.baidu.com/s/13goOG2idoyv_3qazkJ_grw
提取码:h7od
下载这个,win10后版本直接运行!
bz1wsq   

学习中,可以尝试一下
楼主你好萌   

网站已经挂了
zicheng5   

多看多学
banzhuren   

网站已经挂了
qq1475   

直接火车头采集就行
pnnhnjh
OP
  


楼主你好萌 发表于 2024-11-27 14:46
网站已经挂了

能用,没挂
或许舞恋步   

亲测14.41s,大佬牛掰
您需要登录后才可以回帖 登录 | 立即注册

返回顶部