求一个能测试变量日期网址的代码

查看 37|回复 2
作者:??????   
比如说,我想知道一大堆带日期的网址哪些个是有效的网址。
已知“http://www.abcde.com/********/.html ”是固定的网址。其中********是变量。这个变量的范围是日期简写成的8位数。
举个例子:我要寻找2013年1月1日~2023年12月31日之间的某些个有效的网址,那这个网址就从http://www.abcde.com/20130101/.html 开始测试,一直测试到http://www.abcde.com/20231231/.html 为止
但这工程量十分的巨大。每个日期网址都要写下来然后到浏览器里验证网址是否有效。那不得活活累死
所以说有什么方法,比如编写个代码运行之类的能使这巨大的工程量简便些?
(最好是能在.dat、CMD或者是其他Windows系统自带的软件运行。不想再去下载第三方的编程软件写入代码)

网址, 变量

freelive   

方法一:可以通过类似网站,生成网站地图,方便查阅。
https://sitemap.zhetao.com/
方法二:可以用火车头、八爪鱼等工具,采集网站信息,进行查阅。
https://zhuanlan.zhihu.com/p/102114783
jack98   

import requests
# 网址固定前缀和后缀
prefix = 'http://www.abcde.com/'
suffix = '.html'
# 待测试日期的时间范围
start_year, end_year = 2013, 2023
start_month, end_month = 1, 12
# 循环遍历所有可能的日期,并测试相关网址
for year in range(start_year, end_year + 1):
    for month in range(start_month, end_month + 1):
        # 构建日期字符串并生成对应网址
        date_str = f"{year:04d}{month:02d}01"   # 每个月第一天
        url = prefix + date_str + suffix
        # 访问该网址并检查返回状态码
        res = requests.get(url)
        if res.status_code == requests.codes.ok:
            print(f"{url} exists")
        else:
            print(f"{url} does not exist")
您需要登录后才可以回帖 登录 | 立即注册

返回顶部