第一试卷下载

作者：暗无天日发布时间：2024-6-13 22:00:34

[ 本帖最后由暗无天日于 2024-6-13 11:12 编辑 ]\n\n前几天在论坛上看到一篇关于【第一试卷网】下载的帖子，感到没有达到自己想要的功能，于是就尝试着自己写了一版。在这一版里可以选择【科目】【年级】以及下载的【版本】，这样可以有更多的选择。现在奉上，其中难免有不尽人意的地方，请群里高手给与指正！
import requests
from bs4 import BeautifulSoup
def page_count(url):
html = requests.get(url)
html.encoding = "gb2312"
soup = BeautifulSoup(html.text, "html.parser")
page = soup.find("ul", class_="pagelist")
count = page.find("strong").string
pagelist = page.find_all("li")
page_ul = page.find("a").get("href").rsplit("_",1)[0]
for i in range(1,int(count)+1):
      if i==1:
         down_test(url)
      else:
         page_url = url+"/"+page_ul+"_"+str(i)+".html"
         down_test(page_url)
def down_test(url):
html = requests.get(url)
html.encoding= "gb2312"
soup = BeautifulSoup(html.text,"html.parser")
test_list = soup.find("ul", class_="c1")
test_tr = test_list.find_all("tr")
for tr in test_tr:
      if verson in tr.text:
         test_td = tr.find("a").get("href")
         ur = test_td.split("/")[-1]
         name = tr.find("a").string             #试卷的文件名
         test_ur = url+"/"+ur    #试卷下载网址
         test = requests.get(test_ur)
         test.encoding="gb2312"
         test_soup = BeautifulSoup(test.text,"html.parser")
         test_html = test_soup.find("ul",class_="downurllist")
         with open(path+"\\"+name+".rar","wb") as f:
            f.write(test.content)
if __name__ == '__main__':
print(
      "数据来源：第一试卷网(www.shijuan1.com)  仅支持个人研究和学习,商用请联系官方授权.\n")
print("声明:本代码仅供学习研究使用,请勿用于商业用途,否则后果自负!")
print("声明:本代码仅供学习研究使用,请勿用于商业用途,否则后果自负!")
print("声明:本代码仅供学习研究使用,请勿用于商业用途,否则后果自负!\n")
sb = ["语文试卷","数学试卷","英语试卷","物理试卷","化学试卷","政治试卷","历史试卷","地理试卷","生物试卷"]
gd = "一年级  二年级  三年级  四年级  五年级  六年级  七年级  八年级  九年级  中考试卷  高一  高二  高三  高考试卷"
for i in sb:
      if i =="语文试卷" or i =="数学试卷" or i =="英语试卷":
         print(f'{i}:{"  "}{gd}')
      elif i =="物理试卷" :
         print(f'{i}:{"  "}{gd[35:]}')
      elif  i=="化学试卷":
         print(f'{i}:{"  "}{gd[40:]}')
      elif i =="政治试卷" or i =="历史试卷":
         print(f'{i}:{"  "}{gd[30:]}')
      else:
         print(f'{i}:{"  "}{gd[30:38]}{gd[42:]}')
u = "https://www.shijuan1.com/"
subject = {
      "语文试卷":'/a/sjyw',"数学试卷":'/a/sjsx',"英语试卷":'/a/sjyy',"物理试卷":'/a/sjwl',"化学试卷":'/a/sjhx',
            "政治试卷":'/a/sjzz',"历史试卷":'/a/sjls',"地理试卷":'/a/sjdl',"生物试卷":'/a/sjsw'
}
grade = {
      "一年级":"1","二年级":"2","三年级":"3","四年级":"4","五年级":"5","六年级":"6","七年级":"7","八年级":"8","九年级":"9",
      "中考试卷":"zk","高一":"g1","高二":"g2","高三":"g3","高考试卷":"gk"
}
s = input("请输入科目名称：")
g = input("请输入年级：")
url = u + subject[s] + grade[g]
verson=input("请输入版本信息：")
path = input("请输入要保存文件的路径：")
down_test(url)
page_count(url)

试卷, 请输入

相关帖子

vethenc 2024-6-13 22:01:11

接着，补充几点使用说明。帮助大家更好的使用这个神器！目前孩子们都在复习阶段了，正好用上这个！
1.运行不成功，提示错误。
原因：缺少第三方库的支持。
解决办法：在cmd库中安装本程序需要的2个库，一个是request，一个是bs4。
不会安装python第三方库的，请百度。
举例：pip install request。
2.软件成功运行。提示输入内容阶段出错。
原因：本软件一共需要提供（输入）4个选项。分别是：科目、年级、版本信息和保存路径。
解决办法：
①科目可以输入："语文试卷","数学试卷","英语试卷","物理试卷","化学试卷","政治试卷","历史试卷","地理试卷","生物试卷"。（输入时省略双引号，下同）
②年级可以输入："一年级"、"二年级"、……"九年级"、"中考试卷"、……"高考试卷"等。（具体科目对应的年级，程序运行成功会有提示的）
③版本可以输入：“人教版”。（推测可能由“苏教版”等等，具体可以登录“第一试卷网”查看后，根据实际需要填写）
④路径可以输入：“./”。（保存路径为当前py程序主目录。需要建文件夹的，可以根据需要拓展）

vethenc 2024-6-13 22:01:58

经测试，完全没问题。运行正常，下载正常，北京明白！
首先帮大佬排个版。
import requests
from bs4 import BeautifulSoup
def page_count(url):
html = requests.get(url)
html.encoding = "gb2312"
soup = BeautifulSoup(html.text, "html.parser")
page = soup.find("ul", class_="pagelist")
count = page.find("strong").string
pagelist = page.find_all("li")
page_ul = page.find("a").get("href").rsplit("_",1)[0]
for i in range(1,int(count)+1):
      if i==1:
         down_test(url)
      else:
         page_url = url+"/"+page_ul+"_"+str(i)+".html"
         down_test(page_url)
def down_test(url):
html = requests.get(url)
html.encoding= "gb2312"
soup = BeautifulSoup(html.text,"html.parser")
test_list = soup.find("ul", class_="c1")
test_tr = test_list.find_all("tr")
for tr in test_tr:
      if verson in tr.text:
         test_td = tr.find("a").get("href")
         ur = test_td.split("/")[-1]
         name = tr.find("a").string             #试卷的文件名
         test_ur = url+"/"+ur    #试卷下载网址
         test = requests.get(test_ur)
         test.encoding="gb2312"
         test_soup = BeautifulSoup(test.text,"html.parser")
         test_html = test_soup.find("ul",class_="downurllist")
         with open(path+"\\"+name+".rar","wb") as f:
            f.write(test.content)
if __name__ == '__main__':
print(
      "数据来源：第一试卷网(www.shijuan1.com)  仅支持个人研究和学习,商用请联系官方授权.\n")
print("声明:本代码仅供学习研究使用,请勿用于商业用途,否则后果自负!")
print("声明:本代码仅供学习研究使用,请勿用于商业用途,否则后果自负!")
print("声明:本代码仅供学习研究使用,请勿用于商业用途,否则后果自负!\n")
sb = ["语文试卷","数学试卷","英语试卷","物理试卷","化学试卷","政治试卷","历史试卷","地理试卷","生物试卷"]
gd = "一年级  二年级  三年级  四年级  五年级  六年级  七年级  八年级  九年级  中考试卷  高一  高二  高三  高考试卷"
for i in sb:
      if i =="语文试卷" or i =="数学试卷" or i =="英语试卷":
         print(f'{i}:{"  "}{gd}')
      elif i =="物理试卷" :
         print(f'{i}:{"  "}{gd[35:]}')
      elif  i=="化学试卷":
         print(f'{i}:{"  "}{gd[40:]}')
      elif i =="政治试卷" or i =="历史试卷":
         print(f'{i}:{"  "}{gd[30:]}')
      else:
         print(f'{i}:{"  "}{gd[30:38]}{gd[42:]}')
u = "https://www.shijuan1.com/"
subject = {
      "语文试卷":'/a/sjyw',"数学试卷":'/a/sjsx',"英语试卷":'/a/sjyy',"物理试卷":'/a/sjwl',"化学试卷":'/a/sjhx',
            "政治试卷":'/a/sjzz',"历史试卷":'/a/sjls',"地理试卷":'/a/sjdl',"生物试卷":'/a/sjsw'
}
grade = {
      "一年级":"1","二年级":"2","三年级":"3","四年级":"4","五年级":"5","六年级":"6","七年级":"7","八年级":"8","九年级":"9",
      "中考试卷":"zk","高一":"g1","高二":"g2","高三":"g3","高考试卷":"gk"
}
s = input("请输入科目名称：")
g = input("请输入年级：")
url = u + subject[s] + grade[g]
verson=input("请输入版本信息：")
path = input("请输入要保存文件的路径：")
down_test(url)
page_count(url)

天天涨停天天盈 2024-6-13 22:02:39

大佬，有没有成品可以用呢，都是代码小白不会用

gotofei 2024-6-13 22:03:34

py运行出错了

First 2024-6-13 22:04:28

下载后提示压缩文件已损坏

mebyan 2024-6-13 22:05:24

下载后提示压缩文件已损坏+1
此外，程序中，pagelist、test_html没有用到，"请输入版本信息："在程序中好象没有体现，随便输了一个“1”

life9999 2024-6-13 22:06:15

工具软件不错，下来试试

vethenc 2024-6-13 22:06:58

最后，我也遇到6楼的问题了。下载的文件大小全部是3KB，解压提示文件损坏。还请楼主出来解答一下。@暗无天日

jiangtaixiaozhu 2024-6-13 22:07:48

这是个好东西

第一试卷下载

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

第一试卷下载

相关帖子

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告