义务教育阶段教材下载

作者：Senkita 发布时间：2023-2-2 20:00:37

背景
临时需要几本人教版教材，就跑去人民教育出版社查看。
但是离网环境阅读不便，于是就想说下载下来。
网站没做反爬，直接爬取就行。所以这只是段随手写的几行小脚本，方便自用而已，大佬勿喷。

另：其他版本教材可到国家中小学智慧教育平台获取。在对应教材阅读页打开开发者工具-网络，下载异步加载完成的pdf.pdf文件即是。

教材版权归出版社所有，在此仅作代码交流用途。
地址
[ol]

仓库：Textbook Crawler
[/ol]
代码
import os
import requests
from PIL import Image
class Crawler:
  textbooks: dict[str, dict[str, int]]
  def __init__(self, textbooks: dict[str, dict[str, int]]) -> None:
self.textbooks = textbooks
  def download_pic(self, book: str) -> None:
'''
description: 下载图片
param    {*} self
param    {str} book
return    {*}
author    : Senkita
'''
os.makedirs(book, exist_ok=True)
book_id: int = self.textbooks[book]['id']
pages: int = self.textbooks[book]['pages']
for page in range(pages):
   page_num: int = page + 1
   url: str = 'https://book.pep.com.cn/{}/files/mobile/{}.jpg'.format(
      book_id, page_num
   )
   res = requests.get(url)
   with open('{}/{}.jpg'.format(book, page_num), 'wb') as f:
      f.write(res.content)
  @staticmethod
  def sort_pic(book: str) -> list:
'''
description: 图片排序
param    {str} book
return    {list}
author    : Senkita
'''
files: list = []
for file in os.listdir(book):
   if file[-4:] == '.jpg':
      files.append(file[:-4])
files.sort(key=lambda ele: int(ele))
return files
  @staticmethod
  def generate_pdf(book: str, files: list) -> None:
'''
description: 生成PDF
param    {str} book
param    {list} files
return    {*}
author    : Senkita
'''
pics: list = []
pdf: Image.Image = Image.open('{}/{}.jpg'.format(book, files[0]))
files.pop(0)
for pic in files:
   img: Image.Image = Image.open('{}/{}.jpg'.format(book, pic))
   if img.mode == 'RGBA':
      img = img.convert('RGB')
   pics.append(img)
pdf.save(
   './{}.pdf'.format(book),
   'PDF',
   resolution=100.0,
   save_all=True,
   quality=100,  # 清晰度
   subsampling=0,
   append_images=pics,
)
  def run(self) -> None:
for book in self.textbooks:
   self.download_pic(book)
   files: list = self.sort_pic(book)
   self.generate_pdf(book, files)

教材, 代码

义务教育阶段教材下载

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

义务教育阶段教材下载

相关帖子

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告