web壁纸网站逆向爬取

作者：就往丶发布时间：2025-9-20 00:32:53

爬取图片地址
网站地址：aHR0cHM6Ly9oYW93YWxscGFwZXIuY29tLw==
f12 分析请求
没有反作弊的
翻页请求发现data请求数据是加密的

image.png (66.02 KB, 下载次数: 0)
下载附件
2025-2-14 00:32 上传

返回数据也是加密的

image.png (62.9 KB, 下载次数: 0)
下载附件
2025-2-14 00:32 上传

data关键词是一个常用变量不适合搜索尝试一下json hook的方式来获取
hook
var my_parse = JSON.parse;
JSON.parse = function (params) {
  // 这里可以添加其他逻辑比如
  debugger
  console.log("json_parse params:",params);
  return my_parse(params);
};

image.png (149.54 KB, 下载次数: 0)
下载附件
2025-2-14 00:32 上传

重新翻页请求数据，然后把debugger全部放掉，可以在控制台里面查看加密的数据和被加密的数据

image.png (1.06 MB, 下载次数: 0)
下载附件
2025-2-14 00:32 上传

代码分析
响应数据解密
在重新翻页把debugger部分断在加密处，往上一个栈查找这个数据在哪里解密的

image.png (235.16 KB, 下载次数: 0)
下载附件
2025-2-14 00:33 上传

可以看到上面这块是发送请求的部分，请求的数据也是加密的应该就是这个部分。

image.png (152.52 KB, 下载次数: 0)
下载附件
2025-2-14 00:33 上传

先放着，往下面走，看看在哪里解密数据
可以发现通过J函数出来之后就是解密的数据了  跟着进J函数

image.png (179.99 KB, 下载次数: 0)
下载附件
2025-2-14 00:33 上传

继续往下面走，A.apply(this && this.$id === e ? this : w, b) 部分就是最后解密

image.png (172.5 KB, 下载次数: 0)
下载附件
2025-2-14 00:33 上传

在跟着进A函数，发现里面有很多老朋友 AES 加密

image.png (88.76 KB, 下载次数: 0)
下载附件
2025-2-14 00:33 上传

尝试进行用原版的测试是否成功
https://cyberchef.org/
From Base64 -> AES Decrypt -> To String 完成数据解密

image.png (794.14 KB, 下载次数: 0)
下载附件
2025-2-14 00:33 上传

请求数据解密
在回到前面，我们可以先测试一下他们俩个的加密方式是不是一样的

image.png (40.89 KB, 下载次数: 0)
下载附件
2025-2-14 00:33 上传

测试出他们的加密方式是相同的

image.png (242.56 KB, 下载次数: 0)
下载附件
2025-2-14 00:42 上传

代码
from base64 import b64encode, b64decode
from Crypto.Cipher import AES
from Crypto.Util.Padding import pad, unpad
import binascii,json,random,requests
key = '68zhehao20776519'  # 密钥
iv = 'aa176b7519e84710' # 初始向量
def aes_encrypt(plain_text, key, iv):
try:
      # 将明文转换为字节并进行填充
      plain_bytes = plain_text.encode('utf-8')
      key_bytes = key.encode('utf-8')
      iv_bytes = iv.encode('utf-8')
      # 创建 AES 加密器对象
      cipher = AES.new(key_bytes, AES.MODE_CBC, iv_bytes)
      # 使用 PKCS7 填充模式填充明文，确保其大小是 AES 块大小的倍数
      padded_data = pad(plain_bytes, AES.block_size)
      # 执行加密操作
      encrypted_data = cipher.encrypt(padded_data)
      # 将加密后的字节数据编码为 Base64
      encrypted_base64 = b64encode(encrypted_data).decode('utf-8')
      return encrypted_base64
except Exception as e:
      print(f"Error during encryption: {e}")
      return None
def aes_decrypt(encrypted_base64_str, key, iv):
try:
      # 解码 Base64 加密字符串
      encrypted_data = b64decode(encrypted_base64_str)
      # 将密钥和 IV 转换为 bytes
      key_bytes = key.encode('utf-8')
      iv_bytes = iv.encode('utf-8')
      # 创建 AES 解密器对象
      cipher = AES.new(key_bytes, AES.MODE_CBC, iv_bytes)
      # 解密数据并去除 padding
      decrypted_data = unpad(cipher.decrypt(encrypted_data), AES.block_size)
      # 将解密后的数据转换为 UTF-8 字符串
      decrypted_str = decrypted_data.decode('utf-8')
      return decrypted_str
except Exception as e:
      print(f"Error during decryption: {e}")
      return None
def getWallpaperList():
headers = {
      "Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8,ja;q=0.7",
      "Cache-Control": "no-cache",
      "Connection": "keep-alive",
      "Pragma": "no-cache",
      "Referer": "https://haowallpaper.com/homeView?isSel=false&page=1",
      "Sec-Fetch-Dest": "empty",
      "Sec-Fetch-Mode": "cors",
      "Sec-Fetch-Site": "same-origin",
      "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Safari/537.36",
      "accept": "application/json",
      "sec-ch-ua": "\"Not(A:Brand\";v=\"99\", \"Google Chrome\";v=\"133\", \"Chromium\";v=\"133\"",
      "sec-ch-ua-mobile": "?0",
      "sec-ch-ua-platform": "\"Windows\"",
}
url = "https://haowallpaper.com/link/pc/wallpaper/getWallpaperList"
data = json.dumps({"page": str(random.randint(1,100)),"sortType":3,"isSel":"false","rows":9,"isFavorites":False,"wpType":1},separators=(',', ':'))
encrypted_data = aes_encrypt(data, key, iv)
#print("Encrypted Data (Base64):", encrypted_data)
params = {
      "data":encrypted_data
}
res = requests.get(url,headers=headers,verify=False,params=params)
#print(res.text)
data_code = res.status_code
if data_code != 200 :
      return ""
decrypted_data = aes_decrypt(res.json()["data"], key, iv)
print("Decrypted Data:", decrypted_data)
decrypted_data = decrypted_data.replace('\x00', '').replace('true', 'True').strip()
print(type(eval(decrypted_data)))
wtId = eval(decrypted_data)["list"][random.randint(0,8)]["wtId"]
print(wtId)
res = requests.get("https://x.haowallpaper.com/link/common/file/getFileImg/" + wtId + ".png",headers=headers)
with open('1.png','wb') as f:
      f.write(res.content)
if __name__ == "__main__":
getWallpaperList()

下载次数, 数据

web壁纸网站逆向爬取

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

web壁纸网站逆向爬取

相关帖子

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告