某红书图片无水印单个/批量下载源码

作者：邪帝发布时间：2023-3-16 23:00:47

起因：刚刚逛论坛发现发了一个小红书无水印的下载，于是我就上GitHub上逛了逛
过程：看到一个接口，运行发现可能出现报错，进行了以下代码优化原地址GitHub
原先为数组下载，更改为单个获取以及读取文本批量下载
[color=]PS：需要COOKIE
(小红书网页版获取ck)
软件就不打包了，直接上代码，虚拟机python环境测试正常测试结果如下：
1.拷贝代码
2.安装支持库
3.运行结果
单个：

image.png (45.92 KB, 下载次数: 0)
下载附件
2023-3-16 15:59 上传

批量：

image.png (76.55 KB, 下载次数: 0)
下载附件
2023-3-16 16:01 上传

代码如下：[Python] 纯文本查看复制代码import requests
from bs4 import BeautifulSoup
import os
import re
import json
def mkdir(path):
'''
  创建文件夹
  '''
folder = os.path.exists(path)
if not folder:  # 判断是否存在文件夹如果不存在则创建为文件夹
      print("---  创建新的文件夹😀  ---")
      os.makedirs(path)  # makedirs 创建文件时如果路径不存在会创建这个路径
      print("---  OK 🚩 ---")
else:
      print("--- ⚠️ 文件夹已存在!  ---")
def fetchUrl(url):
'''
发起网络请求，获取网页源码
'''
headers = {
      'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9 ',
      'cookie': '',
      # 换成自己的cookie哦~
      'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 UBrowser/6.2.4098.3 Safari/537.36',
}
r = requests.get(url, headers=headers)
return r.text
def parsing_link(html):
'''
解析html文本，提取无水印图片的 url
'''
soup = BeautifulSoup(html, 'html.parser')
script = soup.find('script', string=re.compile('window\.__INITIAL_STATE__'))
test = re.split(r'=', script.string)
# print(test)
# 处理字符串json数据不合理的地方
string = test[1].replace('undefined', 'null')
# 转换成json数据
result = json.loads(string, strict=False)
# 获取对应字段
imageList = result.get('note', {}).get('note', {}).get('imageList')
title = result.get('note', {}).get('note', {}).get('title')
if title == '':
      title = result.get('note', {}).get('note', {}).get('desc')
title = sanitize_folder_name(title)
if imageList and title:
      print('标题：', title)
      print('开始下载啦！🚀')
      # 调用生成以title为名的文件夹, 可自定义要保存的路径
      file = os.path.dirname(__file__) + '/image/' + title
      mkdir(file)
      # 提取图片
      for i in imageList:
         picUrl = f"https://sns-img-qc.xhscdn.com/{i['traceId']}"
         yield picUrl, i['traceId'], title
def download(url, filename, folder):
'''
下载图片
'''
headers = {
      'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 UBrowser/6.2.4098.3 Safari/537.36',
}
try:
      r = requests.get(url, headers=headers)
      # 获取图片格式
      content_type = r.headers.get('Content-Type')
      image_format = content_type.split('/')[-1]
      # print(f'Image format: {image_format}')
      # 如果 image_format 不是图片格式的后缀，则将其更改为 jpeg
      if image_format not in ['jpeg', 'png', 'gif', 'bmp']:
         image_format = 'jpeg'
      # 根据检测到的格式保存文件
      with open(f'image/{folder}/{filename}.{image_format}', 'wb') as v:
         v.write(r.content)
except Exception as e:
      print('图片下载错误！')
# 修正文件夹命名
def sanitize_folder_name(name: str) -> str:
# 替换非法字符
name = re.sub(r'[:"/\\|?*]', '_', name)
# 删除首尾空格
name = name.strip()
# 截断过长的名称
if len(name) > 255:
      name = name[:255]
return name
def roopLink(url):
html = fetchUrl(url)
traceId = 0
for url, _, title in parsing_link(html):
      print(f"download image {url}")
      download(url, traceId, title)
      traceId += 1
if __name__ == '__main__':
choice = input("请输入选项 (1: 循环获取链接; 2: 获取文本地址并下载): ")
if choice == '1':
      while True:
         links = input("请输入小红书的链接 (输入 'end' 结束程序): ")
         if links == 'end':
            break
         roopLink(links)
elif choice == '2':
      file_path = input("请输入文本文件地址(回车默认是1.txt): ")
      if file_path == '':
         file_path = '1.txt'
      with open(file_path, 'r') as f:
         links = f.read().splitlines()
      for link in links:
         roopLink(link)
print("下载完成啦!🎉")

新宋体, 文件夹

某红书图片无水印单个/批量下载源码

相关帖子

浏览过的版块

热门主题

国产英伟达，摩尔把上市融资的75亿元拿去买

✅DMIT 三网 GIA CMIN2 MALIBU EB 维多利亚

有MJJ遇到过TG号全部设备都被登出了吗？

【快讯】HostHatch Seoul HH 新节点首尔

Hk-One-0.5G-52-LS 少量放貨速度

公司项目分享：硅谷人工智能公司 Nexa AI

拿到了 300 来部短剧的海外发行版权，下一

长话短说大家觉得花三十万结婚，存款花完

建议拉黑 IObit 旗下所有软件

重度苹果用户投华做了两面派

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

某红书图片无水印单个/批量下载源码

相关帖子

浏览过的版块

热门主题

国产英伟达，摩尔把上市融资的75亿元拿去买

✅DMIT 三网 GIA CMIN2 MALIBU EB 维多利亚

有MJJ遇到过TG号全部设备都被登出了吗？

【快讯】HostHatch Seoul HH 新节点 首尔

Hk-One-0.5G-52-LS 少量放貨 速度

公司项目分享：硅谷人工智能公司 Nexa AI

拿到了 300 来部短剧的海外发行版权，下一

长话短说 大家觉得花三十万结婚，存款花完

建议拉黑 IObit 旗下所有软件

重度苹果用户投华做了两面派

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

【快讯】HostHatch Seoul HH 新节点首尔

Hk-One-0.5G-52-LS 少量放貨速度

长话短说大家觉得花三十万结婚，存款花完

在 Yoo趣儿投放广告