请教一下爬虫问题，有的 response 为什么不能在 Python ...

作者：nyxsonsleep 发布时间：2024-2-26 00:01:38

请教一下爬虫问题，有的 response 为什么不能在 python 上解析？
同样的请求在网页的 network 里面可以解析，在 fiddler 里面也能解析。
fiddler 获取截取到了 python 的 response ，可以正常解析，
response = requests.get(url, headers=headers, proxies=proxies, verify=False)
response.encoding = 'utf-8'
print(response.text) #乱码
print(response.content.decode('utf-8')) #乱码
试了 utf8 、gbk 、gb180xx 、gb23xx 、ISO-xxx 之类的都无法正确解析。

response, 解析, Python

相关帖子

NotFoundEgg 2024-2-26 00:02:29

请求头里 Accept-Encoding 的 br 去掉试试
给出的信息太少了没法猜原因

nyxsonsleep

OP

2024-2-26 00:03:09

@NotFoundEgg 🐂🐂🐂感谢大佬。
以前我好像也遇到过，但是没想起来哈，这个是压缩方式的原因吧？请教一下 br 是什么压缩方式，为什么 requests 默认不支持呀，还是说我的实现方式有问题。

NotFoundEgg 2024-2-26 00:03:44

@nyxsonsleep br 压缩体积更小，但要额外解析

NotFoundEgg 2024-2-26 00:04:41

@NotFoundEgg 我之前踩过这个坑，好像安个依赖就好了。但最简单粗暴的方法就是把 Accept-Encoding 里的 br 去掉

zsh2517 2024-2-26 00:05:18

@nyxsonsleep @NotFoundEgg 关键词 brotli ，HTTP 传输的时候可选的一种方式（以前是 gzip ，现在在往 br 过渡，br 压缩后的体积要比 gzip 小一些）。
搜了一下，requests 库有一个相关的 issue： https://github.com/psf/requests/issues/4525 ，大概要点是
1. python requests 库支持 br 依赖于 urllib3
2. 根据时间，两三年前已经支持了
3. “#5783 proposes a patch to request and decode in brotli, transparently by Requests, whenever the package brotli or brotlicffi are installed.”，似乎安装了 brotli 或者 brotlicffi 之后，才会自动解码
综上，结合 #4 提到的“好像安个依赖”，应该是 python 没有内置 br 相关算法，然后 requests 依赖的 urllib3 会根据当前环境是否额外装了 brotli ，决定是否自动解压缩

请教一下爬虫问题，有的 response 为什么不能在 Python 上解析？

相关帖子

浏览过的版块

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

请教一下爬虫问题，有的 response 为什么不能在 Python 上解析？

相关帖子

浏览过的版块

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告