请教大佬们：我用 selemium 爬虫这个网站，打开网页就报 ...

作者：ChatGPTpro 发布时间：2023-10-14 18:02:27

如题，大佬们
https://moscow.online.lenta.com/
这个网站，用 selemium 爬这个网站，driver.get 打开网页就报错 403forbidden
有没有大佬教教小弟，感谢

相关帖子

youngce 2023-10-14 18:02:59

chagtgpt3.5 如是说道：
当使用 Selenium 访问网站时遇到 403 错误（禁止访问）通常是因为网站检测到了你的请求不是来自一个正常的浏览器用户，而是来自一个自动化脚本或机器人。为了解决这个问题，你可以考虑以下几种方法：
1. **使用合适的 User-Agent**：User-Agent 是 HTTP 请求头中的一部分，它描述了你所使用的浏览器和操作系统。有时候，网站会检查 User-Agent ，如果它看起来像是来自一个爬虫或机器人的话，就会拒绝访问。你可以设置 User-Agent 来模仿一个正常的浏览器请求。
```python
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
options = Options()
options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36")
driver = webdriver.Chrome(chrome_options=options)
```
2. **使用代理**：使用代理服务器可以隐藏你的真实 IP 地址，有时可以帮助绕过 IP 封锁或访问限制。请注意，不要违反网站的使用政策或法律法规。
3. **减慢请求速度**：有些网站可能会检测到你的请求速度过快，从而认定你是机器人。你可以在 Selenium 中添加等待时间，模拟人类的浏览行为。
```python
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
# 等待元素可见
element = WebDriverWait(driver, 10).until(
EC.presence_of_element_located((By.ID, "myElement"))
)
```
4. **使用 Selenium 的无头模式**：无头浏览器模式不会打开可见的浏览器窗口，这可能会降低被检测到的风险。
```python
from selenium import webdriver
options = webdriver.ChromeOptions()
options.add_argument('--headless')
driver = webdriver.Chrome(options=options)
```
5. **遵守网站的使用政策**：最重要的是确保你的爬虫或机器人不会滥用网站，遵守网站的使用政策和 Robots.txt 文件中的规则。
请注意，网站可以随时更改其反爬虫措施，所以你可能需要不断调整你的策略以应对这些变化。同时，确保你的爬取是合法的，不会侵犯版权或隐私等法律法规。

ChatGPTpro

OP

2023-10-14 18:03:34

@youngce 感谢，但是其实我也问过 GPT 了，没啥用😂😂

请教大佬们：我用 selemium 爬虫这个网站，打开网页就报错 403forbidden

相关帖子

浏览过的版块

热门主题

求推荐 300 价位电视盒子

[分享] 纯前端撸了一个「交互式哺乳动物演

她说离婚原因是男的挣不到钱

这是缅北开发的游戏…

短视频里，高速现在都开始堵车了啊，大家都

百度统计或者cnzz的数据，来源分析，直接访

必应移动端有流量的吗？

发现了很多这种后缀的的百度收录，是怎么做

我看那个huoban网站权重被百度干没了。。。

按 Ctrl 好累？我不是一个人吧

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

请教大佬们：我用 selemium 爬虫这个网站，打开网页就报错 403forbidden

相关帖子

浏览过的版块

热门主题

求推荐 300 价位电视盒子

[分享] 纯前端撸了一个「交互式哺乳动物演

她说离婚原因是男的挣不到钱

这是缅北开发的游戏…

短视频里，高速现在都开始堵车了啊，大家都

百度统计或者cnzz的数据，来源分析，直接访

必应移动端有流量的吗？

发现了很多这种后缀的的百度收录，是怎么做

我看那个huoban网站权重被百度干没了。。。

按 Ctrl 好累？我不是一个人吧

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

在 Yoo趣儿投放广告