from selenium import webdriver
import time
driver = webdriver.Chrome()
# url = "https://www.xiaohongshu.com/user/profile/6520e7d10000000024017cfc"
url = "https://www.xiaohongshu.com/user/profile/6262794f000000002102a1e4"
# 访问某个网页
driver.get(url) # 使用驱动实例打开指定的网页
driver.maximize_window()
temp_height = 0
while True:
# 循环将滚动条下拉
driver.execute_script("window.scrollBy(0,600)")
# sleep一下让滚动条反应一下
time.sleep(1)
# 获取当前滚动条距离顶部的距离
check_height = driver.execute_script(
"return document.documentElement.scrollTop || window.pageYOffset || document.body.scrollTop;")
# 如果两者相等说明到底了
if check_height == temp_height:
print("到底了")
break
temp_height = check_height
print(check_height)
# 等待20秒
time.sleep(20)
# 清理资源
driver.quit() # 关闭浏览器驱动实例,释放资源
这段代码是使用 Selenium WebDriver 来自动模拟网页滚动的过程,并且在滚动到页面底部时停止。下面是对代码的逐行解释:
[ol]
driver.get(url): 使用 Selenium WebDriver 实例(driver)打开指定的网页(url)。
driver.maximize_window(): 将浏览器窗口最大化,以确保能够显示整个页面内容。
temp_height = 0: 初始化一个变量 temp_height,用于保存上一次滚动条的位置。
while True:: 开启一个无限循环,直到满足条件跳出循环。
driver.execute_script("window.scrollBy(0,600)"): 使用 JavaScript 在当前窗口向下滚动600个像素。这一步实现了向下滚动页面的操作。
time.sleep(1): 通过 time.sleep() 函数等待1秒,让页面滚动后有时间加载新的内容。这可以确保页面滚动的平稳性。
check_height = driver.execute_script("return document.documentElement.scrollTop || window.pageYOffset || document.body.scrollTop;"): 使用 JavaScript 获取当前滚动条距离页面顶部的距离,并将其保存在 check_height 变量中。这个表达式兼容了不同浏览器的获取方式。
if check_height == temp_height:: 检查当前滚动条的位置与上一次滚动条位置是否相等,如果相等,说明页面已经滚动到底部了。
temp_height = check_height: 将当前滚动条的位置更新到 temp_height 变量中,以备下一次循环使用。
print(check_height): 打印当前滚动条距离页面顶部的距离,用于调试和观察滚动过程中的位置变化。
[/ol]
通过这段代码,你可以模拟用户在浏览器中向下滚动页面的操作,并且在滚动到页面底部时停止。
这里的话,你可以直接使用我这的代码,去试试你那个网页是否能成功。