python新人，写了一个爬取jd数据的爬虫，并做了数据分析 ...

作者：Allenxu520 发布时间：2023-3-18 12:00:32

python新人报道自己这点水平，简单写了个python爬虫，并且进行数据分析后绘制为了饼图。框架，需要的可以自己更改。
[Python] 纯文本查看复制代码
# -*- encoding: utf-8 -*-
import time
import pandas as pd
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from pyecharts.charts import Pie
if __name__ == "__main__":
word = input("请输入要爬取的商品名称")
page_size = int(input("请输入要爬取的页数"))
# 创建一个浏览器驱动器的对象
driver = webdriver.Edge()
# 通过驱动器去打开京东的首页
driver.get("https://www.jd.com")
time.sleep(2)
# 找到搜索框
input_box = driver.find_element(By.ID, "key")
input_box.send_keys(word)
input_box.send_keys(Keys.ENTER)
# html = driver.page_source
# df = pd.read_html(html)[0]
names, prices, commits, shops = [], [], [], []
for i in range(page_size):
      # 将滚动条拖到最下面
      driver.execute_script('window.scrollTo(0,document.body.scrollHeight)')
      # 停顿3秒，等待数据刷新
      time.sleep(3)
      good_list = driver.find_elements(By.XPATH, '//*[@id="J_goodsList"]/ul/li')
      # 便利每页所需爬取的内容
      for good in good_list:
         price = good.find_element(By.CLASS_NAME, "p-price").text,
         name = good.find_element(By.CLASS_NAME, "p-name").text,
         commit = good.find_element(By.CLASS_NAME, "p-commit").text,
         shop = good.find_element(By.CLASS_NAME, "p-shop").text
         # 将爬取的数据赋值给空列表中
         names.append(name[0])
         prices.append(price[0])
         commits.append(commit[0])
         shops.append(shop)
      driver.find_element(By.CLASS_NAME, "pn-prev").click()
      # 停顿3秒，等待数据刷新
      time.sleep(3)
df = pd.DataFrame(
      {
         "价格": prices,
         "标题": names,
         "评论数": commits,
         "出版社": shops
      })
df.to_excel("1.xlsx")
# 按数量统计出前10名的数据
sort_data = df.groupby("出版社").size().sort_values(ascending=True).head(10)
# 进行数据治理。将数据按图表所需要的数据进行融合，重要！！！变为这种格式：[‘xx_xx’，1]
data = [list(z) for z in zip(sort_data.index.tolist(),
                              sort_data.values.tolist())]
# print(data)
# 绘制饼图
pip = Pie()
pip.add(series_name="排名",
         data_pair=data)
pip.render(path="P_render.html")

数据, 爬虫

相关帖子

VIZZION1996 2023-3-18 12:01:04

我来试试看

Allenxu520

OP

2023-3-18 12:01:44

东莞洪世贤发表于 2023-3-18 10:53
评分支持。请问自学学到这种程度，需要多久？
会基础语法，知道要用的模块，差不多就可以了，我也是个小白，就平时工作时会用到python写一些数据库的脚本

zheqi1314 2023-3-18 12:02:21

楼主很厉害呀

fuermosi 2023-3-18 12:03:12

厉害，希望再接再厉

muyan888 2023-3-18 12:04:05

厉害，会了这个这可以干很多事

南极. 2023-3-18 12:04:51

厉害了学习一下

echoaku 2023-3-18 12:05:29

支持一下，还是不错的

threeWHO 2023-3-18 12:06:21

楼主厉害，向楼主的实践精神学习

QQ283839439 2023-3-18 12:07:17

楼主威武，，美团可以使用吗？

python新人，写了一个爬取jd数据的爬虫，并做了数据分析生成饼图，大佬勿喷。

相关帖子

浏览过的版块

热门主题

Facebook 和 Google 的开发团队在想什么

Shadowrocket 支持 Tailscale 了，那支持 s

你有没有那样一瞬间, 觉得自己老了?

好奇大家裤衩多久换？

请教个问题，如果我做个 app，搜索我保存的

如果有家族遗传脱发应尽早使用非那雄胺

问一下，现在真有人选择买天然钻吗

想问一下各位大佬有 5w 闲钱如何理财？

3 天时间做了个在线照相亭，试试看好玩不

做梦都想买个单人沙发，但是租房😮‍💨

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

python新人，写了一个爬取jd数据的爬虫，并做了数据分析生成饼图，大佬勿喷。

相关帖子

浏览过的版块

热门主题

Facebook 和 Google 的开发团队在想什么

Shadowrocket 支持 Tailscale 了，那支持 s

你有没有那样一瞬间, 觉得自己老了?

好奇大家裤衩多久换？

请教个问题，如果我做个 app，搜索我保存的

如果有家族遗传脱发应尽早使用非那雄胺

问一下，现在真有人选择买天然钻吗

想问一下各位大佬有 5w 闲钱如何理财？

3 天时间做了个在线照相亭，试试看好玩不

做梦都想买个单人沙发，但是租房😮‍💨

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

在 Yoo趣儿投放广告