豆瓣电影top250名单

作者：zixindidadaya 发布时间：2024-9-1 06:08:33

豆瓣电影top250名单
代码如下面所示：
#
实现豆瓣电影
top250
名单
[color=]import
requests
[color=]import
re
[color=]for
i
[color=]in
[color=]range
(
[color=]1
[color=],
[color=]11
):
page = (i -
[color=]1
) * 25
[color=]
url =
[color=]f"https://movie.douban.com/top250?start=
[color=]{
page
[color=]}
&filter="
[color=]
head = {

[color=]"User-Agent"
: "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                  "Chrome/122.0.6261.95 Safari/537.36 "
[color=]
}
resp = requests.get(url
[color=],
[color=]headers
=head)
resp.encoding = "utf-8"
[color=]
obj = re.compile(r'.*?(?P.*?)'
                  r'.*?
(?P.*?) .*?'
                  r'(?P.*?).*?(?P.*?)
[color=]人评价
'
[color=],
re.S)
result = obj.finditer(resp.text)

[color=]for
item
[color=]in
result:
      dic = item.groupdict()
      dic[
[color=]'year'
] = dic[
[color=]'year'
].strip()

[color=]print
(dic)

豆瓣, 名单

相关帖子

MrCao 2024-9-1 06:09:32

贴个Java代码
[Java] 纯文本查看复制代码import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class DoubanTop250 {
public static void main(String[] args) {
      try {
         for (int i = 1; i .*?(.*?)"
                     + ".*?
(.*?) .*?"
                     + "(.*?).*?(.*?)人评价";
            Pattern pattern = Pattern.compile(regex, Pattern.DOTALL);
            Matcher matcher = pattern.matcher(response.toString());

            // 输出匹配结果
            while (matcher.find()) {
                  String name = matcher.group(1).trim();
                  String year = matcher.group(2).trim().replaceAll("[^0-9]", "");
                  String score = matcher.group(3).trim();
                  String num = matcher.group(4).trim();
                  System.out.println("Name: " + name);
                  System.out.println("Year: " + year);
                  System.out.println("Score: " + score);
                  System.out.println("Number of Reviews: " + num);
                  System.out.println("----------------------------");
            }
         }
      } catch (Exception e) {
         e.printStackTrace();
      }
}
}

j2017 2024-9-1 06:10:06

[Python] 纯文本查看复制代码```python
# 导入requests库用于发送网络请求
import requests
# 导入re库用于正则表达式匹配
import re
# 循环遍历豆瓣电影Top250的每一页
for i in range(1, 11):
# 计算当前页的起始位置
page = (i - 1) * 25
# 构建当前页的URL
url = f"https://movie.douban.com/top250?start={page}&filter="
# 设置请求头部信息，模拟浏览器访问
head = {
      "User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                  "Chrome/122.0.6261.95 Safari/537.36 "
}
# 发送GET请求获取网页内容
resp = requests.get(url, headers=head)
# 设置响应内容的编码格式
resp.encoding = "utf-8"
# 编写正则表达式匹配电影信息，包括电影名称、年份、评分和评价人数
obj = re.compile(r'.*?(?P.*?)'
                  r'.*?
(?P.*?) .*?'
                  r'(?P.*?).*?(?P.*?)人评价', re.S)
# 使用finditer方法查找所有匹配的电影信息
result = obj.finditer(resp.text)
# 遍历匹配结果
for item in result:
      # 将匹配结果转换为字典
      dic = item.groupdict()
      # 清理年份信息中的空白字符
      dic['year'] = dic['year'].strip()
      # 打印电影信息字典
      print(dic)
```

zhangting2022 2024-9-1 06:10:48

感谢分享

apaye 2024-9-1 06:11:20

学习了，都已下载

EssenceA1 2024-9-1 06:12:05

感谢分享，奈何本人能力有限，看不太懂

dbu00956 2024-9-1 06:12:46

apaye 发表于 2024-8-27 06:43
学习了，都已下载
灌溉农田？？？

52soft 2024-9-1 06:13:17

赶紧测试一下

abc023119 2024-9-1 06:14:11

看不懂还是感谢分享

Wapj_Wolf 2024-9-1 06:14:45

未完待续？代码怎么才这么几行啊。

豆瓣电影top250名单

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

豆瓣电影top250名单

相关帖子

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告