小白学习python之爬取豆瓣top250之排行榜

查看 97|回复 3
作者:shihana   
[Python] 纯文本查看 复制代码
import requests
import re
headers={
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36 Core/1.94.197.400 QQBrowser/11.6.5265.400'
}
with open('./豆瓣前10.txt', 'w') as f:
    for start_name in range(0,10):
        start_name = start_name*25
        url = f'https://movie.douban.com/top250?start={start_name}&filter='
        html = requests.get(url,headers=headers).text
        zc = re.compile('.*?(.*?)',re.S)
        data = re.findall(zc,html)
        for i in range(0, len(data)):
            f.write(data[i]+'\n')
            
f.close()

豆瓣, 排行榜

kaisen868   

感谢分享应用实例。
luxingyu329   

用 with open 下面就没有必要 f.close()了
gailhu   

下次发个git地址吧,这样会更好,或者不介意我发git上吧?
您需要登录后才可以回帖 登录 | 立即注册

返回顶部