首先得有最基本的python编程能力,会引用模块,定义函数和变量,熟悉字符串相关操作,会用requests模块,了解html解析的库。 然后就是选一个喜欢的爬虫框架,现在一般都有反爬,不太可能通过接口直接拿到数据,所以可以用模拟用户操作的爬虫框架,比如selenium, playwright, DrissionPage之类的。 最后就是实际动手写代码了,这一步肯定要遇到各种问题和阻碍,要多搜索,现在有ai还比较好,国内有个deepseek,用来提问编程问题体验不错。 还有一点,如果你想让你的爬虫带一个界面,那你还得学python ui框架,比如pyqt之类的,我个人是建议用ptqt写界面,资料多成体系,遇见问题好解决。
首先得有最基本的python编程能力,会引用模块,定义函数和变量,熟悉字符串相关操作,会用requests模块,了解html解析的库。 然后就是选一个喜欢的爬虫框架,现在一般都有反爬,不太可能通过接口直接拿到数据,所以可以用模拟用户操作的爬虫框架,比如selenium, playwright, DrissionPage之类的。 最后就是实际动手写代码了,这一步肯定要遇到各种问题和阻碍,要多搜索,现在有ai还比较好,国内有个deepseek,用来提问编程问题体验不错。 还有一点,如果你想让你的爬虫带一个界面,那你还得学python ui框架,比如pyqt之类的,我个人是建议用ptqt写界面,资料多成体系,遇见问题好解决。