前~~~ 本站目的是介绍一些基本应用,组件的组合应用就看每个人的理解了,文档也是很多的就不详细写了。每一篇基本都是基础应用,看文档应该是每个程序员的基本人生吧,感谢。 起步 本介绍的目的是方便大家来使用一些基本组件,爬数据不是目的,偷取别人的私密数据也是违规的,所以仁者见仁智者见智,大家搞一些爱好的基本分析还是可以的。 在爬一些简单数据的时候,一般会遇到几种问题,常见的呢就是:跨域、登录验证乱七八糟的,不过这些都和我今天说的方法没啥关系,因为今天用的是selenium库,也就是自动化web测试工具。一般用selenium做测试的比较多,在我们这里,使用他做一些其他有趣的事情。 环境 python3 的环境,这个就不说了 有了环境之后安装selenium包 pip3 install selenium -i https://pypi.doubanio.com/simple 老规矩还是豆瓣源,速度快 安装了库是无法使用的,我们还需要chromedriver这种浏览器驱动才行,fox或者chrome都支持,不过我习惯用chromedriver,这里都已chromedriver来举例了,反正也..... 简单的爬虫程序 Python