我们爬取数据的目的肯定不是单纯地为爬而爬,终极目标还是需要把这些数据用起来。不过鄙人在安装时,遇到报错信息:plugin caching_sha2_password could not be loaded,这个问题的处理可参阅:见原文链接 。
我们发现,程序并没有爬取到相关数据。基于抓包工具动态进行局部搜索:在当前网页中打开抓包工具,捕获到地址栏url对应的数据包,在该数据包中response选项卡搜索我们想要爬的数据,如果搜索到了就不是动态加载数据,如果没有搜索到,那就是动态加载数据。
部门新来的美工MM,问我这个周末有没有空,她想请人去看电影?我窃窃偷笑,觉得这个姑娘不但设计能力强,人也长得漂亮,就赶紧回她:有的,有的,我有的是时间。那你周末去电影帮我看一下,哪些电影正在热映,好不好?我想带我男朋友去看。顶你个肺,我,我,我.....,一会发给你就是了。
作为数据科学家,从加载数据到创建和部署模型,我们几乎每天都在使用Jupyter notebook。只要它的内核处于活动状态,就可以用数据子集运行和测试脚本,而不用每次重启程序,这样可以加快我们开发和测试的速度。