接着上一篇相关文章,还是说伯乐在线这个网站上有一个面向对象栏目。这次呢,不看妹子要求男生的身高问题,来瞧一瞧妹子在这个栏目上发帖子寻找soul mate的时间:)
实际上呢,网页信息是跟上次的一模一样,也就是说完全可以将上篇文章的网页代码保存在本地,设置好间隔符,通过不同的过滤规则获取相应的数据。
下面是我的代码:
1 | import requests |
结果为27.44
通过爬虫信息可以看出,27岁是个中间值,我也没有具体的研究年龄分布问题,后续等我有更科学的方法、数据量之后再来研究~
接着上一篇相关文章,还是说伯乐在线这个网站上有一个面向对象栏目。这次呢,不看妹子要求男生的身高问题,来瞧一瞧妹子在这个栏目上发帖子寻找soul mate的时间:)
实际上呢,网页信息是跟上次的一模一样,也就是说完全可以将上篇文章的网页代码保存在本地,设置好间隔符,通过不同的过滤规则获取相应的数据。
下面是我的代码:
1 | import requests |
结果为27.44
通过爬虫信息可以看出,27岁是个中间值,我也没有具体的研究年龄分布问题,后续等我有更科学的方法、数据量之后再来研究~