用python抓取“3d”彩票数据,怎么分析你说了算!

旧街凉风 提交于 2020-01-07 11:54:42

【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>>

快下班了,正好准备去买彩票,就顺手写了2个脚本,一个用来下载最近的彩票数据,一个用来统计彩票数字,分享给大家!

 

彩票数据获取并写入excel表格

数据来源自己看吧~用外链通不过。。。

所用库:xlwt,requests,lxml

有几点需要注意的:

1、构建列表。因为存入excel文件的时候用的是列表,所以新建一个函数,分别取网页5个数据:时间、期数、开奖数123,然后每一页嵌套写入列表类似结构为[[时间、期数、开奖数1,2,3],[时间、期数、开奖数1,2,3]……],在循环页数,获取所有的数据!注意构建列表的形式和列表结果,这个在你写入表格的时候很重要!

2、写入数据。xlwt写入文件的方法为ws.write(行,列,数据),按行写入文件,所以新建一个变量line(代码第36行),每写入一行自增1。

其他方面都很简单,没有反爬,就是为了获取数据,好做分析!

 

最后excel表中的数据,是这样的:

 

最后大概有4840行数据,足够我们分析的了!

数据处理

用xlrd库就可以~话说xlwt库和xlrd库好像就是一个写数据,一个读数据。。。

就写了一个抓热门数字的,也就是取频率最高的。如果您有更好的想法或者玩法,可以自行去实现哦!

先读取数据,然后取到每一行的2.3.4列,每一列写入一个列表(现在有些后悔,不该写那么多数据进来),然后3个列表合并一个总列表,这样我们就有了4个列表,取出每一个列表中出现次数最多的那个数字,代码如下:

 

第1个数字频率最高的是 [3]

第2个数字频率最高的是 [6]

第3个数字频率最高的是 [8]

单个数字频率最高的是 [3]

因为赶时间下班。。就全部用了列表推导式,也没有用pandas库或者可视化库做出很炫酷的图表,等我研究出完美的预测方案的时候在做【手动哭泣】,不过依现在的趋势,是没什么希望了。。。

最后要说的是,从开始研究分析各种数据到现在习惯性的买彩票,没中过大奖(超过200的都算大奖)!果然童话都是骗人的……还是学python比较好玩!

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!