浅议大数据的分析价值
2015年,国务院颁布了大数据实施纲要通知《国务院关于印发促进大数据发展行动纲要的通知》,从国家层面上将大数据战略思想逐渐成型。随之,各行各业逐渐意识到海量数据的价值及重要性,分析数据并挖掘其潜在价值的需求不断加大。那么我们今天就来扒一扒:大数据能产生什么价值,值得我们去分析它? 一、什么是大数据 IDC以4V特征来定义大数据,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value);Amazon的John Rauser 将大数据定义为:任何超过了一台计算机处理能力的数据量。可见不同的主体对大数据的定义是不同,但有一个共同点,即数据必须是海量的。 一个人每天可以产生如下社保信息:身份、医保/养老/工伤/失业/生育等各险种的参保信息、财务、薪酬等敏感信息……. 一台工业设备每天可以产生的信息:第一、行为日志。访问信息、发送的控制指令等信息;第二、设备通信日志。包括数据连接建立时间、连接端口、访问外部节点信息、传输数据量等信息;第三、设备异常报警日志。如设备认证失败、异常行为类型等;第四、流量信息及阻断信息。 这些信息每天都在产生,久而久之汇聚成海量的数据,通过不同的终端以各种各样的形式存在。比如,存储于关系型数据库Oracle、PostgreSQL,数据文件XML,Hadoop数据源HDFS等