大数据,很明显从字面上理解就是大量的数据,海量的数据。大,意思就是数据的量级很大,不上TB都不好意思说是大数据。数据,狭义上理解就是12345那么些数据,毕竟计算机底层是二进制来存的,那么在大数据领域,数据就不仅仅包括数字这些,它可以是所有格式的东西,比如日志,音频视频,文件等等。
所以,大数据从字面上理解就是海量的数据,技术上它包括这些海量数据的采集,过滤,清洗,存储,处理,查看等等部分,每一个部分包括一些大数据的相关技术框架来支持。
当然了,关于这些只是大数据的边角料,数据资料是一直在更新完善的,大数据资料库是收集资料、传输资料、存储资料之后再挖掘资料、分析资料、展示资料,这一系列的步骤都是非常关键的,也是密不可分的。
都是需要有着庞大的数据来源,不仅如此,大数据和云计算也是有着非常密切的关系的,比如,大数据的分布式存储以及分布式计算都是云计算的重要技术。
大数据具有4大特征,也就是快速化、多样化、大量化以及价值高和密度低,快速化是指的互联网连接设备数量的增长为我们带来更高速数据的处理。
而多样化则是指的数据的来源多,格式也多,来源具体到生活中包括搜索引擎的信息来源、社交网络信息来源、通话记录等都是大数据信息的来源。
当然了,关于这些只是大数据的边角料,数据资料是一直在更新完善的,大数据资料库是收集资料、传输资料、存储资料之后再挖掘资料、分析资料、展示资料,这一系列的步骤都是非常关键的,也是密不可分的。
都是需要有着庞大的数据来源,不仅如此,大数据和云计算也是有着非常密切的关系的,比如,大数据的分布式存储以及分布式计算都是云计算的重要技术。
大数据具有4大特征,也就是快速化、多样化、大量化以及价值高和密度低,快速化是指的互联网连接设备数量的增长为我们带来更高速数据的处理。
而多样化则是指的数据的来源多,格式也多,来源具体到生活中包括搜索引擎的信息来源、社交网络信息来源、通话记录等都是大数据信息的来源。