大数据使用及现状调研报告
大数据使用及现状调研报告 大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 大数据特征分析 大数据,不仅有“大”这个特点,除此之外,它还有很多其他特色。在这方面,业界各个厂商都有自己独特的见解,但是总体而言,可以用“4V+1C”来概括,“4V+1C分别代表了Variety(多样化)、Volume(海量)、Velocity(快速)、Vitality(灵活)以及Complexity(复杂)这五个单词。 Variety(多样化) 大数据一般包括以事务为代表的结构化数据、以网页为代表的半结构化数据和以视频和语音信息为代表的非结构化等多类数据,并且它们的处理和分析方式区别很大。 与大数据现象有关的数据量为尝试处理它的数据中心带来了新的挑战:它多样的种类。随着传感器、智能设备以及社交协作技术的激增,企业中的数据也变得更加复杂,因为它不仅包含传统的关系型数据,还包含来自网页、互联网日志文件(包括单击流数据)、搜索索引、社交媒体论坛、电子邮件、文档、主动和被动系统的传感器数据等原始、半结构化和非结构化数据。简言之,种类表示所有的数据类型。 Volume(海量) 如今存储的数据数量正在急剧增长,毫无疑问我们正深陷在数据之中。我们存储所有事物:环境数据