一、信息检索概述 1、 信息过载 据百度百科介绍,信息过载是指社会信息超过了个人或 系统 所能 接受 、处理或有效利用的范围,并导致故障的状况。 信息过载有以下3个特点 (1)受传者对信息反映的速度远远低于 信息传播 的速度; (2) 大众媒介 中的信息量大大高于受众所能消费、承受或需要的信息量; (3)大量无关的没用的冗余的数据信息严重干扰了受众对相关有用信息的 准确性 的选择。 2、信息过载的原因 随着互联网、传感器,以及各种数字化终端设备的普及,一个万物互联的世界正在成型。同时,随着数据呈现出爆炸式的指数级增长,数字化已经成为构建现代社会的基础力量,并推动着我们走向一个深度变革的时代。 据IDC发布《数据时代2025》的报告显示,全球每年产生的数据将从2018年的33ZB增长到175ZB,相当于每天产生491EB的数据。那么175ZB的数据到底有多大呢?1ZB相当于1.1万亿GB。如果把175ZB全部存在DVD光盘中,那么DVD叠加起来的高度将是地球和月球距离的23倍(月地最近距离约39.3万公里),或者绕地球222圈(一圈约为四万公里)。目前美国的平均网速为25Mb/秒,一个人要下载完这175ZB的数据,需要18亿年。 这些飞速增长的数据造成了数据过载的原因,所以我们处在一个数据时代,也是一个数据过载的时代 3、大数据的特点(IBM提出) 大数据的5V特点: Volume