数据冗余

数据库的设计

﹥>﹥吖頭↗ 提交于 2020-03-03 17:03:40
一、数据库的设计 良好的数据库: 1.节省存储空间 2.保证数据完整性 糟糕的数据库 1.数据冗余,存储空间的浪费 2.产生数据不完整 设计数据库的步骤 1.充分了解需求 (分析实体) 2.标识实体: 具体存在的对象,(名词大多为实体) 3.标识属性 4.标识关系 如何将E_R图(实体关系图)转成表 1.将实体转成表,将属性转成字段 2.如果找不到一个合适的字段做主键,我们就添加一个自动增长列作为主键 3.建立正确的关系 数据规范化(三范式) 表设计出来以后,并不是最合理的结构,我们需要对表进行规范化(我 们通过3范式来对表进行规范) 先满足第一范式------>再满足第二范式-------->第三范式 1.确保每列的原子性(第一范式) 第一范式用来规范化所有的字段,字段不可再分。 注意:比如地址这个字段,如果不分类汇总,不排序,仅仅是起一个字符串的作 用,这时我们不拆分。(反三范式) 2.非键字段必须依赖与键字段(第二范式) 要求一个表只描述一件事情 3.消除传递依赖(第三范式) 在非主键字段中,如果一个字段可以推导出 另一个字段,这叫传递依赖 反三方式: 范式越高。数据冗余就越少,但是有时候效率就越地下, 为了提高运行效率,可以适当的让数据冗余。 数据库的性能比规范化更重要 来源: CSDN 作者: qq_43382364 链接: https://blog.csdn.net

数据库关系模式之范式详解

烈酒焚心 提交于 2020-01-13 02:56:25
概念理解 术语定义:范式是符合某一种级别的关系模式的集合 通俗理解:相当于一个衡量数据库表关系模式设计优劣的一个标准,同教师的职称有初级、中级、高级、特级等等一样,范式同样分为几个级别 关系模式的冗余和异常问题 数据冗余:同一数据在系统中重复出现,在数据库管理中, 数据冗余 一直是影响系统性能的大问题。 操作异常:由于数据冗余,对数据库的操作会引起各种异常(修改异常,插入异常,删除异常) 范式 由于关系模式的各种问题,所以就出现了一个衡量数据库关系模式的标准也就是范式 第一范式(1NF) 定义:数据库表中的字段都是单一属性的,不可再分的(段是最小的单元不可再分) 1NF是关系模式应具备的最起码的条件 第二范式(2NF) 定义:在满足第一范式的情况下,且每个非主属性完全依赖于候选键 理解这句话的时候,我们先理解一下其中的一些名词 码(候选键): 设 K 为某表中的一个属性或属性组,若除 K 之外的所有属性都完全函数依赖于 K(这个“完全”不要漏了),那么我们称 K 为 候选码(候选键) ,简称为 码 。在实际中我们通常可以理解为: 假如当 K 确定的情况下,该表除 K 之外的所有属性的值也就随之确定,那么 K 就是码 非主属性:包含在任何一个码中的属性成为主属性,其他的称为非主属性 第三范式(3NF) 定义:在满足第二范式的情况下,且每个非主属性都不传递对于码的函数依赖 实例 1

常见的raids类型

不羁岁月 提交于 2019-12-19 15:06:50
磁盘阵列raid类型及含义 raid0: 多块盘同时进行读写; 优点是读写效率高,缺点是没有数据冗余; 最少需要两块盘。 raid1: 将数据盘都做镜像; 优点是有数据冗余;缺点是读写效率低,磁盘利用率低; 最少需要两块盘。 raid3: 一块盘单独做奇偶校验盘,其余盘做raid0; 优点是读写效率高,一定程度上提供数据冗余,缺点是校验盘损坏后无法恢复数据; 最少需要三块盘。 raid5: 一块盘的容量作为校验盘,奇偶校验数据分布在所有磁盘上,其余做raid0,最多坏一块盘; 优点是读写效率高,能够提供数据冗余; 最少需要三块盘。 raid6: 在raid5的基础上增加了一种校验码,最多坏2块盘; 优点是能够提供冗余数据,缺点是性能较低; 最少需要三块盘。 RAID故障后的正确操作 来源: CSDN 作者: 懵逼的运维弟弟 链接: https://blog.csdn.net/TH_lsq/article/details/102870161

杉岩引领国产分布式存储厂商,坚持国产化技术路线

萝らか妹 提交于 2019-12-09 19:19:18
2019年中国迈入新数据时代元年,IDC最新发布的《2025年中国将拥有全球最大的数据圈》显示,中国各类型数据呈几何级数增长,预计在2025年中国数据圈将增至48.6ZB。数据带来前所未有的商业红利的同时也带来了前所未有的风险。数据泄露水平指数显示,2018年每天有超过2500万条数据遭到入侵或泄露,涵盖医疗、信用卡、财务数据、个人身份信息等。   存储介质作为如此庞大数据量的承载者,在这样的背景下,安全显得尤为重要。当下,我国正在全力推进党政信息化建设,《“十三五”国家信息化规划》提出:到2020年,“数字中国”建设取得显著成效,具有国际竞争力、安全可控的信息产业生态体系基本建立。      杉岩数据在数据存储技术发展的道路上始终心怀担当,坚持走国产化技术路线,专注在分布式存储领域深耕,历时多年研发出全国产化分布式统一存储平台USP。    Sandstone USP作为一款国产分布式存储软件产品,技术架构上采用业内领先的全分布式高可用设计,全平台无单点故障,并且可以提供文件存储、块存储和对象存储三种不同类型的存储模块,这些存储模块可以灵活的组合搭配,提供快速简便的访问方式,满足新一代应用的敏捷开发需求,能够根据应用的发展进行灵活的弹性扩展。提供了全语义、跨协议数据访问,帮助企业打通数据孤岛、实现传统应用间的数据共享,一体化极简架构与分钟级扩容、秒级数据检索,加速企业上云转型

范式设计和反范式设计

一笑奈何 提交于 2019-12-03 01:40:13
三大范式 第一范式:无重复的列 第二范式:属性完全依赖于主键 第三范式:属性不能传递依赖其他非主属性 范式的作用是避免数据冗余(数据重复)。 范式的问题: 按照范式设计出来的表在数据冗余的问题虽然得到解决,但是会生成许多表,导致了表数量的复杂性,其二,查询数据的时候,多表查询的时间远远高于单表查询的时间。 反范式 范式的目的是减小数据冗余,而反范式指的是在一定程度上允许数据冗余,目的是加快数据操作。 对比 范式与反范式是一场时间和空间的较量,满足范式节省空间,满足反范式加快操作速度。 在满足范式设计数据库的前提条件下,再根据具体的业务需求完成反范式的设计。 来源: https://www.cnblogs.com/noneplus/p/11769619.html

数据冗余

六眼飞鱼酱① 提交于 2019-12-01 07:57:23
1 什么是数据冗余 数据冗余:在一个数据集合中重复的数据称为数据冗余。 例如在设计数据库时,某一字段属于一个表,但它又同时出现在另一个或多个表,且完全等同于它在其本来所属表的意义表示,那么这个字段就是一个冗余字段。 1. 关系数据库中的数据冗余主要是指关系数据库中同一信息数据的重复存贮。 2. 数据冗余浪费了宝贵的资源,应尽量减少。但关系数据库中为实现一些功能有些数据冗余是必需的。必需的数据冗余主要用于以下用途: ①数据间建立联系,如两表间通过共同属性建立联系 ②数据恢复,如建立备份文件以备正式文件被破坏时恢复 ③数据核查,如设立数据校验位可以检查数据在存贮、传输等过程中的改变 ④数据使用的便利,如为了查看数据的直观,使用数据的方便、高效 ⑤减少数据通讯开销,如分布式数据库在不同场地重复 2 数据冗余形成的原因 关系数据库由表及附属文件组成,其表由属性定义的结构和元组(记录)组成,其属性值域有多种类型,故关系数据库的数据冗余形成的原因有表的重复、属性的重复、元组的重复、属性值的重复4类。 2.1 表的重复 为了数据安全的需要制作备份表,当主表被破坏时可用此恢复数据。分布式数据库为减少数据通讯开销也常重复放表,这种数据冗余在这里是必需数据冗余,不能删除。若是因其他原因产生的非必要的重复表则应予以删除。 2.2 属性重复 有不同表的属性重复和同一表内属性重复2种情况: (1)

mysql数据库设计

浪尽此生 提交于 2019-11-29 13:55:31
数据库设计 简介 简单来说,数据库设计就是根据业务系统的具体需要,结合我们所选的数据库管理系统,为这个业务系统构造出最优的数据库存储模型.并建立好数据库中的表结构及表与表之间的关联关系的过程.使之能有效的对应应用系统中的数据进行存储,并可以高效的对已经存储的数据进行访问. 常用关系型数据库:mysql、Oracle、SQL server、PgSql 常用非关系型数据库:Mongo、Memcache、Redis 数据库设计作用 优良的设计 糟糕的设计 减少数据冗余 存在大量数据冗余 避免数据维护异常 存在数据插入,更新,删除异常 节约存储空间 浪费大量存储空间 高效的访问 访问数据低效 维护调整方便 较难调整维护 数据库设计步骤 需求分析 数据库是什么 数据库有哪些属性 数据库和属性各自的特点有哪些 逻辑设计 使用ER图对数据库进行逻辑建模 物理设计 根据使用的数据库自身的特点把逻辑设计转换为物理设计 维护优化 新需求进行表建立 索引优化 大表拆分 需求分析 1.了解系统中所要存储的数据 2.了解数据的存储特点 3.了解数据的生命周期 需求分析要搞清以下问题 实体及实体之间的关系(1对1,1对多,多对多) 实体所包含的属性有什么 哪些属性或属性的组合可以唯一标识一个实体 实例演示需求分析过程 以小型电子商务网站为例,包含的模块: 用户模块 包括属性:用户名、密码、电话、邮箱、身份证号