范式

函数依赖及范式

爷,独闯天下 提交于 2019-12-05 01:51:10
第一范式(1NF):属性不可分。 第二范式(2NF):符合1NF,并且,非主属性完全依赖于码。           消除1NF中的部分函数依赖 第三范式(3NF):符合2NF,并且,属性不依赖于其它非主属性。           消除2NF中的传递函数依赖 这个帖子写得不错,再补上函数依赖相关的概念就完美了。 https://www.cnblogs.com/Stephen-Jixing/p/9888725.html 来源: https://www.cnblogs.com/sinceret/p/11895797.html

数仓理论

試著忘記壹切 提交于 2019-12-04 21:15:49
一、表的分类   1、实体表    实体表 ,一般是指一个现实存在的业务对象,比如用户,商品,商家,销售员等等。      2、维度表     维度表 ,一般是指对应一些业务状态,编号的解释表。也可以称之为码表。   比如地区表,订单状态,支付方式,审批状态,商品分类等等。      3、事务型事实表    事务型事实表 ,一般指随着业务发生不断产生的数据。特点是 一旦发生不会再变化 。   一般比如,交易流水,操作日志,出库入库记录等等。   4、周期型事实表     周期型事实表 ,一般指 随着业务发生不断产生变化(更新, 新增)的数据。   与事务型不同的是,数据会随着业务周期性的推进而变化。   比如订单,其中订单状态会周期性变化。再比如,请假、贷款申请,随着批复状态在周期性变化。    二、同步策略   数据同步策略的类型包括: 全量表、增量表、新增及变化表、拉链表 全量表 :存储完整的数据。 增量表 :存储新增加的数据。 新增及变化表 :存储新增加的数据和变化的数据。 拉链表 :对新增及变化表做 定期合并 。   1、实体表同步策略   实体表:比如用户,商品,商家,销售员等   实体表数据量比较小:通常可以做每日全量,就是每天存一份完整数据 。即每日全量。   2、维度表同步策略    维度表:比如订单状态,审批状态,商品分类   维度表数据量比较小

深度学习——分类之ResNeXt

▼魔方 西西 提交于 2019-12-04 20:42:32
深度学习——分类之ResNeXt 论文: Aggregated Residual Transformations for Deep Neural Networks 作者:Saining Xie, Ross Girshick, Piotr Dollár, Zhuowen Tu, Kaiming He ImageNet Top5错误率:3.03% 中心思想:Inception那边把ResNet拿来搞了Inception-ResNet,这头ResNet也把Inception拿来搞了一个ResNeXt,主要就是单路卷积变成多个支路的多路卷积,不过分组很多,结构一致,进行分组卷积。 卷积的范式 作者一上来先归纳了Inception的模式:split-transform-merge。 如下图所示,先将输入分配到多路,然后每一路进行转换,最后再把所有支路的结果融合。 少不了要提一下Inception的缺点,太复杂了,人工设计的痕迹太重了。 然后,站得更高,分析了神经网络的标准范式就符合这样的split-transform-merge模式。以一个最简单的普通神经元为例(比如FC中的每个神经元): 就是先对输入的m个元素,分配到m个分支,进行权重加权,然后merge求和,最后经过一个激活。 由此归纳出神经网络的一个通用的单元可以用如下公式表示: 结合ResNet的identity映射

数据库的三大范式

ε祈祈猫儿з 提交于 2019-12-04 20:17:31
第一范式:字段具有原子性,字段不可拆分。比如:海南省海口市。可以拆分成1、海南省,2、海口市。 第二范式:消除 非主键字段 对 主键字段 的部分函数依赖, 非主键字段 完全依赖于 主键字段 。 第三范式:消除 非主键字段 对 主键字段 的传递依赖, 非主键字段 唯一依赖于 主键字段 而不依赖于其他字段。 自创一句话记忆:原子完全唯一依赖。(原完唯依赖) 来源: https://www.cnblogs.com/oldpub-blog/p/11881364.html

数据库设计心得

时光毁灭记忆、已成空白 提交于 2019-12-04 15:23:57
数据库设计心得 规范化   在设计和操作维护数据库时,关键的步骤就是要确保数据正确地分布到数据库的表中。 使用正确的数据结构,不仅便于对数据库进行相应的存取操作,而且可以极大地简化应用程序的其他内容(查询、窗体、报表、代码等)。正确进行表设计的正式名称就是"数据库规范化"。后面我们将通过实例来说明具体的规范化的工程。关于什么是范式的定义,请参考附录文章 1. 数据冗余   数据应该尽可能少地冗余,这意味着重复数据应该减少到最少。比如说,一个部门雇员的电话不应该被存储在不同的表中, 因为这里的电话号码是雇员的一个属性。如果存在过多的冗余数据,这就意味着要占用了更多的物理空间,同时也对数据的维护和一致性检查带来了问题,当这个员工的电话号码变化时,冗余数据会导致对多个表的更新动作,如果有一个表不幸被忽略了,那么就可能导致数据的不一致性。 第一范式   数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项。如果实体中的某个属性有多个值时,必须拆分为不同的属性。 第二范式   属性完全依赖于主键。第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。当存在多个主键的时候,才会发生不符合第二范式的情况。比如有两个主键,不能存在这样的属性,它只依赖于其中一个主键,这就是不符合第二范式

为什么我不喜欢数据库三范式【华为云技术分享】

久未见 提交于 2019-12-04 13:33:31
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接: https://blog.csdn.net/devcloud/article/details/99317716 插曲 最近,一个远房亲戚的小表弟准备选修专业 找到我问: 1 "哥,现在学数据库有没有前途阿?" 2 3 "当然有啊,前途大大的呢" 4 "那我现在开始学数据库,需要先从什么开始呢?" 5 6 "学课程的话,先了解下数据库三范式,SQL这些吧" 7 8 "SQL我大概知道,数据库三范式是什么?" 9 "阿...三范式就是表的主键...唯一性那些东西吧,...嗯,应该就是那些" 10 11 "什么是主键?" 12 13 "额.....表弟你不要再问了啦,好好去百度一下行不。" 14 15 "噢...." 挂完电话,我舒了口气,由于差点暴露自己已经不记得三范式了这个不争的事实,我悄悄打开了谷歌.... 数据库的这个三范式的概念,相信大多数人都不会陌生,从懵懵懂懂的大学时代就已经普及到教材了(没记错的话应该在数据库系统概论这本教材里)。 还记得那会刚开始找实习的时候,由于自己本事太小,连简历都不知道怎么写好,尤其是擅长技术的部分更是一片空白。 于是乎会找来隔壁几个学霸的简历来做参考,那会儿大家的简历上都会赫赫写着: 熟练掌握数据库三范式,精通数据库系统开发语言。

数据库的三范式

会有一股神秘感。 提交于 2019-12-04 05:43:09
1.第一范式(1NF):字段具有原子性,不可再分。(所有关系型数据库系统都满足第一范式数据库表中的字段都是单一属性的,不可再分) 2.第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。要求数据库表中的每个实例或行必须可以被惟一地区分。通常需要为表加上一个列,以存储各个实例的惟一标识。这个惟一属性列被称为主关键字或主键。 3.满足第三范式(3NF)必须先满足第二范式(2NF)。简而言之,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。 >所以第三范式具有如下特征: >>1. 每一列只有一个值 >>2. 每一行都能区分。 >>3. 每一个表都不包含其他表已经包含的非主关键字信息。 来源: https://www.cnblogs.com/fightingcode/p/11833775.html

论文阅读 | A Survey on Multi-Task Learning

荒凉一梦 提交于 2019-12-04 04:28:49
摘要 多任务学习(Multi-Task Learning, MTL)是机器学习中的一种学习范式,其目的是利用包含在多个相关任务中的有用信息来帮助提高所有任务的泛化性能。 首先,我们将不同的MTL算法分为 特征学习法、低秩方法、任务聚类方法、任务关系学习方法和分解方法 ,然后讨论每种方法的特点。为了进一步提高学习任务的性能,MTL可以与其他学习范式相结合,包括半监督学习、主动学习、非监督学习、强化学习、多视图学习和图形模型。当任务数量较大或数据维数较高时,批量MTL模型难以处理,本文对在线、并行和分布式MTL模型以及降维和特征哈希进行了综述,揭示了它们在计算和存储方面的优势。许多实际的应用程序使用MTL来提高它们的性能。最后,我们提出了理论分析,并讨论了未来的几个方向。 1 介绍 数据集难以收集时,MTL是个好的解决方案。 在MTL中,有多个学习任务,每个学习任务都可以是一个通用的学习任务,如监督任务(如分类或回归问题)、非监督任务(如聚类问题)。半监督任务,强化学习任务。多视图学习任务或图形模型。在这些学习任务中, 所有这些任务或至少其中一部分被认为是相互关联的 。在这种情况下,我们发现联合学习这些任务可以比单独学习更有效地提高性能。这一观察结果导致了MTL的诞生。因此,当多个任务相关时,MTL旨在提高它们的泛化性能。 MTL的设置与迁移学习[2]相似,但也有显著性差异。在MTL中

范式设计和反范式设计

一笑奈何 提交于 2019-12-03 01:40:13
三大范式 第一范式:无重复的列 第二范式:属性完全依赖于主键 第三范式:属性不能传递依赖其他非主属性 范式的作用是避免数据冗余(数据重复)。 范式的问题: 按照范式设计出来的表在数据冗余的问题虽然得到解决,但是会生成许多表,导致了表数量的复杂性,其二,查询数据的时候,多表查询的时间远远高于单表查询的时间。 反范式 范式的目的是减小数据冗余,而反范式指的是在一定程度上允许数据冗余,目的是加快数据操作。 对比 范式与反范式是一场时间和空间的较量,满足范式节省空间,满足反范式加快操作速度。 在满足范式设计数据库的前提条件下,再根据具体的业务需求完成反范式的设计。 来源: https://www.cnblogs.com/noneplus/p/11769619.html

数据库的三大范式

匿名 (未验证) 提交于 2019-12-03 00:37:01
1.,每列或每个属性都是不可再分的最小数据单元 2.确保表中的每列都和主键相关, 3.去除不重复断定属性的字段 属于递进的方式去除冗余第二范式绝对包含第一范式,第三范式绝对包含第二第二范式 转载请标明出处: 数据库的三大范式 文章来源: 数据库的三大范式