数据管理

数据仓库学习

半腔热情 提交于 2020-04-06 05:47:28
第一部分 导论 第1章 商业数据挖掘简介  1.1 介绍  1.2 进行数据挖掘需要什么  1.3 数据挖掘  1.4 集聚营销  1.5 商业数据挖掘  1.6 数据挖掘工具 第2章 数据挖掘过程与知识发  2.1 CRISP-DM  2.2 知识发现过程 第3章 数据挖掘的数据库支持  3.1 数据仓库  3.2 数据集市  3.3 联机分析处理  3.4 数据仓库的实现  3.5 元数据  3.6 系统示范  3.7 数据质量  3.8 软件产品  3.9 实例 第二部分 数据挖掘工具 第4章 数据挖掘方法概述  4.1 数据挖掘方法  4.2 数据挖掘视野  4.3 数据挖掘的作用  4.4 实证数据集 附录4A 第5章 聚类分析  5.1 聚类分析  5.2 聚类分析的描述  5.3 类数量的变动  5.4 聚类分析的运用  5.5 在软件中使用聚类分析  5.6 大数据集的方法运用  5.7 软件产品 附录5A 第6章 数据挖掘中的回归算法  6.1 回归模型  6.2 逻辑回归  6.3 线性判别分析  6.4 数据挖掘中回归的实际应用  6.5 大样本数据集的模型应用 第7章 数据挖掘中的神经网络  7.1 神经网络  7.2 数据挖掘中的神经网络  7.3 神经网络的商业应用  7.4 神经网络应用于大样本数据集  7.5 神经网络产品 第8章 决策树算法  8

Docker数据管理

泄露秘密 提交于 2020-03-21 22:25:22
因为docker 重启所有的docker数据都会丢失。怎么保存数据到本址 1、挂载本地的目录到容器里(备份) : docker run -itd -v /data/:/data centos bash -v 指定挂载目录,前面的是宿主机目录,后面的是容器目录。创建成功后两个目录内容会同步,从面达到备份的目的。 2、挂载数据卷 其实我们挂载目录的时候,可以指定容器name,如果不指定就随机定义了。比如上面我们没有指定,它就生成了一个名字为relaxed_franklin,这个名字可以使用命令 docker ps 看最右侧一列![] docker run -itd --volumes-from relaxed_franklin centos bash --volumes-from后面跟已启动的主机名,使用 relaxed_franklin的数据卷。我们使用了centos 创建了新的容器 3、定义数据卷容器 有时候,我们需要多个容器之间相互共享数据,类似于linux里面的NFS,所以就可以搭建一个专门的数据卷容器,然后其他容器直接挂载该数据卷。 首先建立数据卷容器 docker run -itd -v /data/ --name testvol centos bash //注意这里的/data/是容器的/data目录,并非本地的/data/目录。 然后让其他容器挂载该数据卷 docker

主数据管理(MDM)的成熟度 之三---五个层次

纵然是瞬间 提交于 2020-03-18 23:36:22
主数据管理(MDM)的成熟度 根据主数据管理实施的复杂程度,大体可以把主数据管理可以分为五个层次,从低到高反映了主数据管理(MDM)的不同成熟度。 Level 0 :没有实施任何主数据管理(MDM) 在Level 0的情况下,意味着企业的各个应用之间没有任何的数据共享,整个企业没有数据定义元素存在。比如,一个公司销售很多产品,对这些产品的生产和销售由多个独立的系统来处理,各个系统独立处理产品数据并拥有自己独立的产品列表,各个系统之间不共享产品数据。在Level 0, 每个独立的应用负责管理和维护自己的关键数据(比如产品列表、客户信息等),各个系统间不共享这些信息,这些数据是不连通的。 Level 1 :提供列表 不管公司大还是小,列表管理是我们常用的一种方式。在公司内部,会通过手工的方式维护一个逻辑或物理的列表。当各个异构的系统和用户需要某些数据的时 候,就可以索取该列表了。对于这个列表的维护,包括数据添加、删除、更新以及冲突处理,都是由各个部门的工作人员通过一系列的讨论和会议进行处理的。业务规则是用来反映价值的一致性,当业务规则发生改变或者出现类似的情况时,这样高度手工管理的流程容易发生错误。由于列表管理是通过手工管理的,其列表维护的质量取决于谁参加了变更管理流程,一旦某人缺席,将会影响列表的维护。 Level1比Level 0的不同就是,各个部门虽然还是独立维护各自的关键数据

06-docker数据管理

帅比萌擦擦* 提交于 2020-03-10 23:19:13
数据管理 在真实环境中docker需要对数据进行持久化,或者多个容器之间进行数据共享,涉及到容器的数据管理操作。 数据卷:容器内数据映射到本地主机环境 数据卷容器:使用特定容器维护数据卷 数据卷 数据卷(Data Volumes)是一个可供容器使用的特殊目录,通过主机操作系统目录直接映射进容器,类似mount 特性: 可以在容器间共享,重用 对数据卷内数据的修改会立即生效,不论是在操作系统目录下还是容器内 对数据卷的更新不会影响容器 卷会一直存在,知道没有容器使用,可以卸载它 1、创建数据卷 docker提供了volume命令来管理数据卷,除了create(创建),还支持inspect(查看详细信息),ls(列出已有数据卷),prune(清理无用数据卷),rm(删除数据卷)等 [root@docker01 ~]# docker volume create -d local test test [root@docker01 ~]# ll /var/lib/docker/volumes/ total 24 drwxr-xr-x. 3 root root 19 Mar 9 23:21 1d300cc7b91123b4180bf8edb1f3ce130a8f317dba3332f21c55be23f27d0f30 -rw-------. 1 root root 32768 Mar 10

首届中国CDO大调研,CDO神秘面纱即将揭开...

只谈情不闲聊 提交于 2020-03-10 03:33:24
CDO,Chief Data Officer,在中国还是一个新词。 CDO是个什么样的角色?在企业发展中负担着怎样的使命?又是怎样发挥作用的…… 为了更加深入的了解中国首席数据官的地位、作用、现状以及挑战,推动企业数据人才的培养和发展,进而推动企业的数字化转型, 数字产业创新研究中心、CIO时代学院、锦囊专家、首席数字官与Informatica联合发起《中国首席数据官调查与研究》项目。 数据,在企业发展中发挥着越来越重要的作用,尤其是身处当今大数据时代,数据管理的重要性变得越来越明显,已经成为现代企业管理至关重要的影响因素之一,“企业级全面数据治理”也作为一个全新的管理概念,呈现在企业领导者面前,由此,越来越多的CDO (Chief Data Officer)进入企业高管团队。 中国企业怎样对待数据管理?CDO在中国企业管理中处于何种位置?我们盼望着能够藉由本次“中国首席数据官调查与研究”,刻画最新、最全面的中国CDO群像,描绘中国CDO前景。 本调查面向企业首席数据官、首席数字官、首席信息官、数据管理负责人或拥有同等职责的IT负责人。欢迎您参与本次调查,大概需要花费您15分钟时间来完成问卷。完整填写问卷的CDO,将获得本次调研的完整版研究报告,预计4月发布,同时还为您准备了精美礼品一份。 想了解更多相信信息,请关注Informatica数据管理(微信号

Linux文件管理-第二周

我是研究僧i 提交于 2020-03-09 15:26:44
第二周作业-文件管理 一、Linux发行版的系统目录名称命名规则以及用途。 1、文件名最长255个字节。 2、包括路径在内文件名称最长4095个字节。 3、蓝色-->目录 绿色-->可执行文件 红色-->压缩文件 浅蓝色-->链接文件 灰色-->其他文件 4、除了斜杠和NUL,所有字符都有效,但使用特殊字符的目录名和文件不推荐使用,有些字符需要引号来引用它们。 5、标准Linux文件系统(如ext4),文件名称大小写敏感。 例如:MAIL,Mail,mail,mAiL /boot:引导文件存放目录,内核文件、引导加载器都存放于此目录。 /bin:所有用户的使用的基本命令,不能关联至独立分区,OS启动即会用到的程序。 /sbin:管理类的基本命令,不能关联至独立分区,OS启动即会用到的程序。 /lib:启动时程序依赖的基本共享库文件以及内核模块文件。 /lib64:专用于x86_64系统上的辅助共享库文件存放位置。 /etc:配置文件目录。 /home/USERNAME:普通用户家目录。 /root:管理员的家目录。 /media:便携式移动设备挂载点。 二、描述文件的元数据信息有哪些,分别表示什么含义,如何查看?如何修改文件的时间戳信息?  1、元数据定义:   数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性

即将开源 | 2亿用户背后的Flutter应用框架Fish Redux

☆樱花仙子☆ 提交于 2020-02-29 12:48:25
背景 在闲鱼深度使用 Flutter 开发过程中,我们遇到了业务代码耦合严重,代码可维护性糟糕,如入泥泞。对于闲鱼这样的负责业务场景,我们需要一个统一的应用框架来摆脱当下的开发困境,而这也是 Flutter 领域空缺的一块处女地。 Fish Redux 是为解决上面问题上层应用框架,它是一个基于 Redux 数据管理的组装式 flutter 应用框架, 特别适用于构建中大型的复杂应用。 它的最大特点是配置式组装, 一方面将一个大的页面,对视图和数据层层拆解为互相独立的 Component|Adapter,上层负责组装,下层负责实现,另一方面将 Component|Adapter 拆分为 View,Reducer,Effect 等相互独立的上下文无关函数。所以它会非常干净,易编写、易维护、易协作。 Fish Redux 的灵感主要来自于 Redux、React、Elm、Dva 这样的优秀框架,而 Fish Redux 站在巨人的肩膀上,将集中,分治,复用,隔离做的更进一步。 分层架构图 架构图,主体自底而上,分三层,每一层用来解决不通层面的问题和矛盾,下面依次来展开。 Redux Redux 是来自前端社区的一个数据管理框架, 对 Native 开发同学来说可能会有一点陌生,我们做一个简单的介绍。 Redux 做什么的? Redux 是一个用来做可预测易调试的数据管理的框架

微软工程师建议的11条数据库设计准则

主宰稳场 提交于 2020-02-29 05:41:11
从MOsky的博客中阅读本文 简介 作者:Shivprasad koirala 前微软ASP/ASP.NET的MVC工程师,现在印度当CEO。如果你认为本文有些地方翻 译不准确,可以去 译译网对应的贴子 参与本贴的翻译。 引言 在你开始读这篇文章之前,我可要事先声明,我可不是什么数据库设计方面的大师什么的。这11条设计准则,都是我从实际项目中,从经验中,从阅读和学习之中总结而来的。我个人认为,如我来设计数据库,遵循这11条准则,会让我受益良多。请多指教。 我之所以要写这么一篇详尽的文章,那是因为,我发现很多developer对“三范式”笃信不疑,而不顾自己的实际情况如何。他们认为,“三范式”就是数据库设计的唯一选项!随着项目进度不断推进,这些抱着这种观点的人,终归会碰壁的。 如果你对于“范式”没什么印象,可以点击 这里 。这篇视频教程手把手地教你“三范式”是怎么一回事。 译者注: 视频教程贴在youtube,如果不翻墙可能看不到。如果不想翻墙,或者不想听英语,可以谷歌“数据库范式”。 说到底,“范式”是非常重要的准则,但是,奉为圭臬,则总归要吃亏。因此,我将列出我所认为数据库设计最重要的11条准则。 准则一:应用的类型是什么?是OLTP还是OLAP? 当你开始设计数据库的时候,第一件事,就是分析,你设计的数据库,是为那种类型的数据库提供服务的。具体来说,到底是 事务型

最新Excel数据管理2019训练营课程

别说谁变了你拦得住时间么 提交于 2020-02-28 05:24:46
课程目录 第01课 源头在手,天下才有 第02课 _ 表格设计规则——拆掉合并单元格 第03课 _ 表格设计规则——合计行中的惊天秘密 第04课 _ 表格设计规则——换个角度看懂多表头的表格 第05课 表格设计规则——一列描述一个词,多的文字都不要 第06课 用了离不了手的快捷键 第07课 任意表格转标准数据源 第08课 _ 单元格各种花式录入,保数据源平安 第09课 _ 单元格限定录入 第10课 _ 做成真的系统一样 第11课 _ 智能提醒小秘书 第12课 _ 最有价值的数据系统模型 第13课 _ 多张统计表快速合并为一张表 第14课 _ Excel常见问题与解决方法 第15课 _ Excel&Word梦幻联手出奇迹 第16课 _ 数据高手能力分界线 第17课 _ 多条件匹配与评分定级 第18课 _ 数据分析与统计的幸福感制造者 第19课 _ 数据分析与统计的多维度变化 第20课 _ 点评同学们提出的典型问题 第21课 _ 训练营总结,课后学习建议 Excel数据管理训练营作业包 00发刊词 把Excel想对了才能做得对.pdf 00发刊词 _ 把Excel想对了才能做得对.mp3 00发刊词(小视频).mp4 00课前必读 上课操作指南.pdf 00课前必读(链接)课前小调研.pdf 下载地址: 百度云盘 来源: CSDN 作者: m0_46238324 链接: https:/