Vault

漫谈数据仓库之维度建模

我是研究僧i 提交于 2021-02-16 10:12:18
0x00 前言 下面的内容,是笔者在学习和工作中的一些总结,其中概念性的内容大多来自书中,实践性的内容大多来自自己的工作和个人理解。由于资历尚浅,难免会有很多错误,望批评指正! 概述 数据仓库包含的内容很多,它可以包括架构、建模和方法论。对应到具体工作中的话,它可以包含下面的这些内容: 以Hadoop、Spark、Hive等组建为中心的数据架构体系。 各种数据建模方法,如维度建模。 调度系统、元数据系统、ETL系统、可视化系统这类辅助系统。 我们暂且不管数据仓库的范围到底有多大,在数据仓库体系中,数据模型的核心地位是不可替代的。为什么要数据仓库建模? 数据模型是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。有了适合业务和基础数据存储环境的模型,那么大数据就能获得以下好处: 性能 :良好的数据模型能帮助我们快速查询所需要的数据,减少数据的 I/O 吞吐。 成本 :良好的数据模型能极大地减少不必要的数据冗余,也能实现计算结果复用,极大的降低大数据系统中的存储和计算成本。 效率 :良好的数据模型能极大地改善用户使用数据的体验,提高使用数据的效率。 质量 :良好的数据模型能改善数据统计口径的不一致性,减少数据计算错误的可能性。 因此,下面的将详细地阐述数据建模中的典型代表:维度建模,对它的的相关理论以及实际使用做深入的分析。 文章结构 本文将按照下面的顺序进行阐述:

如何管理越来越多的Operator?OLM给你答案

本小妞迷上赌 提交于 2021-02-09 20:27:45
作者 | 匡大虎、阚俊宝 导读: OLM(Operator Lifecycle Manager) 作为 Operator Framework 的一部分,可以帮助用户进行 Operator 的自动安装,升级及其生命周期的管理。同时 OLM 自身也是以 Operator 的形式进行安装部署,可以说它的工作方式是以 Operators 来管理 Operators,而它面向 Operator 提供了声明式 (declarative) 的自动化管理能力也完全符合 Kubernetes 交互的设计理念。本文我们将来了解一下 OLM 的基本架构和安装使用。 OLM 组件模型定义 OLM 的出现是为了帮助没有如大数据,云监控等领域知识的用户能够自助式地部署并管理像 etcd、大数据分析或监控服务等复杂的分布式应用。因此从它的设计目标来说,OLM 官方希望实现面向云原生应用提供以下几个方向上的通用管理能力,包括: 生命周期管理:管理 operator 自身以及监控资源模型的升级和生命周期; 服务发现:发现在集群中存在哪些 operator,这些 operators 管理了哪些资源模型以及又有哪些 operators 是可以被安装在集群中的; 打包能力:提供一种标准模式用于 operator 以及依赖组件的分发,安装和升级; 交互能力:在完成了上述能力的标准化后,还需要提供一种规范化的方式(如 CLI

Ansible

我怕爱的太早我们不能终老 提交于 2021-01-06 09:21:03
目录 Ansible - 安装介绍 Ansible -常用模块介绍 Ansbile - Playbook 使用 Ansible - Roles 使用示例 参考 bilibili马哥视频 运维派教程 介绍 ansible 是一种自动化运维工具,基于 Python 开发,可实现批量系统配置、批量程序部署、批量运行命令等功能。 环境信息 # hostnamectl Static hostname: localhost.localdomain Icon name: computer-vm Chassis: vm Machine ID: 752d91f949a840fa9f2ed0b2ca54d8ad Boot ID: 81088a1ae25a46279b7746e8c9e0a091 Virtualization: vmware Operating System: CentOS Linux 7 ( Core ) CPE OS Name: cpe:/o:centos:centos:7 Kernel: Linux 3.10.0-957.el7.x86_64 Architecture: x86-64 安装 可直接通过 yum 安装 [ root@localhost ~ ] # yum search ansible 校验 [ root@localhost ~ ] # ansible -

漫谈数据仓库之维度建模

喜你入骨 提交于 2021-01-05 14:00:05
点击上方蓝色字关注我们~ 0x00 前言 下面的内容,是笔者在学习和工作中的一些总结,其中概念性的内容大多来自书中,实践性的内容大多来自自己的工作和个人理解。由于资历尚浅,难免会有很多错误,望批评指正! 概述 数据仓库包含的内容很多,它可以包括架构、建模和方法论。对应到具体工作中的话,它可以包含下面的这些内容: 以Hadoop、Spark、Hive等组建为中心的数据架构体系。 各种数据建模方法,如维度建模。 调度系统、元数据系统、ETL系统、可视化系统这类辅助系统。 我们暂且不管数据仓库的范围到底有多大,在数据仓库体系中,数据模型的核心地位是不可替代的。 因此,下面的将详细地阐述数据建模中的典型代表:维度建模,对它的的相关理论以及实际使用做深入的分析。 文章结构 本文将按照下面的顺序进行阐述: 先介绍比较经典和常用的数据仓库模型,并分析其优缺点。 详细介绍维度建模的基本概念以及相关理论。 为了能更真切地理解什么是维度建模,我将模拟一个大家都十分熟悉的电商场景,运用前面讲到的理论进行建模。 理论和现实的工作场景毕竟会有所差距,这一块,我会分享一下企业在实际的应用中所做出的取舍。 0x01 经典数据仓库模型 下面将分别介绍四种数据仓库模型,其中前三种模型分别对应了三本书:《数据仓库》、《数据仓库工具箱》和《数据架构 大数据 数据仓库以及Data Vault》,这三本书都有中文版

再见!CentOS 6

天涯浪子 提交于 2021-01-02 10:30:21
官宣:CentOS 6停止所有更新 CentOS 6已经随着2020年11月的结束进入了EOL(Reaches End of Life)。所以在2020年12月2日,CentOS官方停止了对CentOS 6的所有更新,并且下架了包括官方所有的CentOS6源,目前阿里、163、清华等CentOS6源已无法使用。 以下 官方redme文档的解释 : This directory (and version of CentOS) is deprecated. Please see this FAQ concerning the CentOS release scheme: https://wiki.centos.org/FAQ/General Please keep in mind that 6.0, 6.1, 6.2, 6.3, 6.4 , 6.5, 6.6, 6.7, 6.8 , 6.9 and 6.10 no longer get any updates, nor any security fix's. The whole CentOS 6 is dead and shouldn't be used anywhere at all 为此,民工哥特意去CentOS官方查了查,目前的各个版本的最后维护更新时间,如下。 CentoS 6 停止维护更新日期 2020年11月30日

阿里云Centos6 yum源无法更新404解决

∥☆過路亽.° 提交于 2020-12-23 15:55:54
主要原因Centos 6的yum 官网不在维护,所以镜像的yum源也不在维护了,尝试使用网上搜的替换阿里云、163的yum源,发现也不行了。提交了工单 可以使用阿里内网yum源: yum源 专有网络VPC类型实例需切换为http://mirrors.cloud.aliyuncs.com/centos-vault/6.10/源。 经典网络类型实例需切换为http://mirrors.aliyuncs.com/centos-vault/6.10/源。 epel源 专有网络VPC类型实例需切换为http://mirrors.cloud.aliyuncs.com/epel-archive/6/源。 经典网络类型实例需切换为http://mirrors.aliyuncs.com/epel-archive/6/源。 repo VPC: [base] name=CentOS-6.10 enabled=1 failovermethod=priority baseurl=http://mirrors.cloud.aliyuncs.com/centos-vault/6.10/os/$basearch/ gpgcheck=1 gpgkey=http://mirrors.cloud.aliyuncs.com/centos-vault/RPM-GPG-KEY-CentOS-6 [updates] name

运维自动化-ansible

喜你入骨 提交于 2020-12-20 20:08:53
ansible 简介 ansible是新出现的自动化运维工具,基于Python开发,集合了众多运维工具(puppet、chef、func、fabric)的优点,实现了批量系统配置、批量程序部署、批量运行命令等功能。 ansible 特点 部署简单,只需在主控端部署Ansible环境,被控端无需做任何操作; 默认使用SSH协议对设备进行管理; 有大量常规运维操作模块,可实现日常绝大部分操作; 配置简单、功能强大、扩展性强; 支持API及自定义模块,可通过Python轻松扩展; 通过Playbooks来定制强大的配置、状态管理; 轻量级,无需在客户端安装agent,更新时,只需在操作机上进行一次更新即可; 提供一个功能强大、操作性强的Web管理界面和REST API接口——AWX平台。 ansible 任务执行 Ansible 系统由控制主机对被管节点的操作方式可分为两类,即adhoc和playbook: ad-hoc模式(点对点模式) 使用单个模块,支持批量执行单条命令。ad-hoc 命令是一种可以快速输入的命令,而且不需要保存起来的命令。就相当于bash中的一句话shell。 playbook模式(剧本模式) 是Ansible主要管理方式,也是Ansible功能强大的关键所在。playbook通过多个task集合完成一类功能,如Web服务的安装部署、数据库服务器的批量备份等

揭秘美国空军如何用AI技术提升“战斗力”

谁说我不能喝 提交于 2020-12-11 12:36:54
以AI技术为基础,美国空军正努力将自身转化为更强调协作性的组织。 来源丨Forbes 作者丨Kathleen Walch 编译丨科技行者 通过增加数据规模与相关素养提升,美国空军各部门及人员,将建立起更强的决策、战略、任务执行以及网络安全保障效率与能力。以此为基础,美国空军正努力将自身转化为更强调协作性的组织。 ▲ 美国空军首席数据官Eileen M. Vidrine 美国空军首席数据官Eileen Vidrine女士深知,采用先进数据分析、人工智能与机器学习等工具,对于帮助自身在战场上占得先机的重要意义。她还意识到,为了在空军内部全面推广这类技术与技能,必须深刻改变内部的观念及文化。在最近的一场政府AI会议上,Eieen分享了自己对于空军部门变革态势的观点与见解,并在本文采访中做出进一步说明。 问:美国空军首席数据办公室(SAF/CO)如何推动空军的数据战略发展并建立起先进的数据文化? Eileen Vidrine: 上个月,《国防部数据战略》正式发布。此文由David Spirk、David Markowitz、Tom Sasala和我共同编撰,几位作者也正是国防部长办公室、陆军、海军以及空军的首席数据官。我们希望通过此文指导国防部将数据转化为一种重要的战略性资产。 这篇文章着重介绍了用于管理数据的VAULT-IS(即可见、可访问、可理解、链接、可信任、可互操作且安全)框架

早上好,我是 Istio 1.1

☆樱花仙子☆ 提交于 2020-11-29 11:25:00
1 性能增强 虽然Istio1.0的目标是生产可用,但从去年7月份发布以来,在性能和稳定性上并不能让用户满意。社区的Performance and Scalability工作组在Istio v1.1中做了大量的努力以提高控制面和数据面的性能,其中最明显的性能增强包括: Sidecar API,减少发给proxy的配置数量以及pilot负载。 网络配置规则(Destinationrule,Virtualservie, ServiceEntry)中增加的 exportTo字段限制配置的可见范围。 Envoy默认收集的统计数据大量减少。 给mixer增加load-shedding功能,防止overload。 提升envoy和mixer之间的交互协议。 可配置并发线程数,提高吞吐量。 可配置filter来约束mixer遥测数据。 从对Istio 1.1的测试数据来看,这部分工作取得了显著的效果。 1.1控制面性能表现 Pilot的CPU和内存使用受网格内的配置和系统状态的影响,例如负载变化速率,配置变化速率,连接到Pilot的proxy的数量等。可以通过增加Pilot的实例数来减少配置分发处理的时间,提高性能。 在网格内有1000个服务,2000 个sidecars,每秒1000请求下的表现: 单Pilot 实例使用 1 vCPU 和1.5 GB 的内存。 istio

MySQL 8.0.22正式发布

不问归期 提交于 2020-11-21 06:34:33
MySQL的最新版本8.0.22于2020年10月19日正式发行。这一版本里面有哪些变化,让我们快速浏览一下。 审计日志的改进 :对于JSON格式的日志文件,MySQL企业审计支持使用audit_log_read()用户定义函数进行日志读取操作。之前,只有通过向audit_log_read()传递一个参数才能指定开始读取的位置,为了更加灵活现在可以命名一个以时间戳的开始说明符,以便从该时间戳或之后的第一个事件开始读取。 MySQL企业版现在包含一个 keyring_oci插件 ,它使用Oracle Cloud Infrastructure Vault作为密钥环存储的后端。密钥信息不会永久存储在MySQL服务器本地存储中。 优化器部分 : prepared语句现在只在执行PREPARE时准备一次,而不是在每次执行时准备一次。此外,存储过程里面的语句也仅在初次执行时准备一次。 filesort算法现在支持对多个表上的联接进行排序,而不仅仅是对单个表进行排序。 在MySQL 8.0.22中,服务器在内部将所有右连接实例处理为左连接,消除了一些在解析时没有执行完整转换的特殊情况。 增加了支持SELECT INTO DUMPFILE 和 SELECT INTO OUTFILE 在写入文件时定期同步。 MySQL现在为符合条件的查询实现派生条件下推,将外部where条件推入派生表。 SQL语法