大数据

什么是用户画像——从零开始搭建实时用户画像(一)

半城伤御伤魂 提交于 2021-02-12 12:58:50
用户画像 简介 用户画像,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。 用户画像最初是在电商领域得到应用的,在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。 还记得年底收到的支付宝年度消费账单吗?帮助客户回顾一年的消费细节,包括消费能力、消费去向、信用额度等等,再根据每位客户的消费习惯,量身定制商品推荐列表……这一活动,将数据这个量化的词以形象生动的表现手法推到了大众面前。 这就是用户画像在电商领域的一个应用,随着我国电子商务的高速发展,越来越多的人注意到数据信息对于电商市场的推动作用。基于数据分析的精准营销方式,可以最大限度的挖掘并留住潜在客户,数据统计与分析为电商市场带来的突破不可估量。在大数据时代,一切皆可“量化”,看似普通的小小数字背后,蕴藏着无限商机,也正在被越来越多的企业所洞悉。 如何从大数据中挖掘商机?建立用户画像和精准化分析是关键。 用户画像可以使产品的服务对象更加聚焦,更加的专注。在行业里,我们经常看到这样一种现象:做一个产品,期望目标用户能涵盖所有人,男人女人、老人小孩、专家小白、文青屌丝...... 通常这样的产品会走向消亡,因为每一个产品都是为特定目标群的共同标准而服务的,当目标群的基数越大,这个标准就越低。换言之,

什么是用户画像——从零开始搭建实时用户画像(一)

ε祈祈猫儿з 提交于 2021-02-12 12:48:35
用户画像 简介 ​ 用户画像,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。 用户画像最初是在电商领域得到应用的,在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。 ​ 还记得年底收到的支付宝年度消费账单吗?帮助客户回顾一年的消费细节,包括消费能力、消费去向、信用额度等等,再根据每位客户的消费习惯,量身定制商品推荐列表……这一活动,将数据这个量化的词以形象生动的表现手法推到了大众面前。 ​ 这就是用户画像在电商领域的一个应用,随着我国电子商务的高速发展,越来越多的人注意到数据信息对于电商市场的推动作用。基于数据分析的精准营销方式,可以最大限度的挖掘并留住潜在客户,数据统计与分析为电商市场带来的突破不可估量。在大数据时代,一切皆可“量化”,看似普通的小小数字背后,蕴藏着无限商机,也正在被越来越多的企业所洞悉。 ​ 如何从大数据中挖掘商机?建立用户画像和精准化分析是关键。 ​ 用户画像可以使产品的服务对象更加聚焦,更加的专注。在行业里,我们经常看到这样一种现象:做一个产品,期望目标用户能涵盖所有人,男人女人、老人小孩、专家小白、文青屌丝...... 通常这样的产品会走向消亡,因为每一个产品都是为特定目标群的共同标准而服务的,当目标群的基数越大,这个标准就越低

「 神器 」绝不简单的截图神器

不打扰是莪最后的温柔 提交于 2021-02-12 12:35:21
今天给大家推荐一款比QQ截图、微信截图强出一个次元的截图神器,但它并不仅是个普通的截屏软件那么简单。 它有以下特点: 完全免费、功能强大、干净安全、没广告没捆绑 截图:强大、细腻、精确、高效的截图功能 Snipaste 的屏幕截图功能非常丰富且细腻好用!除了可以像素级精确地移动和控制截图区域 (截图框) 之外,它也能智能检测出界面元素 (譬如一个按钮或一个输入框) 的区域边界,实现点击自动扑捉。另外也能支持窗口阴影截图。 智能截图:自动检测界面元素边界 相比大多数截屏软件只能检测整个应用窗口边界,Snipaste 对界面元素的判定让你操作时可以更加精准快捷 精确控制截图范围 你可以可用鼠标拖放或者键盘快捷键移动或调整截图框大小,实现截图取景框的像素级精准移动。 键盘 w / s / a / d 可以移动光标上下左右精确移动 Shift + ↑ / ↓ / ← / → 缩小截图区域 Ctrl + ↑ / ↓ / ← / → 扩大截图区域 屏幕取色 先按下 F1 开始截图,然后对准想要取色的地方,按下键盘 C 键即可获取 当前像素点的 RGB 颜色值, 当你取色完成之后,你还可以把颜色值复制出来 (支持RGB、HEX等格式) 贴图:特色功能 - 将图片作为窗口置顶显示 贴图是 Snipaste 一个很有特色的功能。它可以把截图的结果或者本地的图片变成一个活动的无边框窗口贴在屏幕上展示

用户画像系列——用户画像数据建模方法

一笑奈何 提交于 2021-02-12 12:04:01
伴随着对人的了解逐步深入,一个概念悄然而生:用户画像(UserProfile),完美地抽象出一个用户的信息全貌,可以看作企业应用大数据的根基。 一、什么是用户画像? 男,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟。 这样一串描述即为用户画像的典型案例。如果用一句话来描述,即: 用户信息标签化。 如果用一幅图来展现,即: 二、为什么需要用户画像 用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理 ,如,可以做分类统计:喜欢红酒的用户有多少?喜欢红酒的人群中,男、女比例是多少? 也可以做数据挖掘工作:利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌?利用聚类算法分析,喜欢红酒的人年龄段分布情况? 大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。 当计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领域,都将能进一步提升精准度,提高信息获取的效率。 三、如何构建用户画像 一个标签通常是人为规定的高度精炼的特征标识,如年龄段标签:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,人能很方便地理解每个标签含义。这也使得用户画像模型具备实际意义。能够较好的满足业务需求。如,判断用户偏好。短文本,每个标签通常只表示一种含义

说透中台(答疑篇)--学习笔记

a 夏天 提交于 2021-02-12 09:58:47
中台与微服务、中间件、数据仓库到底有什么区别? 当我们谈中台与微服务的区别时,更多谈的是业务中台;当我们谈中台与中间件的区别时,则更倾向于技术中台;当我们谈中台与数据仓库的区别时,更多谈的则是数据中台。 所以这个问题更严谨的表达,应该是“业务中台与微服务”、“技术中台与中间件”、“数据中台与数据仓库”到底有什么区别? 业务中台与微服务的区别? 微服务更多关注技术架构层面上的问题,而业务中台更多关注业务架构层面上企业级复用的问题。业务中台不一定是微服务架构的,采用了微服务架构的也不一定就是中台。 技术中台与中间件的区别? 如果能通过中台这个概念为驱动力,促使企业的内部技术平台再向业务走出一步,无论是针对用户体验做优化,还是通过产品化,让业务可以自助式(Self-Service)地使用企业技术组件的能力,如果能做到这些或是起到这样的驱动力,我觉得技术中台这个概念才有价值。 数据中台与数据仓库的区别? 最大的一个区别还是数据中台和传统的数据系统出发点(视角)不一样。 传统的数据系统(数仓、大数据平台)更多是偏技术侧,拿着数据和技术找场景;而数据中台更多的是偏业务侧,拿着场景去找数据和技术。 中台和后台的区别具体在哪里? 我们可以用 SOR 来理解后台,对应到企业内,就是那些所谓的核心系统,常见的例如 ERP、DMS、银行的核心账务系统等。在实际的项目过程中

蓝鲸cmdb平台架构

回眸只為那壹抹淺笑 提交于 2021-02-12 09:46:38
体系介绍 graph TB 腾讯蓝鲸智云体系-->平台级产品 腾讯蓝鲸智云体系-->通用SaaS服务 腾讯蓝鲸智云体系由 平台级产品 和 通用 SaaS 服务 组成,平台包括管控平台、配置平台、作业平台、数据平台、容器管理平台、挖掘平台、PaaS 平台、移动平台等,通用 SaaS 包括节点管理、标准运维、日志检索、蓝鲸监控、故障自愈等,为各种云(公有云、私有云、混合云)的用户提供不同场景、不同需求的一站式技术运营解决方案。 架构图 平台级产品 管控平台 蓝鲸管控平台是蓝鲸体系的底层管控系统,是上层运维服务体系与底层 IaaS 的连接器,为上层提供指令、文件、数据的通道,支持直连模式、代理模式以及为达到最优连接指定级联路由的模式。管控平台是典型的两层分布式 C/S 结构,主要包含智能的蓝鲸 Agent、提供各种服务的 Server 以及 zookeeper、redis、MySQL 等周边保障模块。其中蓝鲸 Agent 是部署在业务机器上的程序,每台业务机器仅部署一个蓝鲸 Agent,其他模块部署无具体要求,用户可以单独部署,也可以混合部署。 在整个蓝鲸体系中,管控平台无需直面用户,但其在体系中却是不可或缺的,它为其他平台模块提供了人机交互的通道与能力。管控平台主要提供了三种类型的服务能力:文件分发传输能力、命令实时执行与反馈的能力、大数据采集与传输的能力。 平台架构 2. 配置平台

混合云真香的背后,新趋势暗流涌动

浪尽此生 提交于 2021-02-12 08:38:36
企业上云,有着私有云、公有云、混合云等多种选择。如果说过去企业上云会被选择何种方案所困扰,那么最近几年,越来越多的调研数据显示,混合云已经成为政企用户当下最希望采用的上云方式。 混合云,目前IT基础设施最为热门的领域之一,几乎汇聚了所有代表性的厂商。从AWS、UCloud为代表公有云服务商,到VMware、Red Hat等基础软件商,再到浪潮、戴尔等传统硬件厂商,甚至一些初创企业、集成商都大量涉足混合云,其热度可见一斑。 Gartner更预言,2020年之后,90%的企业与组织将利用混合云管理基础设施。混合云真香的背后,一方面是因为政企用户数字化转型加速,上云成为大势所趋,带来了实打实的混合云需求;另一方面,新应用、新场景不断涌现,混合云成为政企用户在新场景中运用云原生、大数据、人工智能等技术的重要“载体”,逐渐成为大部分用户在基础架构领域的首选。 如今,混合云市场恰似上演一拥而上的“乱象”,产品与解决方案多如牛毛,不同的技术路线也是泾渭分明。但随着越来越多的用户将应用迁移到混合云环境,对于混合云的核心诉求愈发清晰,即在混合云环境中愈发重视安全,需要在硬件资源中更加匹配自身业务,以及需要开放的平台来实现云上云下的打通。而“安全、定制、开放” 正是以UCloud为代表的中立云服务商,在构建新型混合云方案中最为核心的关键。 1 混合云不能只是一种“折衷” 混合云为何会在最近几年广受欢迎

Python爬虫教程-爬取豆瓣读书

折月煮酒 提交于 2021-02-12 07:13:38
豆瓣读书爬虫 Python所写,豆瓣读书的爬虫,方便大家搜罗各种美美书! 写在前面 通过豆瓣评分和评价人数等规则,可非常好的探索挖掘经典图书和隐藏好书,从中更高效地汲取书中智慧。 实现功能 1 可以爬下豆瓣读书标签下的所有图书 2 按评分排名依次存储 3 存储到Excel中,可方便大家筛选搜罗,比如筛选评价人数>1000的高分书籍;可依据不同的主题存储到Excel不同的Sheet 4 采用User Agent伪装为浏览器进行爬取,并加入随机延时来更好的模仿浏览器行为,避免爬虫被封 项目源码 # !/usr/bin/python3 # -*- coding: utf-8 -*- "" " info: author:CriseLYJ github:https://github.com/CriseLYJ/ " "" "" " 请求url分析 :https://fanyi.baidu.com/basetrans 请求方式分析 :POST 请求参数分析 : { query: hello from: en to: zh token: 6f5c83b84d69ad3633abdf18abcb030d sign: 54706.276099} 请求头分析 " "" # 代码实现流程 # 1. 实现面对对象构建爬虫对象 # 2. 爬虫流程四步骤 # 2.1 获取URl # 2.2 发送请求获取响应 #

从机器学习谈起

天大地大妈咪最大 提交于 2021-02-12 07:02:19
点击上方 “ 程序员江湖 ”, 选择“置顶或者星标” 你关注的就是我关心的! 转自:博客园,作者:计算机的潜意识 链接:www.cnblogs.com/subconscious/p/4107357.html 从机器学习谈起 在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。 在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于要阅读完这篇非常长的文章呢? 我并不直接回答这个问题前。相反,我想请大家看两张图,下图是图一: 这幅图上上的三人是当今机器学习界的执牛耳者。中间的是Geoffrey Hinton, 加拿大多伦多大学的教授,如今被聘为“Google大脑”的负责人。右边的是Yann LeCun, 纽约大学教授,如今是Facebook人工智能实验室的主任。而左边的大家都很熟悉,Andrew Ng,中文名吴恩达,斯坦福大学副教授,如今也是“百度大脑”的负责人与百度首席科学家。这三位都是目前业界炙手可热的大牛,被互联网界大鳄求贤若渴的聘请,足见他们的重要性。而他们的研究方向,则全部都是机器学习的子类--深度学习。 下图是图二: 这幅图上描述的是什么?Windows Phone上的语音助手Cortana,名字来源于《光环》中士官长的助手。相比其他竞争对手,微软很迟才推出这个服务

机器学习小白必知必会

依然范特西╮ 提交于 2021-02-12 04:22:41
机器学习是一门多领域交叉学科,需要很多知识储备。 对于机器学习,很多人也只是一知半解,想要知其然、究其实,但是面对各种各样的书籍、文章却无从下手,摸不清门路。 小白该具备哪些知识点呢? 01 概念初识 机器学习领域内有很多专业术语,如繁星一般,穿插在各种技术文档、文献、书籍等资料中。学习机器学习的第一步就是了解这些专业术语,能够“读懂”各类文档。下面是一些比较常见的概念和定义: 实例: 表示具体的一件事物,可以是一本书,一只鸟等等,实例具有诸多属性,比如鸟的羽毛颜色、翅膀长度、鸟喙形状等等,我们可以凭借这些属性来判断鸟属于什么种类。 标签: 标签表示我们所关注的实例的“结果”或者“类型”,它是机器学习系统中预测的结果,或者是训练数据中所标识的正确答案。比如一本书可能是中文图书,也可能是外文图书,这就是这本书的标签或者说分类。 属性: 属性表示实例本身所具有的特性,实例与属性密不可分。实例往往具有很多属性,而在机器学习过程中,我们只关注对实例打标签有意义的属性。比如在判断书属于什么种类时,很明显出版时间这一属性对我们做决策并没有太大意义。 样本: 样本代表实例和实例标签的结合,用于模型训练和效果测试。在模型训练过程中,我们用大量实例的属性值(或特征)以及标签去调节模型中的参数,在测试阶段,使用训练好的模型输入实例的属性值,将模型的预测结果与对应实例的标签做对比。 大数据: