因为平时工作中接触的跟大数据有关,于是学习了一下大数据
第一篇学习的是:慕课网 -- 大数据 -- 电商大数据之用户画像介绍
笔记--基本概念介绍:
1、用户画像的价值 --- 有利于精准营销,营销手段:邮件 or 短信
2、用户统计: 地段/时段
3 、数据挖掘 特征/行为
数据收集:网络日志数据、用户行为数据、网站交易数据
行为建模:文本挖掘、自然语言处理、机器学习、预测算法、聚类算法
用户画像:用户的基本属性、购买能力,行为特征,兴趣爱好,心里特征,社交网络
静态信息数据:用户填写的个人资料
用户行为产生的数据:注册、浏览、点击、购买、签收、评价
比较重要的行为:购买的商品 ,加入购物车,收藏关注等
标签: 确定的标签、猜测标签、
用户活跃度:
未购买、流失、活跃、沉睡
用户画像的用途:
1、可以做分类统计,比如:全国大学生购买书籍人数top10
2、结合营销推荐
数据开发的步骤:
1、需求确定
2、建模确定表结构
3、实现方案确定
数据开发过程:
1、表落地
2、按照表写sql 代码 生成数据
3、部署代码
4、数据测试
5、试运行与上线
业务中 接触的具体画像 (标签:值):
性别: 男 女
地区: 根据用户的下单地址和收货地址来解析
客户来源平台 : 美团 、有赞、 饿了么 、新零售、商城
最近访问 : 有访问/无访问 根据订单的创建时间或者用户表的最后登录时间
最近提交订单1天/最近提交订单3天/最近提交订单7天/最近提交订单15天/最近提交订单30天/最近提交订单60天 /.....: 1次、2次、3次、3次及以上
最近充值1天/最近充值3天/最近充值7天/最近充值15天/最近充值30天/最近充值60天 /.....: 1次、2次、3次、3次及以上
余额总额:0元/100元内/300元内/500元内/500以上....
累计消费订单数1天/累计消费订单数3天/累计消费订单数7天/累计消费订单数15天/累计消费订单数30天/累计消费订单数60天 /.....: 1次、2次、3次、3次及以上
累计消费金额1天/累计消费金额3天/累计消费金额7天/累计消费金额15天/累计消费金额30天/累计消费金额60天 /.....: 1000、2000、3000、3000及以上
退款订单数1天/退款订单数3天/退款订单数7天/退款订单数15天/退款订单数30天/退款订单数60天 /.....: 1次、2次、3次、3次及以上
平均客单价1天/平均客单价3天/平均客单价7天/平均客单价15天/平均客单价30天/平均客单价60天 /:10 、20、30、40、50....
实现方式:
根据order ,order_goods , goods , category(类目),user ... 等一些数据表 写一些逻辑性的sql , 清洗出目标数据