全民狂欢购物的双十一背后,有很多技术在支撑,利用正确的技术手段可以在双十一为我所用。我们以化妆品电商为例,解析一下如何通过数据分析的方式让电商的双十一准备更高效充分。 基于历史数据进行分析建模对今年的销售情况进行预测,能够帮助商家做出更科学的营销方案。通常我们所能够收集到的历史数据包含了时间、名称、价格、销量、评论数量、商户等数据。 在已有数据中(数据量有限,仅用作构建分析模型之用,不作为参考),我们发现“title”这一列里面的信息量很大,但由于都是杂乱无章的文本数据,不能直接做分析,所以首先需要通过自然语言处理技术对数据进行处理。处理之后,会清清晰的得到产品大类、小类、产品功效之类等变量。 根据数据变量的特征,分别用线性回归、决策树、随机森林、XgBoost 等算法建模并比较,得到一个最佳的预测模型。起初,这些特征和销售量的关系单从数字上看并不直观,但是,通过使用七牛云 Pandora 可以将这些数据可视化,更直观看到结果。
从散点图展示,销量的预测值和实际值很接近,几乎完美地服从 y=x 的直线分布,所以能够判断出,这个模型能够帮助我们有效进行分析。 “变量重要性”是我们在分析中所需要关注到的一个重点。针对电商,通常评论数量、价格和产品功效是影响销量的三大关键因素。评论数量越多,销量就越高;价格正好相反,价格越低,销量就越高;针对化妆品这一品类,补水这一功能产品明显比其他的卖得好。 通过化妆品电商这一基础模型的建立,相信大家已经能够感受到数据对于电商行业,运营策略制定的影响。通过机器数据分析平台 Pandora,七牛云将帮助更多的用户以数据驱动营收,让业务展现不一样的生命力。
来源:oschina
链接:https://my.oschina.net/u/1038592/blog/4716276