参考文章: 推荐系统——用户画像 1. 用户画像 1.1 用户画像定义 用户画像:也叫用户信息标签化、客户标签;根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。从电商的角度看,根据你在电商网站上所填的信息和你的行为,可以用一些标签把你描绘出来,描述你的标签就是用户画像。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。 用户画像不是推荐系统的目的,而是在构建推荐系统的过程中产生的一个关键环节的副产品,包括但不仅限于用户的注册资料、标签,各种深度学习得到的 embedding 向量。 用户画像是对现实世界中用户的数学建模,主要包括两方面: 描述用户,即用户在业务信息维度中的信息投射 通过分析挖掘用户尽可能多的数据信息,对用户信息数据进行抽象,提炼,转化。 用户画像关键元素: 维度、量化 按照对用户向量化的手段来分,用户画像构建方法分成三类: 第一类就是原始数据。直接使用原始数据作为用户画像的内容,如注册资料,行为轨迹等信息,除了数据清洗等工作,数据本身并没有做任何抽象和归纳。这种方法实现简单,但通常对于用户冷启动等场景非常有用。 第二类就是统计分析。方法就是通过大量数据进行统计分析,这是最常见的用户画像数据,常见的兴趣标签,就是这一类。 第三类就是机器学习。通过机器学习,可以得出人类无法直观理解的稠密向量