第六章 利用社交网络数据
6.2 社交网络数据简介
用图G(V,E,W)描述社交网络数据,V为顶点集合对应用户集;E为边集,两个用户之间有社交网络关系则就有一条边联系;W为每条边的权重.Facebook对应的社交网络为无向图(关系需要双方的确认),Twitter为有向图(朋友关系是单向的).
三种社交网络数据:
> 双向确认的社交网络数据
> 单向关注的社交网络数据
> 基于社区的社交网络数据( 用户之间没有明确的关系,只是包含了用户属于哪些社区的信息,例如喜欢海贼王的会有一些自己的圈子,都是天南地北的娃)
6.2 基于社交网络的推荐
优点:
> 基于好友的推荐可以增加推荐的信任度
> 社交网络可以解决冷启动问题
基于领域的社会化推荐算法:
用$p_{ui} =\sum_{v{\in}out(u)}w_{uv}r_{vi}$表示用户u对物品i的兴趣度.$out(u)$是用户的好友集合.$w_{uv}$由用户u,v的熟悉度以及兴趣相似度来衡量.熟悉度可以用两者的共同好友比例来度量$familiarity(u,v) =\frac{\left| out(u)\cap out(v) \right|}{\left| out(u) \cup out(v)\right|}$.兴趣的相似度可以用两者喜欢物品的重合度来衡量$similiarity(u,v)= \frac{\left| N(u)\cap N(v) \right|}{\left| N(u) \cup N(v)\right|}$N(u)表示用户u喜欢的物品集合.