基于内容的推荐例子(电影推荐)
推荐例子介绍 根据典型关键数据 导演 演员 关键字 题材 'keywords ', 'cast ', 'genres ', 'director ' 构造自然语言的组合特征,利用CountVectorizer计算每个词出现的次数,作为特征向量, 使用余弦相似性构造所有电影之间的相似性。 代码 https://github.com/fanqingsong/Content-based-Recommandation-Engine import pandas as pd from sklearn.feature_extraction.text import CountVectorizer from sklearn.metrics.pairwise import cosine_similarity def get_title_from_index(index): return df[df.index == index][ " title " ].values[0] def get_index_from_title(title): return df[df.title == title][ " index " ].values[0] # Reading CSV File df = pd.read_csv( " movie_dataset_content.csv " , encoding= '