Surprise(Simple Python Recommendation System Engine)是一款推荐系统库,是scikit系列中的一个。简单易用,同时支持多种推荐算法。基础算法、协同过滤、矩阵分解等
Surprise使用
Surprise里有自带的Movielens数据集。
- 1、载入自带数据集
from surprise import Dataset,evaluate,print_perf
#默认载入movielens数据集
data=Dataset.load_builtin('ml-100k')
#k折交叉验证
data.split(n_folds=3)
#假设使用SVD矩阵分解
algo=SVD()
#在数据集上测试效果(评估)
perf=evaluate(algo,data,measures=['RMSE','MAE'])
print_perf(perf)
- 2、载入自己的数据集
#指定文件所在路径 file_path=os.path.expanduser('文件路径') #告诉文本阅读器,文本的格式是怎样的 reader=Reader(line_format=' ',seq='\t') #加载数据 data=DataSet.load_form_file(file_path,reader=reader)
来源:oschina
链接:https://my.oschina.net/u/4313709/blog/4211721