rmse

07-01 推荐系统常用度量指标

北城余情 提交于 2020-03-03 11:27:01
文章目录 推荐系统常用评估指标 RMSE MAE Precision(准确率)&Recall(召回率) 覆盖率 信息熵 基尼系数 多样性 获取各种评测指标的途径 长尾分布 推荐系统常用评估指标 RMSE   加大了对预测不准的用户物品评分的惩罚。 RMSE = ∑ u , i ∈ T ( r u i − r u i ^ ) 2 ∣ T ∣ \text{RMSE}=\sqrt\frac{\sum_{u,i\in{T}}(r_{ui}-\hat{r_{ui}})^2}{|T|} RMSE = ∣ T ∣ ∑ u , i ∈ T ​ ( r u i ​ − r u i ​ ^ ​ ) 2 ​ ​ # records[i] = [u,i,rui,pui] # rui是用户u对物品i的实际评分,pui是用户u对物品i的预测评分 def rmse ( records ) : """计算均方根误差""" return math . sqrt ( sum ( [ ( rui - pui ) * ( rui - pui ) for u , i , rui , pui in records ] ) / len ( records ) ) MAE   如果评分系统是基于整数建立的,对预测结果取整会降低MAE的误差。 MAE = ∑ u , i ∈ T ∣ r u i − r u i ^ ∣ ∣ T ∣

L8梯度消失、梯度爆炸

牧云@^-^@ 提交于 2020-02-15 02:22:16
梯度消失、梯度爆炸以及Kaggle房价预测 代码地址: 下载 https://download.csdn.net/download/xiuyu1860/12156343 梯度消失和梯度爆炸 考虑到环境因素的其他问题 Kaggle房价预测 梯度消失和梯度爆炸 深度模型有关数值稳定性的典型问题是消失(vanishing)和爆炸(explosion)。 当神经网络的层数较多时,模型的数值稳定性容易变差。 假设一个层数为 L L L 的多层感知机的第 l l l 层 H ( l ) \boldsymbol{H}^{(l)} H ( l ) 的权重参数为 W ( l ) \boldsymbol{W}^{(l)} W ( l ) ,输出层 H ( L ) \boldsymbol{H}^{(L)} H ( L ) 的权重参数为 W ( L ) \boldsymbol{W}^{(L)} W ( L ) 。为了便于讨论,不考虑偏差参数,且设所有隐藏层的激活函数为恒等映射(identity mapping) ϕ ( x ) = x \phi(x) = x ϕ ( x ) = x 。给定输入 X \boldsymbol{X} X ,多层感知机的第 l l l 层的输出 H ( l ) = X W ( 1 ) W ( 2 ) … W ( l ) \boldsymbol{H}^{(l)} =

动手学深度学习17-kaggle竞赛实践小项目房价预测

天涯浪子 提交于 2019-12-14 10:52:25
kaggle竞赛 获取和读取数据集 数据预处理 找出所有数值型的特征,然后标准化 处理离散值特征 转化为DNArray后续训练 训练模型 k折交叉验证 预测样本,并提交结果 kaggle竞赛 本节将动手操作实践一个kaggle比赛,房价预测。 可以先将未经优化的数据的预处理,模型的设计和超参的选择,可以动手操作,观察实现的过程以及结果, 获取和读取数据集 比赛的数据分为训练数据集和测试数据集。两个数据集都包括每栋房子的特征,如阶段类型,建造年份,房顶类型,地下室状况等特征值。这些特征值有连续的数字、离散的的标签甚至是缺失值Na,只有训练数据集包括了每栋房子的价格。我们可以通过Kaggle竞赛提供的接口访问并下载该数据集。 %matplotlib inline import torch import torch.nn as nn import numpy as np import pandas as pd import sys sys.path.append('..') import d2lzh_pytorch as d2l print(torch.__version__) torch.set_default_tensor_type(torch.FloatTensor) 1.0.0 # 我们将数据解压缩之后放入当前目录下的../data/kaggle_house/文件夹下 train

【scikit-learn】scikit-learn的线性回归模型

我与影子孤独终老i 提交于 2019-11-27 21:12:37
内容概要 如何使用pandas读入数据 如何使用seaborn进行数据的可视化 scikit-learn的线性回归模型和使用方法 线性回归模型的评估测度 特征选择的方法 作为有监督学习,分类问题是预测类别结果,而回归问题是预测一个连续的结果。 1. 使用pandas来读取数据 Pandas 是一个用于数据探索、数据处理、数据分析的Python库 In [1]: import pandas as pd In [2]: # read csv file directly from a URL and save the results data = pd . read_csv ( 'http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv' , index_col = 0 ) # display the first 5 rows data . head () Out[2]: TV Radio Newspaper Sales 1 230.1 37.8 69.2 22.1 2 44.5 39.3 45.1 10.4 3 17.2 45.9 69.3 9.3 4 151.5 41.3 58.5 18.5 5 180.8 10.8 58.4 12.9 上面显示的结果类似一个电子表格,这个结构称为Pandas的数据帧(data frame)。