cs231n-整理
一.杂论 1.1 训练集,验证集,测试集的区别 训练集:利用标签不断的进行网络参数(权重)的更新,但是每次训练都有一定的训练参数(学习率等) 验证集:用来选择训练集中最好的训练参数(学习率等) 测试集:用来真实的评价模型或者参数的结果 1.2 max函数的梯度: 其中一个为零梯度,另一个为正常梯度计算 1.3 卷积维度的计算: 卷积输出的维度=(输入维度+增补维度-卷积核维度)/步幅+1 1.4 硬件使用 CPU 核数较少,但运算很快,操作数很多,并且可以单独运行,适合做通信处理。 GPU 核数很多,但运算慢,操作有限,不能单独运行,适合进行高度并行的处理(矩阵运算) FPGA:可编程门阵列. ASIC:特定用途集成电路 1.5全连接模块 全连接模块会产生大量的参数,可以用池化替代 1.6 跨卷积与反向跨卷积 跨卷积:调整卷积核的步幅 反向跨卷积:将卷积得到的结果再乘上卷积核,并移动一定的步长(相乘结果) 两者可以使用步长比来命名 1.7 目标函数 将最终的目标作为目标函数可以更加有效的得到对应的结果 1.8 忽略细节 不准确的说,人们往往只知道某项技术可以达到怎样的功能,但是产生这样效果的原因却尚未没解开 1.9 减小模型复杂度 剪枝: (1)降低模型的复杂度 (2)防止过拟合 (3)先训练神经网络,再去除连接,再训练。 权值共享:对一些接近的权值,使用一个近似进行表示,学习