吴恩达深度学习课程笔记-9
04. 卷积神经网络 第一周 卷积神经网络 1.1 计算机视觉 计算机视觉方向算是深度学习领域发展最快的方向之一,出现了大量富有创造性的工作。 而面对图片处理,首先出现的问题就是数据量巨大,一个1000×1000的RGB图片直接输入神经网络将有1百万的特征,网络的参数也将非常庞大,对于训练、设备内存都是巨大的挑战,所以不能这么干,卷积网络应运而生。 1.2 & 1.3 边缘检测 边缘检测是计算机视觉里一个基本问题,传统的做法是依靠各种手工设计的边缘检测算子,通过与图片进行卷积来检测边缘。 有各种各样的边缘检测算子,哪一种最合适其实众说纷纭。深度学习的观点是,这些卷积核的参数不要再手工设计了,而是当作参数让网络去学习。 1.4 & 1.5 & 1.6 卷积 机器学习中的卷积其实和数学或信号处理中的卷积定义不同,这里的卷积其实应该算是互相关。 卷积之后的图像大小计算公式: \( \lfloor \frac{n + 2p - f}{s} + 1 \rfloor \times \lfloor \frac{n + 2p - f}{s} + 1 \rfloor \) 其中卷积核大小(kernel size)或者滤波器(filter)大小 \( f \) 一般为奇数,填充大小(padding)\( p \) 取决于选择的卷积类型: Valid 卷积:不加填充。卷积之后图像越来越小。 Same