斯坦福CS231n—深度学习与计算机视觉----学习笔记 课时3

可紊 提交于 2019-12-27 17:31:15

课时3 计算机视觉历史回顾与介绍下

ImageNet有5000万张图片,全部都是人工清洗过得,标注了超过2万个分类。

CS231n将聚焦于视觉识别问题,图像分类关注的是大图整体;物体检测告诉你东西具体出现在图片的哪里以及物体之间的联系是什么之类的。

CNN是深度学习架构的一种,2012年之前的imageNet,都是特征+支持向量机的,也是分层结构,但没有端到端的特征;

Kunihiko Fukushima提出了一个模型,称为Neocognitron,是神经网络架构的开端。

数据本身并没有什么意义,但是在深度学习架构中,数据成了高性能架构的驱动力,来执行端到端的训练,帮助解决过拟合问题,只要有足量的数据。

愿景:给电脑一张图片,电脑可以输出描述性文字(一句话之类的)。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!