今天我们来学习 CNN,大家可能都知道 CNN 主要应用于图像领域,但其实近几年在自然语言处理领域也经常使用 CNN 来做一些任务,这篇文章我们先介绍一下 CNN 的基础,下一篇将介绍一个很擅长处理图像任务的模型要如何用于文本序列任务。
什么是 CNN
CNN:Convolutional Neural Network,卷积神经网络,主要用于图像领域,可以用来做图像分类任务,比如大家熟知的手写识别、聚类任务、如图片搜索,此外还有物体识别、人脸识别、自动驾驶、无人机、机器人学,医学诊断等领域中也表现出色。在 2016 年的 ImageNet Large Scale Visual Recognition Challenge(ILSVRC)的图像分类任务中,CNN 在 1000 个不同类别中就已经可以达到 98% 的准确率了。
都有哪些著名的卷积神经网络
在进入详细的理论部分,我们先看一下几大著名的卷积神经网络,这对我们后面了解基础结构也有一定的帮助。
我们将按照时间顺序简单介绍下面八种结构:
- LeNet-5
- AlexNet
- VGG-16
- Inception-v1
- Inception-v3
- ResNet-50
- Xception
- ResNeXt-50
Alfredo Canziani 等人曾经发过一篇论文 AN ANALYSIS OF DEEP NEURAL NETWORK MODELS FOR PRACTICAL APPLICATIONS,里面比较了这几种神经网络的运算量和准确率,下图便是他们的实验结果&#x
来源:oschina
链接:https://my.oschina.net/u/4314216/blog/4636327