Inception

从卷积拆分和分组的角度看CNN模型的演化

一个人想着一个人 提交于 2020-08-14 02:18:29
博客: 博客园 | CSDN | blog 写在前面 如题,这篇文章将尝试从卷积拆分的角度看一看各种经典CNN backbone网络module是如何演进的,为了视角的统一,仅分析单条路径上的卷积形式。 形式化 方便起见,对常规卷积操作,做如下定义, \(I\) :输入尺寸,长 \(H\) 宽 \(W\) ,令长宽相同,即 \(I = H = W\) \(M\) :输入channel数,可以看成是tensor的高 \(K\) :卷积核尺寸 \(K \times K\) ,channel数与输入channel数相同,为 \(M\) \(N\) :卷积核个数 \(F\) :卷积得到的feature map尺寸 \(F \times F\) ,channel数与卷积核个数相同,为 \(N\) 所以,输入为 \(M \times I \times I\) 的tensor,卷积核为 \(N \times M \times K \times K\) 的tensor,feature map为 \(N \times F \times F\) 的tensor,所以常规卷积的计算量为 \[FLOPS = K \times K \times M \times N \times F \times F \] 特别地,如果仅考虑SAME padding且 \(stride = 1\) 的情况,则 \(F =

2020年6月六级作文和翻译三国演义

心已入冬 提交于 2020-08-12 14:46:55
这两篇难度不大,很容易得到一个过线的分数。 Directions: For this part, you are allowed 30 minutes to write an essay on the saying The best preparation for tomorrow is doing your best today . You should write at least 150 words but no more than 200 words. 《三国演义》(The Romance of the Three Kingdoms)是中国一部著名的历史小说,写于十四世纪。这部文学作品以三国时期的历史为背景,描写了从公元二世纪下半叶到公元三世纪下半叶的魏、蜀、吴三国之间的战争。小说中刻画了近千个人物和无数的历史事件。这些人物和事件虽然大都基于真实的历史,但都不同程度地浪漫化和戏剧化了。《三国演义》是一部公认的文学杰作。自面世以来,这部小说不断吸引着一代又一代的读者,并且对中国文化产生着广泛而持久的影响 《三国演义》(The Romance of the Three Kingdoms)是中国一部著名的历史小说,写于十四世纪。 The Romance of the Three Kingdoms is a famous history nova in China,written

常见CNN网络创新点

大城市里の小女人 提交于 2020-08-12 00:28:56
这篇文章主要介绍卷积神经网络1998年到2019年的20多种经典的网络,体会每种网络的前世今身以及包含的深邃思想。算是一个总结性的博客吧。。。 目录 一、1998年:LeNet 二、2012年:AlexNet 三、2013年:ZFNet 四、2014年:亚军——VGGNet 冠军——GoogLeNet 五、2015年:ResNet 六、2016年:DenseNet 七、2017年:SENet 一、1998年:LeNet 1988年,Yann LeCun(深度学习三巨头之一,2019年获得图灵奖)提出了用于手写字符识别的卷积网络模型LeNet5。其原理结构比较清晰,如图所示。当年,美国很多企业都采用了该模型用于识别现实场景中的数字,例如邮政编码、手写数字等,能够达到商用的程度,可见其在AI领域的开创性地位。 在论文中,LeNet5被用于识别MNIST数据集提供的10个数字。MNIST数据集在人工智能领域的作用是非常重要的,是当时Google实验室的Corinna Cortes和纽约大学的Yann LeCun共同建立的手写数字数据库,由60000张训练图片和10000张测试图片组成。该数据集提供的图片像素统一为28×28,图片中字符像素最大为20×20。 创新点: 提出卷积神经网络 二、 2012 年:AlexNet AlexNet是2012年提出的

UML学习笔记—基本概念和初始阶段

狂风中的少年 提交于 2020-08-11 17:38:46
chpater1 1、什么是分析和设计 分析:对问题和需求的调查研究 设计:满足需求的概念上的解决方案 做正确的事(分析)和正确地做事(设计) 2、什么是Object-Oriented-Analysis (面向对象分析) 在问题领域发现和描述对象(或概念)**从问题发现需求然后从需求中抽象出对象* * finding and describing the** concepts in (not software object or class) **the problem domain 3、什么是Object-oriented-Design(面向对象设计) 定义软件对象以及他们如何协助以实现需求 defining how the software objects collaborate to fulfill the requirements 4、什么是UML(统一建模语言) 统一建模语言 是描述、构造和文档化系统制品的可视化语言 a visual language for specifying, constructing and documenting the artifacts of systems 5、为什么需要UML Use graphic notation to communicate more clearly than nature language (imprecise)

ILSVRC-ImageNet历年竞赛冠军

妖精的绣舞 提交于 2020-08-11 14:44:01
ImageNet 是一个超过15 million的图像数据集,大约有22,000类。 是由李飞飞团队从2007年开始,耗费大量人力,通过各种方式(网络抓取,人工标注,亚马逊众包平台)收集制作而成,它作为论文在CVPR-2009发布。当时人们还很怀疑通过更多数据就能改进算法的看法。 深度学习发展起来有几个关键的因素,一个就是庞大的数据(比如说ImageNet),一个是GPU的出现。(还有更优的深度模型,更好的优化算法,可以说数据和GPU推动了这些的产生,这些产生继续推动深度学习的发展)。 ILSVRC 是一个比赛,全称是ImageNet Large-Scale Visual Recognition Challenge,平常说的ImageNet比赛指的是这个比赛。 使用的数据集是ImageNet数据集的一个子集,一般说的ImageNet(数据集)实际上指的是ImageNet的这个子集,总共有1000类,每类大约有1000张图像。具体地,有大约1.2 million的训练集,5万验证集,15万测试集。 ILSVRC 从2010年开始举办,到2017年是最后一届 (在算法层面已经刷过拟合了,再比下去意义不是很大了)。ILSVRC-2012的数据集被用在2012-2014年的挑战赛中(VGG论文中提到)。ILSVRC-2010是唯一提供了test set的一年。

大汇总 | 一文学会八篇经典CNN论文

懵懂的女人 提交于 2020-08-11 12:32:08
本文主要是回顾一下一些经典的CNN网络的主要贡献。 论文传送门 【google团队】 [2014.09]inception v1: https://arxiv.org/pdf/1409.4842.pdf [2015.02]inception v2: https://arxiv.org/pdf/1502.03167.pdf [2015.12]inception v3: https://arxiv.org/pdf/1512.00567.pdf [2016.02]inception v4: https://arxiv.org/pdf/1602.07261.pdf 【microsoft】 [2015.12]resnet : https://arxiv.org/pdf/1512.03385v1.pdf 【Facebook】 [2016.11]resnext : https://arxiv.org/pdf/1611.05431.pdf 【CORNELL & Tsinghua & Facebook】 [2016.08]DenseNet : https://arxiv.org/pdf/1608.06993.pdf 【momenta】 [2017.09]SEnet : https://arxiv.org/pdf/1709.01507.pdf Inception v1 【主要贡献】 在传统网络中

针对知名航天和军事公司的攻击活动分析

瘦欲@ 提交于 2020-08-11 02:41:47
原文链接: Operation In(ter)ception: Aerospace and military companies in the crosshairs of cyberspies 译者:知道创宇404实验室翻译组 去年年底,我们发现了针对欧洲和中东地区的航空航天和军事公司的攻击活动,该攻击在2019年9月至2019年12月非常活跃。通过对两家受影响的欧洲公司的深入调查,我们对其攻击活动进行了深入了解,发现了之前从未被记录的恶意软件。 本文将对攻击活动的具体情况进行分析,完整的分析报告可查看白皮书 《运营感知:针对欧洲航空航天和军事公司的针对性攻击》 。 基于名为Inception.dll的相关恶意软件样本,我们将这些攻击称为“操作感知”,发现这些攻击活动具有很高的针对性。 为了危及目标,攻击者以诱人的虚假工作机会为幌子。在取得信任后,开始部署了自定义的多级恶意软件以及修改过的开源工具。除此之外还采用“陆上生存”策略,滥用合法工具和操作系统功能,使用多种技术来避免检测(其中包括代码签名、定期对恶意软件进行重新编译以及冒充合法公司来进行诈骗)。 我们调查了解到该行动的主要目标是间谍活动。但是在调查的某个案例中发现攻击者试图通过商业电子邮件折衷攻击(BEC)将访问受害者电子邮件帐户的权限货币化。虽然我们没有找到有力的证据将攻击与已知的威胁行为者联系起来

第二次作业:卷积神经网络 part 2

耗尽温柔 提交于 2020-08-10 09:26:23
【第二部分】 代码练习 MobileNetV1 网络 MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications, 2017 https://arxiv.org/abs/1704.04861 VGG,GoogleNet,ResNet进一步提高CNN的性能。但是到ResNet,网络已经达到152层,模型大小动辄几百300MB+。这种巨大的存储和计算开销,严重限制了CNN在某些低功耗领域的应用。在实际应用中受限于硬件运算能力与存储(比如几乎不可能在手机芯片上跑ResNet-152),所以必须有一种能在算法层面有效的压缩存储和计算量的方法。而MobileNet/ShuffleNet正为我们打开这扇窗。 Mobilenet v1是Google于2017年发布的网络架构,旨在充分利用移动设备和嵌入式应用的有限的资源,有效地最大化模型的准确性,以满足有限资源下的各种应用案例。Mobilenet v1核心是把卷积拆分为Depthwise+Pointwise两部分。 Depthwise 处理一个三通道的图像,使用3×3的卷积核,完全在二维平面上进行,卷积核的数量与输入的通道数相同,所以经过运算会生成3个feature map。卷积的参数为: 3 × 3 × 3 = 27,如下所示:

第二次作业:卷积神经网络 part2

若如初见. 提交于 2020-08-10 08:49:23
Part Ⅰ 问题总结 1 如何理解卷积神经网络中的1*1卷积? 在学习MobileNetV2代码中,提到使用1 1实现降维和升维,有一点迷惑,就去查了查资料,发现1 1卷积核真是一个神奇的存在。它存在于各种结构中,比如:残差网络的Bootleneck残差模块里、GoogleNet的Inception模块里··· 当1 1卷积出现时,在大多数情况下它作用是升/降特征的维度,这里的维度指的是通道数(厚度),而不改变图片的宽和高。 同时,还会降低参数的数量,增加了网络的深度。 举个例子,h w 6的feature map,经过一个1 1的卷积核,变成了h w。有5个卷积核,输出就变成了h w*5,实现了降维的操作。升维也是一样的道理。 Part Ⅱ 代码练习 1 MobileNetV1 1.1 MobileNetV1概述 MobileNets基于一种流线型结构使用深度可分离卷积来构造轻型权重深度神经网络。MobileNetV1是一个有效的网络结构以及两组用于构建小型、低延迟模型的超参数,能在移动以及嵌入式视觉应用上轻易匹配设计要求。 1.2 MobileNetV1结构 1.2.1 深度可分离卷积 深度级可分离卷积其实是一种可分解卷积操作,其可以分解为两个更小的操作:depthwise convolution和pointwise convolution。 Depthwise

PyTorch应用:用ResNet进行交通标志分类

送分小仙女□ 提交于 2020-08-08 15:41:19
德国交通标志识别基准数据集:可能是自动驾驶汽车领域最受欢迎的图像分类数据集。 自动驾驶车辆需要对交通标志进行检测和分类,以了解应用于路段的交通规则。也许,这个数据集太小而且不完整,无法用于实际应用。不过,它是计算机视觉算法的一个很好的baseline。 数据集链接: [http://benchmark.ini.rub.de/?section=gtsrb&subsection=about] ▌数据集 数据集由两部分组成:训练集和测试集。 训练集包含39209张交通标志图片, 共分为43类,例如停车标志,自行车穿越和速度限制30 km / h。 德国交通标志识别数据集图像的例子 数据集的样本类别非常不均衡(imbalanced)。 例如,“速度限制(50 km / h)”符号有1800个样本,但“危险曲线向左”符号只有168个。 测试集具有12630张图片。2011年IJCNN就是用这个数据集进行了一场比赛. 您可以从官方网站下载数据集。 http:// benchmark.ini.rub.de/? section=gtsrb&subsection=dataset ▌实验方法 我尝试使用在ImageNet数据集上预训练的ResNet34卷积神经网络来进行迁移学习。 我在fast.ai最新版本的“ 深入学习编码器 ”课程中学到了解决计算机视觉问题的方法