deep

论文:Deep Residual Learning for Image Recognition

匿名 (未验证) 提交于 2019-12-03 00:20:01
Abstract: 更深层的网络训练十分困难,我们提出了残差网络来实现深层网络。我们重新定制了层间的学习是参考 layer input 的残差函数,而不是一个没有参考的函数。 Introduction: 是否学习更好的网络就是简单的堆积更多的层?一个障碍便是梯度消失或者爆炸,从训练的一开始便会损害收敛,虽然这个问题可以被 normalization initialization 和 intermediate normalization layers解决,可以使网络达到十多层 当深层网络可以收敛后,又出现了退化问题,当网络层数加深,准确率开始变得饱和,然后会快速衰退,这种衰退并不是因为过拟合引起的,加更多的层会引起训练误差变大,如下图 这种训练准确率的退化表明并不是所用的 system 都可以很好的优化。如何从 shallower architecture 到 deeper architecture. 现有的方法是,added layers 是恒等映射(identity mapping),而其它层是 copy from learned shallower model.这种方法本应获得不低于 shallower counterpart 的准确率,但是并没有。 本文通过提出一个 deep residual learning framework 来解决 degradation

Deep & Cross模型

匿名 (未验证) 提交于 2019-12-03 00:03:02
Deep&Cross显式地做高阶特征组合。就是说设计几层神经网络结构,每一层代表其不同阶的组合,最下面是二阶组合,再套一层,三阶组合,四阶组合,一层一层往上套,这就叫显式地捕获高阶特征组合,Deep&Cross是最开始做这个的。 Deep & Cross Network 对于低阶的组合特征的构造,线性模型使用人工特征工程,FM使用隐向量的内积,FFM引入field的概念,针对不同的field上使用不同隐向量构造组合特征。DNN可以一定程度上实现自动学习特征组合,学习到的特征都是高度非线性的高阶组合特征,这样的隐式的学习特征组合带来的不可解释性,以及低效率的学习,因为并不是所有的特征组合都是有用的。Deep&Cross Network(DCN)将Wide部分替换为由特殊网络结构实现的Cross,在学习特定阶数组合特征的时候效率非常高, 自动构造有限高阶的交叉特征 ,并学习对应权重,告别了繁琐的人工叉乘。 一个DCN模型从嵌入和堆积层开始,然后是并行的是一个交叉网络和一个与之平行的深度网络,之后是最后的组合层,它结合了两个网络的输出。 嵌入和堆叠层 文中对原始特征做如下处理:1) 对sparse特征进行embedding,对于multi-hot的sparse特征,embedding之后再做一个简单的average pooling;2) 对dense特征归一化

【IOI】2007 训练路径

匿名 (未验证) 提交于 2019-12-02 23:59:01
题目链接 首先,无法删的边会形成一棵树(废话) 那么我们把这棵树先弄出来。 由于 为了保证他们的训练强度相同,他们要选择一条具有偶数条道路的路径。 因此剩下的非树边两端点构成了一个偶环,那么这条非树边是肯定要删除的。 又因为 绝不中途穿越已经去过的城市,并且绝不在相同的道路上骑行两次(不管方向是否相同) 那么在删去会形成偶环的非树边后,我们可以发现,如果有两个奇环的树边是相重的,显然也是不合法的。 因此,每条树边最多只会被遍历到一次。 那么,我们可以倒过来弄。即选择若干条非树边,使得每条树边最多只会遍历到一次,且使得这些边权尽可能大。 再看一次题目 此外,每个城市最多是101010条道路的端点 对此,考虑状压: \(dp[x][sta]\) 表示当前节点为x,其儿子被选择的状态为sta(1表示被选)的最大边权和。 那么对于一条非树边,有两种决策: 也就是说,当回溯到一个点时,我们取出以它为lca的所有非树边,然后蜗牛爬式的预处理val(反正n才1000) 然后转移一下就好了。 这个就比较easy了。 对于一个状态sta,我们只需查找被选的儿子,然后把这些儿子的dp值累和弄过来就可以了。 代码: #include < bits / stdc ++. h > #define MAXN 10010 using namespace std ; int n , m , tot , head

LCA(最近公共祖先)暴力转倍增算法

匿名 (未验证) 提交于 2019-12-02 23:48:02
今天,南外夏令营第一天打卡 , 咳咳, 概念 :为了便于了解,如图(在一颗有根树中,有若干个子树):   其中1号节点为该树的根,我们所谓的祖先即一个子树的根及其的根的根和其的根的根的根……(在LCA中包括子树本身) (其实不用那么绕口) ,举个例子(在本文之后直接用编号来称呼节点): 5的祖先:5、2、1;7的祖先:7、3、1;2的祖先:2、1……   而所谓的最近公共祖先为两个节点 首先 能找到的公共祖先(即 深度最最大的公共祖先 )   来个 模版题 () 下面就是激动人心的代码时刻让我们进行代码实现的步骤:    1、 先从最简单的 暴搜 入手:通过链表(从根一直往下搜,标记父节点) nlogn ) struct st{ int to,next; }edge[]; int hd[]; void add(int from,int to) { cnt++; edge[cnt].next=hd[from]; edge[cnt].to=to; hd[from]=cnt; } void DFS(int now,int d)找祖先 { deep[now]=d; for (int i=hd[now];i;i=edge[i].next) { fa[edge[i].to]=now; DFS(edge[i].to,d+1); } } void LCA() { if (deep[x]<deep

asp.net 树形表格

匿名 (未验证) 提交于 2019-12-02 23:32:01
<html> <head> <link href="./bootstrap.min.css" rel="stylesheet"> <script src="./jquery.js"></script> <script type="text/javascript"> var data = [ { id: 1, dept: '腾讯公司', remark: '这是总部', updeptid: 0 }, { id: 2, dept: '中国分公司', remark: '分公司', updeptid: 1 }, { id: 3, dept: '深圳分公司', remark: '这是总部', updeptid: 2 }, { id: 4, dept: '开发一部', remark: '这是总部', updeptid: 3 }, { id: 5, dept: '开发二部', remark: '这是总部', updeptid: 3 }, { id: 6, dept: '财务部', remark: '这是总部', updeptid: 3 }, { id: 7, dept: '上海分公司', remark: '这是分公司', updeptid: 2 }, { id: 8, dept: '研发部', remark: '这是总部', updeptid: 7 } ]; $(function () { $

[ZJOI2019]语言

匿名 (未验证) 提交于 2019-12-02 23:32:01
题目 这是一份甚至不能稳定通过的代码 我们要求的是树上有多少条路径被给定路径完全覆盖,我们显然可以把这个问题转化为对于每一个点求出经过这个点的所有给定路径并的大小,这样我们没有区分 \(u<v\) ,所以最后我们还需要 \(/2\) 考虑一下如何求树链并的大小,一个非常经典的做法是虚树 我们只需要把所有树链的两个端点都拿出来,构建一棵虚树,虚树上的节点个数就是树链并的大小 当然我们并不能对于每一个点暴力找一下经过这个点的路径之后算一下虚树的大小,我们考虑刚才那个做法的本质是什么 有经验的话就能看出来上面那个做法本质上是求虚树上所有 \(dfs\) 序相邻的点的距离 于是我们可以使用 \(dsu\ on\ tree\) 套上一个 \(set\) 来动态维护虚树的大小 但是由于一些我还没调出来的 \(bug\) 这份代码以及随机选根,这份代码能获得90到100的好成绩 代码 #include<set> #include<ctime> #include<vector> #include<cstdio> #include<cstring> #include<iostream> #include<algorithm> #define re register #define LL long long #define mp std::make_pair #define max(a,b) ((a)

多目标跟踪:SORT和Deep SORT

匿名 (未验证) 提交于 2019-12-02 23:26:52
https://zhuanlan.zhihu.com/p/59148865 多目标跟踪,即Multiple Object Tracking(MOT),主要任务中是给定一个图像序列,找到图像序列中运动的物体,并将不同帧的运动物体进行识别,也就是给定一个确定准确的id,当然这些物体可以是任意的,如行人、车辆、各种动物等等,而最多的研究是行人跟踪,由于人是一个非刚体的目标,且实际应用中行人检测跟踪更具有商业价值。 SORT篇(IPIL 2016) SORT全称为Simple Online And Realtime Tracking, 对于现在的多目标跟踪,更多依赖的是其检测性能的好坏,也就是说通过改变检测器可以提高18.9%,本篇SORT算法尽管只是把普通的算法如卡尔曼滤波(Kalman Filter)和匈牙利算法(Hungarian algorithm)结合到一起,却可以匹配2016年的SOTA算法,且速度可以达到260Hz,比前者快了20倍。 论文地址: 论文代码: 算法总览 多目标跟踪被视为数据关联问题,在视频帧序列中进行跨检测结果的关联,为了解决数据相关的问题,跟踪器使用了多种方法对运动过程和运动目标的外观特征进行建模!但作者发现这些算法并不能在精度和速度之间达到一个tade-off,如下图: 作者为了遵循Occam's Razor

【Deep Learning】YOLOv3 An Incremental Improvement 原理

匿名 (未验证) 提交于 2019-12-02 23:03:14
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_34784753/article/details/85301169 【Deep Learning】YOLOv3: An Incremental Improvement 原理 yolo_v3 发布了,由于今年找工作,最近才又好好的看了一遍,这里记录一下这篇论文的大概原理。 1. 综述 as accurate as SSD but three times faster. 因此总的来说,这是现阶段一种非常好的目标检测方案,尤其是在应用到实际项目中的时候,往往对网络的实时性具有比较高的要求,因此大多数时候会考虑这种实时性效果比较好的方案。 2. 改进方案 2.1 Bounding Box Prediction 在 bounding box 的坐标预测 方式上 yolo_v3 还是延续了 yolo_v2 的方法,也就是依然使用下面这个公式进行计算: b x = σ ( t x ) + c x b y = σ ( t y ) + c y b w = p w e t w b h = p h e t h b_x=\sigma(t_x)+c_x\\ b_y=\sigma(t_y)+c_y\\ b_w=p_we^{t_w}\ \ \ \ \ \ \ \\ b_h=p_he^{t_h}\ \ \ \