神经网络

如何理解 Graph Convolutional Network(GCN)?

点点圈 提交于 2020-12-30 16:59:31
几年前如果熟练使用TensorFlow,同时掌握基本的AI算法就可以很容易找到一份高薪的工作,但现在不一样了,AI岗位的要求越来越高,对知识的深度也提出了更高的要求。 如果现在 一个面试官 让你从零推导SVM的Dual、从零实现CRF、推导LDA、设计一个QP问题、从零编写XLNet、编写GCN/GNN、改造SkipGram模型、用一天时间复现一篇顶级会议.... 这些要求一点都不过分。相反,连这些基本内容都有些吃力,就需要重新审视一下自己的核心技术壁垒了。 为了迎合时代的需求,我们去年推出了 《机器学习高端训练营》 班。这个训练营的目的很简单: 想培养更多高端的人才,帮助那些即将或者目前从事科研的朋友,同时帮助已从事AI行业的提高技术深度。 在本期训练营(第四期)中我们对内容做了大幅度的更新,一方面新增了对前沿主题的讲解如 图神经网络(GCN,GAT等) ,另外一方面对核心部分(如凸优化、强化学习)加大了对 理论层面上的深度 。 除此之外,也会包含 科 研方法论、元学习、解释性、Fair learning 等系列主题。 目前在全网上应该找不到类似体系化的课程。 课程仍然采用 全程直播 授课模式。 那什么样的人适合来参加高阶班呢? 从事AI行业多年,但技术上总感觉不够深入,感觉在技术上遇到了瓶颈; 停留在使用模型/工具上,很难基于业务场景来提出新的模型; 对于机器学习背后的优化理论

【君思智慧园区】智慧园区规划思路分析

蓝咒 提交于 2020-12-29 18:00:18
如今,5G、人工智能、云计算等关键技术均已进入高速发展时期,建设智慧园区的技术条件基本成熟,业界也迈入了智能化建设的阶段,园区管理与运作模式也得到彻底的变革。这是产业园区和社会发展的必然趋势,也将是一个持续发展的过程。 随着智慧园区规划和建设的不断深入,全国园区纷纷掀起了智慧园区规划与建设的热潮,那么智慧园区的规划该怎么做? 强化规划引领,避免陷入“伪智慧化”的困境 当前园区智慧化建设呈现一轮发展的新浪潮,让园区更加“智慧”,已经成为产业园转型的一种趋势。然而,在欲求智慧化升级和智能化探索过程中,往往缺乏系统性规划,各智能化系统相对独立,各自完成各自的业务功能,形成各智能化系统仍是信息孤岛。在规划建设阶段,要强化规划引领作用,统筹推进园区智能化建设,基于园区智能化管理需求,以设备基础管理为核心进行整体规划,在智慧园区运营管理平台的统一管理和服务下,促进系统与各智能化系统形成一个业务融合、功能优化和整体功能获得提升的有机整体。 创新技术驱动,推动园区管理运营智能化升级 园区智能化建设的重要目标是运用数字化技术,推动园区管理与运作模式的彻底变革,实现园区基础设施智能化、运营管理高效化。在园区基础设施建设方面,建议结合园区的实际需求,加强物联感知设施建设,包括视频监控、能耗监测、环境监测、消防监测等各类物联感知设备,构建园区感知神经网络,采集园区各类状态数据和业务数据,实现园区资源可视

论文阅读 | Real-Time Adversarial Attacks

情到浓时终转凉″ 提交于 2020-12-29 17:16:28
摘要 以前的对抗攻击关注于静态输入,这些方法对流输入的目标模型并不适用。攻击者只能通过观察过去样本点在剩余样本点中添加扰动。 这篇文章提出了针对于具有流输入的机器学习模型的 实时对抗攻击 。 1 介绍 在实时处理场景中,攻击者只能观察数据样本的过去部分,并且只能向数据样本的未来部分添加扰动,而目标模型的决策将基于整个数据样本。 当攻击实时系统时,攻击者面临着 观察空间和操作空间之间的权衡 。也就是说,假设目标系统接受顺序输入x,攻击者可以选择在开始时设计对抗性扰动。然而,在这种情况下,攻击者对x没有任何观察,但是可以将扰动添加到x的任意时间点上,即,攻击者有最小的观察空间和最大的动作空间。相反,如果攻击者选择在末尾添加对抗性扰动,则攻击者可以完全观察到x,但不能向数据添加扰动(即,攻击者的观察量最大,但动作空间最小)。 提出了一种新的攻击方案,使用 深度强化学习体系结构 (如图1所示),连续使用观测数据来近似未来时间点的最优对抗性扰动。 2 实时对抗攻击 rt 是在t时刻添加的扰动,需要d的时间生成数据 添加扰动等。g根据t时刻之前的样本(减去延迟d),预测t时刻的最优扰动。 m()测量对抗性扰动的可感知性。 问题被描述为:(O, S, A, T, R) 对抗生成器只会在最后得到奖励。RL的目标是学习一个最优策略πg: at =g(ot),使奖励期望最大化。在这个问题中

文档级(Document-level)关系抽取(RE)目前的一些最新进展(海量论文,干货满满)

为君一笑 提交于 2020-12-29 09:31:35
文章目录 0. 引言 1. SCIREX: A Challenge Dataset for Document-Level Information Extraction(ACL2020) 1.1 摘要 1.2 动机 1.3 贡献 1.4 数据集 1.4.1 问题定式 1.4.2 数据集描述 1.5 模型 1.6 实验 2. Reasoning with Latent Structure Refinement for Document-Level Relation Extraction(ACL 2020) 2.1 摘要 2.2 动机 2.3 贡献 2.4 方法论 2.4.1 Node Constructor 2.4.2 Dynamic Reasoner 2.4.3 Classifier 2.5 实验结果 3. Inter-sentence Relation Extraction with Document-level Graph Convolutional Neural Network(ACL2019) 3.1 摘要 3.2 动机 3.3 贡献 3.4 模型 3.4.1 Input Layer 3.4.2 Graph Construction 3.4.3 GCNN Layer 3.4.4 MIL-based Relation Classification 3.5 实验结果 4.

人工智能发展与模型定制化趋势

戏子无情 提交于 2020-12-29 07:46:03
  人工智能和机器学习概念目前在各种场合被频频提到,移动互联网时代后的未来被预测为人工智能时代,那么人工智能的前世今生是怎样的,到底会给我们的未来带来什么呢?为了弄清这个问题,我们可以简单回顾一下人工智能的发展历史。   其实,人工智能可以追溯到很久以前的年代。在图灵的时代,科学家就试图通过模拟人的意识和思维来处理人类才能完成的复杂任务,并提出图灵测试检测机器是否具有真正的“智慧”。随着计算机被发明,信息存储和处理问题被解决,人工智能有了落地的可能。1956年在达特茅斯会议上,人工智能的概念被明斯基明确提出,使用的正是由神经学家提出的神经网络数据模型, 并在此次完善了匹配的编程语言,将实现推向更具有现实意义的发展方向。   神经网络本质是神经元之间的作用与反馈,是人类思维的基础,模拟大脑是长时间以来人工智能的主要思路。两年后,计算机科学家罗森布拉特提出感知机的概念,即两层神经元组成的最简单的神经网络,并用来进行数据二分类。科学界迎来了人工智能的第一缕曙光,更多人开始关注并投身于此。然而人工智能并没有变得大热,明斯基在1969年在其著作中证明感知器只能处理线性分类问题,连简单的异或问题都无法正确分类。这个问题因而成为那一代人工智能领域学者绕不开的噩梦。人工智能学科随后一度作为最冷门的学科陷入了长达20年的停滞。   直到1986年,杰弗里·辛顿提出反向传播算法

Keras(四)CNN 卷积神经网络 RNN 循环神经网络 原理及实例

江枫思渺然 提交于 2020-12-29 00:43:37
原文链接: http://www.one2know.cn/keras5/ CNN 卷积神经网络 卷积 池化 https://www.cnblogs.com/peng8098/p/nlp_16.html 中有介绍 以数据集MNIST构建一个卷积神经网路 from keras.layers import Dense,Activation,Conv2D,MaxPooling2D,Flatten from keras.models import Model,Sequential from keras.datasets import mnist from keras.utils import np_utils # 构建数据集 (x_train,y_train),(x_test,y_test) = mnist.load_data() x_train = x_train.reshape(x_train.shape[0],1,28,28)/255 x_test = x_test.reshape(x_test.shape[0],1,28,28)/255 y_train = np_utils.to_categorical(y_train,num_classes=10) y_test = np_utils.to_categorical(y_test,num_classes=10) print(x

如何理解卷积神经网络中的1*1卷积?

ぐ巨炮叔叔 提交于 2020-12-28 10:07:19
我们都知道,卷积核的作用在于特征的抽取,越是大的卷积核尺寸就意味着更大的感受野,当然随之而来的是更多的参数。 早在1998年,LeCun大神发布的LetNet-5模型中就会出,图像空域内具有局部相关性,卷积的过程是对局部相关性的一种抽取。 但是在学习卷积神经网络的过程中,我们常常会看到一股清流般的存在—1*1的卷积! 比如在残差网络的直连里: 残差网络的Bootleneck残差模块里: 在GoogleNet的Inception模块里: 都有1*1卷积核的出现,那么它到底是做什么的?我们应该如何理解1*1卷积的原理? 当1*1卷积出现时,在大多数情况下它作用是升/降特征的维度,这里的维度指的是通道数(厚度),而不改变图片的宽和高。 举个例子,比如某次卷积之后的结果是W*H*6的特征,现在需要用1*1的卷积核将其降维成W*H*5,即6个通道变成5个通道: 如下图就是一个W*H*6的特征,而1*1的卷积核在图上标出,卷积核自身的厚度也是6(图画的好难看!!) 通过一次卷积操作,W*H*6将变为W*H*1,这样的话,使用5个1*1的卷积核,显然可以卷积出5个W*H*1,再做通道的串接操作,就实现了W*H*5。 在这里先计算一下参数数量,一遍后面说明,5个卷积核,每个卷积核的尺寸是1*1*6,也就是一种有30个参数。 我们还可以用另一种角度去理解1*1卷积,可以把它看成是一种全连接 ,如下图

清华大学王晓智:大规模通用域事件检测数据集MAVEN

久未见 提交于 2020-12-28 09:41:13
点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 事件检测任务是事件抽取的第一步,对事件语义建模有重要意义。然而现有事件检测数据集存在两个严重的问题: (1)数据稀缺,现有小规模数据集不足以充分训练和稳定评测复杂的神经网络模型; (2)覆盖率低,现有数据集关心的有限数据类型不足以覆盖通用域中的广泛事件语义,也限制了事件检测模型的应用范围。 为了缓解这些问题带来的影响,本文构建了一个大规模通用域事件检测数据集MAVEN,它包含4480篇文章和118732个事件实例,覆盖了168种事件类型。同时也在MAVEN数据集上复现了一系列当前最佳的模型并进行了全面的实验。实验结果显示在传统数据集上表现极好的模型并不能在MAVEN上也取得理想的表现,这表明事件检测仍是一个具有挑战性的方向。本文也通过一些实证分析讨论了事件检测任务后续的发展方向。 本期AI TIME PhD直播间,我们有幸邀请到了清华大学计算机系的博士一年级研究生王晓智,为大家分享这项研究工作! 王晓智: 清华大学计算机系博士一年级研究生,导师李涓子教授。主要研究方向为事件抽取和预训练语言模型。已在EMNLP、NAACL、COLING等会议发表多篇文章。 一、 背景 一、 事件检测的定义 事件检测任务旨在从文本中识别事件触发词并正确分类事件类型。触发词指的是最能清晰明显表达事件出现的核心词语或短语

深入理解1*1卷积作用

时光毁灭记忆、已成空白 提交于 2020-12-28 09:32:51
1 . 前言 1*1 卷积在很多模型结构中都使用过, 例如最出名的 Inception 网络 其主要目的就是 进行一次 1 × 1 的卷积来减少特征映射的深度. 在实际操作中, 对于1*1的卷积操作, 我们可以通过改变输出的out channel 来使得输出维度的变化,也就是 降维和升维 , 例如 112 * 112 * 3 经过一个一维卷积 当我们的out channel 设置为32时候, 输出为 112 * 112 * 32 。 2. 二维卷积过程概述 因为1*1的卷积也是一个二维卷积, 所以我们可以先了解一下 二维卷积 是如何操作的 还是以112 * 112 * 3 的图片为例: 在图中, 高度 宽度 都是 112, 深度为3 , 我们经过一个3 * 3 的卷积,步长为1, padding 为1, out channel 为 3 , 输出的图像还是 112 * 112 * 3, 具体计算的话可以自己画个5 5的图 过 3 3 的卷积来操作, 一般公式为 : 新维度 = (图片长 - 卷积核长 + 2 * padding )/ 步长 我们的卷积核的维度为 3 * 3 * 3(深度) , 最后一维和图片本身的深度相同 一次卷积的过程如下: 每一层的 112*112 和 对应的 卷积核的 3 * 3 进行卷积 每一个 channel卷积的结果进行 求和 最后加上偏置 , 就得到

这一年,科学高度不断刷新

扶醉桌前 提交于 2020-12-27 10:04:49
来源:科技日报 ●存算一体架构在手写数字集上的识别准确率达到96.19% ●截至12月14日21时,“天问一号”探测器已在轨飞行144天,飞行里程约3.6亿公里,距离地球超过1亿公里 ●嫦娥五号经历了11个阶段、23天的在轨工作,采集了约1731克月球样品返回地球 ●“奋斗者”号创造了10909米的中国载人深潜新纪录 ●计算“高斯玻色取样”问题,处理100亿个样本,“九章”只需10小时,超级计算机则需要1200亿年 ●中国和尼泊尔联合公布珠峰“新身高”——8848.86米 即将过去的2020年,是极不平凡的一年。在这一年里,突如其来的新冠肺炎疫情打乱了人们生活与工作的节奏,而科学界奋斗的脚步却不曾停歇,并在奋力拼搏的过程中越战越勇。 “天问一号”开启人类探测火星的新旅程,嫦娥五号带回来自月球的馈赠,“奋斗者”号创造中国载人深潜新纪录……这一年,科学家们在上下求索的过程中点亮更广阔的世界,在追逐真理的道路上打开更崭新的天地。沧海横流显砥柱,随着科学的高度不断被刷新,一个更精彩的未来正展现在我们眼前。 “天琴一号”通过技术在轨验证 每项技术指标均优于任务目标 “天琴一号”卫星是我国“天琴”引力波探测计划的首颗技术验证卫星,其核心任务是验证空间惯性基准技术,这是空间引力波探测技术体系中的核心技术之一,包括高精度惯性传感、微牛级连续可调微推进和无拖曳控制三大关键技术