语义分析

pointnet-补充材料阅读

泪湿孤枕 提交于 2019-12-20 00:21:35
文章正文部分参考博客: https://blog.csdn.net/batflo_wsh/article/details/89330195 论文地址: https://arxiv.org/pdf/1612.00593.pdf Supplementary A.Overview 该文件为主要论文提供了额外的定量结果,技术细节和更多定性的测试示例。 在Sec B中,我们扩展了健壮性测试,以比较不完整输入上的PointNet和VoxNet。 在Sec C中,我们提供了有关神经网络架构,训练参数的更多详细信息,在Sec D中,我们描述了场景中的检测流程。 然后,Sec E显示了PointNet的更多应用,而Sec F显示了更多的分析实验。Sec G为我们在PointNet上的理论提供了证明。 最后,我们在Sec H中显示了更多的可视化结果。 B. Comparison between PointNet and VoxNet (Sec 5.2) 我们扩展了第5.2节“鲁棒性测试”中的实验,以比较PointNet和VoxNet [17](代表体积的代表性体系结构)输入点云中丢失的数据的鲁棒性。两个网络都在相同的训练测试段上进行训练,输入的点数为1024。对于VoxNet,我们将点云体素化为32×32×32的占用栅格,并通过围绕上轴的随机旋转和抖动来增强训练数据。 在测试时

PointNet 中文翻译

旧时模样 提交于 2019-12-19 02:34:45
Deep Learning on Point Sets for 3D Classification and Segmentation https://github.com/charlesq34/pointnet PointNet 摘要(Abstract) 点云是一种非常重要的几何数据结构类型。因为它的格式不规则,许多的研究人员通常会将点云数据转换为规则的3D体素网格或者图像集合。然而,这会造成大量的不必要的数据,并且很容易带来问题。在本文中,我们设计了一个直接以点云为输入的神经网络模型,这一模型很好的遵循了输入点的排列不变性。我们的网络模型叫做PointNet,它提供了一种从目标分类、零件分割到场景语义分析的通用模型结构。虽然它很简单,但PointNet非常高效而且有效。从经验上讲,它的效果甚至超过了目前最先进的水平。我们从理论上分析了PointNet学到了什么和为什么PointNet在输入有所干扰和损坏时有很强的鲁棒性。 1.引言(Introduction) 在本文中,我们探讨了能够处理点云或者网格等3D几何数据的深度学习结构。通常,为了实现权重共享和内核优化,卷积结构对输入数据的格式有非常高的要求。由于点云或网格的格式不规则,大多数研究人员通常在将这些数据输入到深度网络之前,会将其转换为规则的3D体素网格或图像集合(如视图)。然而,这种数据表示转换会导致大量不必要的数据

快速理解web语义化

*爱你&永不变心* 提交于 2019-12-17 10:57:07
什么是Web语义化 Web语义化是指使用恰当语义的html标签、class类名等内容,让页面具有良好的结构与含义,从而让人和机器都能快速理解网页内容。语义化的web页面一方面可以让机器在更少的人类干预情况下收集并研究网页的信息,从而可以读懂网页的内容,然后将收集汇总的信息进行分析,结果为人类所用;另一方面它可以让开发人员读懂结构和用户以及屏幕阅读器(如果访客有视障)能够读懂内容。 简单来说就是利于 SEO,便于阅读维护理解。 总结起来就是: 正确的标签做正确的事情 页面内容结构化 无CSS样子时也容易阅读,便于阅读维护和理解 便于浏览器、搜索引擎解析。 利于爬虫标记、利于SEO html 语义化标签 HTML为网页文档内容提供上下文结构和含义。对于HTML体系而言,Web语义化是指使用语义恰当的标签,使页面有良好的结构,让页面元素有含义,便于被浏览器、搜索引擎解析、利于SEO。通常我们所说的HTML应该是完全脱离表现信息的,其中的标签应该都是语义化地定义了文档的结构。 代码示例: <html> <body> <article> <header> <h1>h1 - WEB 语义化</h1> </header> <nav> <ul> <li>nav1 - HTML语义化</li> <li>nav2 - CSS语义化</li> </ul> </nav> <section>

《自然语言理解(Natural Language Understanding)》(2016-03-17)阅读笔记

妖精的绣舞 提交于 2019-12-16 11:41:43
原文链接: https://yq.aliyun.com/articles/8301 作者:李永彬 发布时间:2016-03-17 16:37:47 自然语言理解(Natural Language Understanding,NLU)以语言学为基础,融合逻辑学、心理学和计算机科学等学科,试图解决以下问题:语言究竟是怎样组织起来传输信息的?人又是怎样从一连串的语言符号中获取信息的?换种表达就是,通过语法、语义、语用的分析,获取自然语言的语义表示。 自然语言理解的结果,就是要获得一个语义表示(semantic representation): 分布语义,Distributional semantics:这种方法的优点在于,它完全是数据驱动的方法,并且能够很好的表示语义,但一个很大的缺点在于,它的表示结果是一个整体,没有进一步的子结构。 框架语义,Frame semantics:这种方法和distributional semantics相比,能够表达丰富的结构。 模型论语义,Model-theoretic semantics: 这种方法的典型框架是把自然语言映射成逻辑表达式(logic form),是对世界知识的完整表示,比前两种方法表达的语义更加完整,但是缺点是semantic parser的构建比较困难,这大大限制了该方法的应用。 我们目前采用的是frame

小白入门知识图谱构建与应用

你。 提交于 2019-12-16 06:51:35
知识图谱的构建技术与应用研究 知识图谱的概念在2012年由Google正式提出,其目的是以此为基础构建下一代智能化的搜索引擎,改善搜索结果质量。知识图谱技术是人工智能技术的重要组成部分,也是当下非常热门的研究方向。文章从知识图谱的概念和技术架构出发,综述知识图谱构建的关键技术,包括知识抽取、知识表示、知识融合、知识推理四大主要内容。同时,对于知识图谱的当下的现实应用作进一步阐述。 目录 1知识图谱概述 2知识图谱构建技术 2.1知识抽取 2.1.1实体抽取 2.1.2关系抽取 2.1.3属性抽取 2.2知识表示 2.2.1代表模型 2.2.2复杂关系模型 2.2.3多源信息融合 2.3知识融合 2.3.1实体链接 2.3.2知识合并 2.4知识推理 3知识图谱的应用 3.1智能搜索 3.2问答系统 3.3社交网络 3.4垂直应用 4总结 参考文献 1知识图谱概述     说起知识图谱,不由得从信息检索开始,从本质上来说,知识图谱是信息检索新时期的产物。信息检索起源于图书馆的参考咨询和文摘索引工作,19 世纪下半叶开始起步,至 20 世纪 40 年代,索引和检索成为图书馆独立的工具和用户服务项目。信息检索是知识管理的核心支撑技术,伴随知识管理的发展和普及,应用到各个领域,成为人们日常工作生活的重要组成部分[1]。伴随着Web技术的不断演进与发展,人类先后经历了以文档互联为主要特征的

PixelNet: Representation of the pixels, by the pixels, and for the pixels----2017论文翻译解读

淺唱寂寞╮ 提交于 2019-12-15 04:38:42
PixelNet: Representation of the pixels, by the pixels, and for the pixels. 图1.我们的框架通过对架构(最后一层)和训练过程(历元)的微小修改,将其应用于三个不同的像素预测问题。 请注意,我们的方法为分割(左),表面法线估计(中)和边缘检测(右)的语义边界恢复精细的细节。 Abstract 我们探索了一般像素级预测问题的设计原理,从低级边缘检测到中级表面法线估计到高级语义分割。诸如全卷积网络(FCN)之类的卷积预测因子通过通过卷积处理利用相邻像素的空间冗余而获得了非凡的成功。尽管计算效率高,但我们指出,由于 空间冗余限制了从相邻像素学习的信息 ,因此这些方法在学习过程中在统计上并不是有效的。 我们证明了像素的分层采样可以使(1)在批量更新过程中增加多样性,从而加快学习速度; (2)探索复杂的非线性预测因子,提高准确性; (3)有效地训练最先进的模型tabula rasa(即“从头开始”)以完成各种像素标记任务。 我们的单一体系结构可为PASCAL-Context数据集上的语义分割,NYUDv2深度数据集上的表面法线估计以及BSDS上的边缘检测提供最新结果。 1.Introduction 许多计算机视觉问题可以表述为密集的逐像素预测问题。 其中包括边缘检测[21、64、94]和光流[5、30、86]等低级任务

【翻译】Knowledge-Aware Natural Language Understanding(摘要及目录)

浪子不回头ぞ 提交于 2019-12-10 15:00:05
翻译Pradeep Dasigi的一篇长文 Knowledge-Aware Natural Language Understanding 基于知识感知的自然语言理解 摘要 Natural Language Understanding (NLU) systems need to encode human gener- ated text (or speech) and reason over it at a deep semantic level. Any NLU system typically involves two main components: The first is an encoder, which composes words (or other basic linguistic units) within the input utterances compute encoded representations, which are then used as features in the second component, a predic- tor, to reason over the encoded inputs and produce the desired output. We argue that the utterances themselves

深度剖析知识增强语义表示模型——ERNIE

╄→гoц情女王★ 提交于 2019-12-10 13:57:14
文章目录 什么是语义表示 静态词向量 动态词向量(上下文词向量) 位置编码 ERNIE的原理介绍 神经网络上的改造 辅助任务 学习过程 ERNIE的应用案例 性能不敏感的场景:直接使用 ERNIE 的模型蒸馏案例:搜索问答Query识别和QP匹配 离线推荐 无监督文本的深度神经网络的出现,nlp领域又火了起来,深度神经网络大大提升了nlp任务的效果。虽然早期的网络也是基于上下文进行的向量建模,但是由于单向信息流的弊端,效果上始终难以大幅度提升。Transformer中的多层self-attention的出现,推进了深度网络的发展。Google提出的BERT模型,通过掩盖的term,利用多层的self-attention的双向建模能力,横扫了NLP比赛的各大排行榜。 前文介绍了bert,想详细了解Bert请参见 一步步理解bert 什么是语义表示 ERNIE是一个语言理解模型,最大的优点就是特别好的理解人类的语言。文字其实是概念背后的符号,更重要的其实是概念的本身。词语是具有语义的,怎么正确表示语义呢?语义的特点是什么?语义上比较近的词语真正的距离也是比较接近的,怎么对这部分进行表达,就是词向量,词向量每个词背后对应的是一个高维的向量,所以他们之间的距离是可以度量的。 静态词向量 如图中所示:将文本信息映射到数字空间,变成数字表示的向量,在这种表示上,保留了词语间的距离信息

HTML5 语义标签

孤人 提交于 2019-12-10 05:49:59
在 HTML5 出来之前,我们用 div 来表示页面章节,但是这些 div 都没有实际意义。(即使我们用 css 样式的 id 和 class 来形容这块内容的意义)。这些标签只是我们提供给浏览器的指令,只是定义一个网页的某些部分。但现在,那些之前没“意义”的标签因为 html5 的出现而消失了,这就是我们平时所说的“语义”。 如上图那个页面结构没有使用一个 div,都是采用 html5 语义标签(用哪些标签,关键取决于你的设计目标)。 但是也不要因为 html5 新标签的出现,而随意用之,错误的使用肯定会事与愿违。所以有些地方还是要用 div 的,就是因为 div 没有任何意义的元素,他只是一个标签,仅仅是用来构建外观和结构。因此是最适合做容器的标签。 W3C 定义了这些语义标签,不可能完全符合我们有时的设计目标,就像制定出来的法律不可能流传 100 年都不改变,更何况它才制定没多久,不可能这些语义标签对所以设计目标的适应。只是一定程度上的“通用”,我们的目标是让爬虫读懂重要的东西就够了。 结论:不能因为有了 HTML5 标签就弃用了 div,每个事物都有它独有的作用。 header 元素 header 元素代表“网页”或“section”的页眉; 通常包含 h1-h6 元素或 hgroup,作为整个页面或者一个内容块的标题,也可以包裹一个目录部分,一个搜索框,一个 nav

IROS2019 部分论文整理2

别等时光非礼了梦想. 提交于 2019-12-09 21:13:41
Volumetric Instance-Aware Semantic Mapping and 3D Object Discovery abstract To autonomously navigate and plan interactions in real-world environments, robots require the ability to robust perceive and map complex, unstructured surrounding scenes. Besides building an internal representation of the observed scene geometry, the key insight toward a truly functional understanding of the environment is the usage of higher level entities during mapping, such as individual object instances. (个人理解:除了使用环境中物体的几何信息作为传感器的量测值用作SLAM之外,还要对周围环境做语义理解才能达到更高层面的感知范围。) This work presents an approach to