Semantic

Word Embedding 稳定性研究

回眸只為那壹抹淺笑 提交于 2020-10-28 17:30:23
https://zhuanlan.zhihu.com/p/113339927 我们在production的系统里面会遇到一个问题,模型如何处理新进来的数据。重新训练的话下游的prediction可能会非常不一样,但是我们不知道到底怎么不一样。之前在MLSys 2020 看到了这个关于稳定心的文章,所以跟大家分享一下。这个paper尝试总结retraining对embedding的影响到底有多大,原文在这里 https://proceedings.mlsys.org/static/paper_files/mlsys/2020/104-Paper.pdf ​ proceedings.mlsys.org 既然我们要讨论稳定性,我们得先给一个稳定性的定义 这个定义的逻辑本身是根据下游的task来定义上游够不够稳定,如果完全稳定的话下游的模型就不用retrain了。这里文章讲用zero one可能是因为讨论的是NLP的问题,假设是ctr的话这种zero one loss就不合理。 对于word embedding的算法,文中用了三种 Matrix Completion GloVE word2vec quantization用的是uniform quantization,原文在这里 https://arxiv.org/pdf/1909.01264.pdf ​ arxiv.org

内容推荐算法:异构行为序列建模探索

徘徊边缘 提交于 2020-10-24 06:27:19
很多秃头小可爱沉迷熬夜逛淘宝,以下是 来自宇宙洪荒之力的最新线报: 男生比女生多 天蝎座多 夜间小裙子搜索量位居第一 ...... 尤其,每晚有1700万人在淘宝只逛不买,他们到底在干什么? 看完视频和下方文章,你就知道为什么上头了。 前言 来洋淘, 更有young! 洋淘轻应用的内容均是手淘用户的真实购后分享, 在这里,你可以个性化地浏览他人的美好生活, 并鼓励自我表达与分享。 图1. 洋淘轻应用截图, 左) 为双列流, 右) 为详情页 在推荐任务上,同导购产品相比,洋淘场景有着自身的特性: 新用户冷启严峻,六成以上的用户无洋淘场景内的历史内容点击; 老 用户内容兴趣也稀少,历史内容点击数不超过10,反观商品点击数却高达数倍; 用户在电商与内容两个 domain 的兴趣差异较大。 统计日志发现,电商兴趣对洋淘场景下内容点击样本的覆盖度仅为 30% 。 于是,如何把跨域的异构行为用好,提升用户的浏览深度就显得弥足珍贵。我们从 召回 , ctr预估 两大关键环节均作了探索与创新, 大幅提升了推荐效果, 取得了显著的业务收益。 向量召回模型In_Match 前文提到内容兴趣不够用,我们首先基于i2i尝试了商品与内容的混合协同,取得了一定的收益。然后基于电商兴趣的标题作相关内容的严格相似召回,却收益为负,这说明跨域的兴趣不可生搬硬套,也与前文的兴趣差异统计相吻合。

01-HTML5讲义

旧巷老猫 提交于 2020-10-23 22:00:55
了解HTML5 HTML5属于上一代HTML的新迭代语言,设计HTML5最主要的目的是为了在移动设备上支持多媒体!!! 例如: video 标签和 audio 及 canvas 标记 ◆ 新特性: 1. 取消了过时的显示效果标记 <font></font> 和 <center></center> ... 2. 新表单元素引入 3. 新语义标签的引入 4. canvas标签(图形设计) 5. 本地数据库(本地存储) 6. 一些API ◆ 好处: 1. 跨平台 例如:比如你开发了一款HTML5的游戏,你可以很轻易地移植到UC的开放平台、Opera的游戏中心、Facebook应用平台,甚至可以通过封装的技术发放到App Store或Google Play上,所以它的跨平台性非常强大,这也是大多数人对HTML5有兴趣的主要原因。 ◆ 缺点: 1. pc端浏览器支持不是特别友好,造成用户体验不佳 新语义标签 http://www.w3school.com.cn/html/html5_semantic_elements.asp <header></header> <footer></footer> <article></article> <aside></aside> <nav></nav> <section></section> .... 语义标签兼容性处理 解决方案一:通过创建元素的方式

SNE-RoadSeg:一种基于表面法向量提取的道路可行驶区域分割方法

一个人想着一个人 提交于 2020-10-23 08:14:56
   本文解读的是论文《SNE-RoadSeg: Incorporating Surface Normal Information into Semantic Segmentation for Accurate Freespace Detection》,论文作者来自 加州大学圣地亚哥分校和 香港科技大学机器人学院 。 该论文解读首发于“AI算法修炼营”。   作者 | SFXiang   编辑 | 青暮       这篇文章收录于ECCV2020,是一篇关于无碰撞空间区域分割的文章,整体效果很不错。最主要的核心思想是在表面发现估计器的设计,在得到表面法线后将其用于分割网络的编码器环节,并在特征融合部分,借鉴了DenseNet的思想,进行密集连接。网络的计算量和参数量文中并没有比较,应该做不到实时。   论文地址:https://arxiv.org/abs/2008.11351   代码地址:https://github.com/hlwang1124/SNE-RoadSeg   Freespace无碰撞空间检测是自动驾驶汽车视觉感知的重要组成部分。近年来,数据融合data-fusion卷积神经网络CNN架构大大改善了语义场景分割算法的性能。通常,可以将自由空间假设为一个地面平面,在这个平面上,各点具有相似的表面法线。   因此,在本文中,首先介绍了一个名为表面法线估计器(

AI大有可为:NAIE平台助力垃圾分类

扶醉桌前 提交于 2020-10-15 01:49:38
摘要: 生活垃圾的分类和处理是目前整个社会都在关注的热点,如何对生活垃圾进行简洁高效的分类与检测对垃圾的运输处理至关重要。AI技术在垃圾分类中的应用成为了关注焦点。 如今AI已经是这个时代智能的代名词了,任何领域都有AI的身影,垃圾分类及监管等场景自然也少不了“AI+”的赋能。 不过,垃圾往往属于商品的极端变形体,情况比较特殊。目前的技术在视觉可见的基础上,是可以做到垃圾分类报警提醒的,比如判断垃圾是否是经过分类整理的。至于是否能够直接进行视觉检测并分类,且达到某种效果,需要更多的数据和实验支撑才能判断这件事情的可行性。针对这些问题,我们或许可以从海华垃圾分类挑战赛中去听听参赛者都是如何用技术来改变世界的。 海华垃圾分类挑战赛数据包括单类垃圾数据集以及多类垃圾数据集。单类垃圾数据集包含80,000张单类生活垃圾图片,每张单类垃圾图片中仅有一个垃圾实例。 多类垃圾数据集包括4998张图像,其中2,998张多类垃圾图片作为训练集数据,A榜和B榜各包含1000张测试图像,每张多类垃圾图片中包含至多20类垃圾实例。我们将对两种数据集分别进行介绍。 一、多类别垃圾 图1 多类垃圾数据类别分布 如图1所示,多类别垃圾涵盖了204类垃圾,但这204类的数据非常不均衡,有一些类别数目非常少甚至没有出现。 图2 多类垃圾数据可视化 图2中两张图是训练集中的两张图像

自动驾驶 | MINet:嵌入式平台上的实时Lidar点云数据分割算法,速度可达 20-80 FPS!...

廉价感情. 提交于 2020-10-14 19:51:45
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 这篇文章是激光雷达点云数据分割算法的嵌入式平台上的部署实现。主要的创新点有两点:一是利用多路分支采用不同分辨率输入后再用不同的卷积块进行处理,达到性能和计算量之间的平衡;二是对基于投影的点云分割方法进行了改进。在嵌入式平台上性能不错,代码将在文章被收录后开源,值得关注。 论文地址 :http://xxx.itp.ac.cn/pdf/2008.09162v1 LiDAR数据的实时语义分割对于自动驾驶车辆至关重要,然而自动驾驶车辆通常配备嵌入式平台并且计算资源有限,这使得点云分割算法的部署具有挑战性。通常的点云分割算法直接在点云上使用复杂的空间聚合操作,这些操作非常昂贵且难以针对嵌入式平台进行优化。因此,它们不适用于带有嵌入式系统的实时场景下应用。作为替代, 基于投影的方法更有效并且可以在嵌入式平台上运行。但是,当前基于投影的最新方法无法实现与基于点的方法相同的精度,并且需要使用数百万个参数。 因此,在本文中, 提出了一种基于投影的方法,称为Multi-scale Interaction Network(MINet) ,该方法有效且准确,具体而言网络使用具有不同尺度的多个通路,并且在不同尺度之间对计算资源进行平衡,同时不同尺度之间的额外密集交互可避免冗余计算,并使网络高效。所提出的网络在准确性

DSSM深度语义匹配原理与Tensorflow实现

会有一股神秘感。 提交于 2020-10-14 18:57:31
在工业界DSSM(Deep Structured Semantic Models)已经演化成一种语义匹配框架,不仅用于文本的匹配,也用于推荐系统的User-Item的匹配,本文描述与实现DSSM在文本匹配上的应用,主要内容如下: DSSM原理 数据预处理 模型实现 模型训练 模型预测 DSSM原理 DSSM的主要结构如下: 主要分为表示层和匹配层,表示层可使用全连接、RNN、Transformer等等网络得到query和doc的向量,匹配层一般使用cosine相似度来计算query和1个正样本doc和N个负样本doc的相似度。这里就不讲解原始论文里DSSM的原理了,只讲其在文本上是如何使用的,有兴趣的朋友可以参考原论文《Learning Deep Structured Semantic Models for Web Search using Clickthrough Data》。 表示层 原始论文中主要针对英文,为了降维做了word hashing,而中文常用汉字只有1万左右。我们将query和doc的字直接传入embedding,然后接一层双向的GRU,假设每个字的embedding表示为 ,则GRU表示为: 然而,并不是每个字都是我们所需要的,所以在GRU后面再接一层Attention,其表示为: 即通过一个线性层对GRU的输出进行变换

综述|视觉与惯导,视觉与深度学习SLAM

℡╲_俬逩灬. 提交于 2020-10-12 01:46:06
点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 SLAM包含了两个主要的任务:定位与构图,在移动机器人或者自动驾驶中,这是一个十分重要的问题:机器人要精确的移动,就必须要有一个环境的地图,那么要构建环境的地图就需要知道机器人的位置。 本系列文章主要分成四个部分: 在第一部分中,将介绍Lidar SLAM,包括Lidar传感器,开源Lidar SLAM系统,Lidar中的深度学习以及挑战和未来。 第二部分重点介绍了Visual SLAM,包括相机传感器,不同稠密SLAM的开源视觉SLAM系统。 第三部分介绍视觉惯性里程法SLAM,视觉SLAM中的深度学习以及未来。 第四部分中,将介绍激光雷达与视觉的融合。 视觉SLAM的稳定性是一项技术挑战。因为基于单目的视觉SLAM需要初始化、尺度的不确定性和尺度漂移等问题[1]。尽管立体相机和RGB-D相机可以解决初始化和缩放的问题,但也存在一些不容忽视的问题,如运动速度快、视角小、计算量大、遮挡、特征丢失、动态场景和光照变换等。针对以上这些问题传感器的融合方案逐渐流行起来,IMU与相机融合的视觉里程计成为研究热点。 视觉与惯导 论文[2][3][4]是比较早期对VIO进行的一些研究。[5][6]给出了视觉惯导里程计的数学证明。而论文[7]则使用捆集约束算法对VIO进行稳健初始化。特别是tango[8]、Dyson 360

持续更新 EMNLP2020 Summarization

99封情书 提交于 2020-10-10 12:53:15
Long Multi-Fact Correction in Abstractive Text Summarization . Yue Dong, Shuohang Wang, Zhe Gan, Yu Cheng, Jackie Chi Kit Cheung and Jingjing Liu. Unsupervised Reference-Free Summary Quality Evaluation via Contrastive Learning. Hanlu Wu, Tengfei Ma, Lingfei Wu, Tariro Manyumwa and Shouling Ji. Multi-document Summarization with Maximal Marginal Relevance-guided Reinforcement Learning. Yuning Mao, Yanru Qu, Yiqing Xie, Xiang Ren and Jiawei Han. MLSUM: The Multilingual Summarization Corpus. Thomas Scialom, Paul-Alexis Dray, Sylvain Lamprier, Benjamin Piwowarski and Jacopo Staiano. Stepwise

Learning Semantic Concepts and Order for Image and Sentence Matching笔记

半世苍凉 提交于 2020-10-07 09:54:14
SCO模型阅读笔记 论文:Learning Semantic Concepts and Order for Image and Sentence Matching 发表会议:CVPR2018 作者: 一、为什么看? 好多关于图像-文本检索的文章,但是大多数都忽略了 图像的语义顺序 ,当语义顺序被忽略时,会造成检索不准确,图像和文本的语义完全相反。 看点 : 图像的语义顺序如何构建 应用 : 于跨模态图像-文本检索 二、论文思路 图像语义之间存在差距,特别是像素级图像缺乏语义信息。本文提出语义增强图像和句子匹配模型,来通过学习语义概念和用一个正确的顺序语义顺序提高图像表示。 给定一张图像,用多区域多标签CNN预测语义概念,包括对象、属性、动作; 由于区域没有顺序,如何给这些语义概念排序,将全局上下文和语义概念融合; 对应的句子用LSTM生成,并且对融合后的句子进行监督,对比相似度。 疑问? 为什么要提取语义概念? 语义概念是图像与句子匹配的基本内容,像素级无法完成; 为什么不直接用图像描述? 图像描述和匹配是有区别的,图像匹配重点实在细粒度上找最相似的。图像描述体现在语义上,它不一定能够捕获到图像的细节。 为什么不从语义概念上直接学习语义顺序? 不同的顺序就有不同的意义,语义上有意义但可能是错误的顺序。 三、具体工作 句子表示学习: 一个完整的句子包括名词、动词和形容词