Semantic

GAN/VAE地位难保? Flow在零样本识别任务上大显身手

ε祈祈猫儿з 提交于 2020-10-06 12:11:40
     作者 | 秦杰、沈钰明   编辑 | 陈大鑫   计算机视觉三大会议之一的ECCV 2020刚刚落下帷幕,本文主要介绍阿联酋起源人工智能研究院(IIAI)的科学家们在该会议上发表的一篇论文:《Invertible Zero-Shot Recognition Flows》。   该工作首次提出了一种基于生成流(Generative Flow)模型的零样本学习方法,并在多个数据库上取得了目前最好的识别结果。      论文链接: https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123610596.pdf   1   零样本学习简介   众所周知,在当今计算机视觉领域,深度学习可谓“一统天下”,在诸多视觉任务中都取得了目前最好的(检测、识别、分割等)结果。而数据可谓是深度学习算法的“Buff”,算法的好坏往往取决于是否有充足且多样性的标注好的训练数据。   举例而言,我们要识别下图中的三种动物,那么首先我们需要标注大量老虎、兔子和斑马的图片,然后基于这些有标签的图片训练深度学习模型,最后将未知类别的图片输入训练好的模型中,才能够准确识别出图片中包含的动物类别。   然而,在实际应用场景中,我们往往会遇到以下“尴尬”情况:当我们在训练深度学习模型时,能“看见”的是标注好的大量老虎和兔子的图片

文本挖掘之情感分析(一)

做~自己de王妃 提交于 2020-10-05 08:17:47
一、文本挖掘 文本挖掘则是对文本进行处理,从中挖掘出来文本中有用的信息和关键的规则,在文本挖掘领域应用最往广泛的是对文本进行分类和聚类,其挖掘的方法分为无监督学习和监督学习。文本挖掘还可以划分为7大类:关键词提取、文本摘要、文本主题模型、文本聚类、文本分类、观点提取、情感分析。 关键词提取 :对长文本的内容进行分析,输出能够反映文本关键信息的关键词。 文本摘要 :许多文本挖掘应用程序需要总结文本文档,以便对大型文档或某一主题的文档集合做出简要概述。 文本聚类 :主要是对未标注的文本进行标注,常见的有 K均值聚类和层次聚类。 文本分类 :文本分类使用监督学习的方法,以对未知数据的分类进行预测的机器学习方法。 文本主题模型 LDA :LDA( Latent Dirichlet Allocation )是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构,该模型可以用于获取语料的主题提取和对不同类别的文档进行分类。 观点抽取 :对文本(主要针对评论)进行分析,抽取出核心观点,并判断极性(正负面),主要用于电商、美食、酒店、汽车等评论进行分析。 情感分析 :对文本进行情感倾向判断,将文本情感分为正向、负向、中性。用于口碑分析、话题监控、舆情分析。 因为自己的论文写的是关于情感分析方面的内容,因此打算接下来主要写情感分析系列的内容

把因果干预用到弱监督语义分割上!这篇NeurIPS 2020 oral论文不简单

邮差的信 提交于 2020-10-04 13:35:02
     作者 | 张冬   编辑 | 陈大鑫   本文介绍一篇今年被NeurIPS 2020收录的一篇oral文章:   《 Causal Intervention for Weakly-Supervised Semantic Segmentation》   这篇论文提出的基于因果干预的Context Adjustment (CONTA)模型主要有以下几个优势:   1、CONTA是 第一个使用因果图来分析弱监督语义分割模型中各component之间的关系 ,从而找出了造成现有的pseudo-mask不准确的本质原因是因为数据集中的上下文先验是混淆因子。在此基础上,作者又进一步提出了使用因果干预切断上下文先验和图像之间的关联,从而提升pseudo-mask的质量。   2、不同于以往的基于graph neural network或复杂的attention机制的弱监督语义分割模型, CONTA的设计简洁,并没有很复杂的操作和训练步骤在其中。   3、作者在4种不同的弱监督语义分割模型上都进行了实验,结果表明 CONTA可以提升模型CAM、pseuso-mask和segmentation mask的质量 ,从而验证了CONTA的通用性和有效性。   作者 相信CONTA在将来也可以被应用到其他的弱监督语义分割模型上。      论文第一作者张冬:  

2020 IJCAI 接受论文 list 分类排列(一)

风格不统一 提交于 2020-10-02 06:52:26
2020 IJCAI 接受论文 list 分类排列(一) 2020 IJCAI 接受论文 list 分类排列(二) 2020 IJCAI 接受论文 list 分类排列(三) 目录 Main track (Agent-based and Multi-agent Systems) Main track (AI Ethics) Main track (Computer Vision) Main track (Constraints and SAT) Main track (Data Mining) Main track (Heuristic Search and Game Playing) Main track (Humans and AI) Main track (Agent-based and Multi-agent Systems) A Deep Reinforcement Learning Approach to Concurrent Bilateral Negotiation Pallavi Bagga, Nicola Paoletti, Bedour Alrayes, Kostas Stathis A Multi-Objective Approach to Mitigate Negative Side Effects Sandhya Saisubramanian, Ece

2020 IJCAI 接受论文 list 分类排列(三)

隐身守侯 提交于 2020-10-02 05:51:55
2020 IJCAI 接受论文 list 分类排列(一) 2020 IJCAI 接受论文 list 分类排列(二) 2020 IJCAI 接受论文 list 分类排列(三) 目录 Main track (Machine Learning Applications) Main track (Multidisciplinary Topics and Applications) Main track (Natural Language Processing) Main track (Planning and Scheduling) Main track (Robotics) Main track (Uncertainty in AI) Special track on AI for CompSust and Human well-being Special Track on AI in FinTech Main track (Machine Learning Applications) A Label Attention Model for ICD Coding from Clinical Text Thanh Vu, Dat Quoc Nguyen, Anthony Nguyen Adversarial Mutual Information Learning for Network

区别于传统低效标注,两种基于自然语言解释的数据增强方法

本秂侑毒 提交于 2020-10-01 23:16:45
本文内容整理自 PaperWeekly 和 biendata 在 B 站组织的直播回顾,点击文末 阅读原文 即可跳转至 B 站收看本次分享完整视频录像,如需嘉宾课件,请在 PaperWeekly 公众号回复关键词 课件下载 获取下载链接。 作者简介: 秦禹嘉,清华大学电子工程系本科生,大二开始在清华大学自然语言处理实验室学习。导师刘知远副教授。主要研究方向为义原知识体系的完善与应用。 尽管深度学习模型已经在许多自然语言处理任务上取得了非常好的效果,它们通常依赖于大量的训练数据;然而在实际应用场景下,标注能力、训练数据并不充足的情况经常出现,因此如何让标注者高效率地标注是一个十分有意义的问题。 传统给出标签的标注方式在一定程度上限制了标注者能够提供的信息量,很多情况下我们不仅关注标注者打出的标签,更加关注于其打出该标签的理由。因此一种更加高效的做法是让标注者在给出标签的同时给出相应的自然语言解释来解释其做出该决定的原因。 本文将分享应用自然语言解释的一些挑战,并介绍目前应对这些挑战做出的探索和最新工作。 自然语言解释的概念与背景 如开篇所讲,深度学习的技术已经在许多自然语言处理的任务上取得了很好的效果,但是仍然还有两个问题没有解决。第一个是模型通常需要大量的数据。第二个是模型缺乏可解释性。 先看 data hungry 的问题,很多情况下我们并没有那么多的数据能够喂给模型

《Task-Oriented Dialogue as Dataflow Synthesis》阅读笔记

会有一股神秘感。 提交于 2020-09-30 13:40:58
题目:Task-Oriented Dialogue as Dataflow Synthesis 来源: TACL2020 原文链接: https://www. mitpressjournals.org/do i/full/10.1162/tacl_a_00333 代码 : https://www. microsoft.com/en-us/res earch/project/dataflow-based-dialogue-semantic-machines . 转载请注明出处: 学习ML的皮皮虾 一、当前对话系统存在的主要问题和挑战 跟小王预约半小时的会议 1) 短短一句话包含了多个指示 :查询用户的日程表和小王的日程表;在工作时间内找到两人同时有空的半个小时;创建会议;向小王发送邀请。 2) 人类语言的长尾性,大部分语言无法被有限的高频意图所覆盖 :例如「预约会议」可视作高频意图,但「在某会议后预约另一个会议」却并不高频。对每个意图编写触发条件和行为代码,开发维护成本昂贵,同时数据短缺。 3) 多轮对话,引用和修改时,会使得意图爆炸 : 用户:今天北京天气怎么样? 机器:8月1日,北京地区晴,气温27-35摄氏度 用户:那明天呢? 机器:8月2日,北京地区多云,气温25-32摄氏度 第二轮意图识别为「查询天气-修改日期」,通过这个特定的意图,系统得知用户想查询天气情况

【你只需看一次】YOLO 全系列目标检测算法

六月ゝ 毕业季﹏ 提交于 2020-08-20 02:56:22
文章目录 一、概述 二、Yolo系列全家桶 YOLOv1 开山鼻祖之作 YOLOv2 YOLOv3 YOLOv4 目标检测tricks集大成者 YOLOv5 Fast YOLO Complex-YOLO MV-YOLO YOLO3D YOLO-6D YOLO-LITE Spiking-YOLO DC-SPP-YOLO SpeechYOLO Complexer-YOLO SlimYOLOv3 REQ-YOLO YOLO Nano xYOLO IFQ-Tinier-YOLO DG-YOLO Poly-YOLO E-YOLO PP-YOLO 一、概述 我对yolo系列好感较高,虽不及其他系列的精度,速度,但是他现在已经精度与速度之中做了trade off ,侧端也友好。本文引自我爱计算机视觉,后续我将对这些算法消融对比,关注公众号(原文底部)敬请期待。 YOLO目标检测算法诞生于2015年6月,从出生的那一天起就是“高精度、高效率、高实用性”目标检测算法的代名词。 在原作者Joseph Redmon博士手中YOLO经历了三代到YOLOv3,今年初Joseph Redmon宣告退出计算机视觉研究界后,YOLOv4、YOLOv5相继而出,且不论谁是正统,这YOLO算法家族在创始人拂袖而出后依然热闹非凡。 本文带领大家细数在此名门之中自带“YOLO”的算法,总计 23 项工作

机器人懂点「常识」后,找东西方便多了:CMU打造新型语义导航AI机器人

拥有回忆 提交于 2020-08-19 23:03:13
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 想让机器人像人一样思考,似乎一直是个难题。 例如,让智(zhi)能(zhang)机器人去客厅拿个遥控器,结果看到机器人在厨房翻箱倒柜… 好消息是,这个问题现在被CMU解决了。 CMU研究团队打造出了一款拥有人类「常识」的导航机器人,让找东西变得更方便。 这款机器人能利用AI判断家中最可能找到目标物体的地点,从而尽快找到它。 例如,让机器人去拿放在「植物」旁边的遥控器,机器人几乎立即检测出了「植物」盆栽所在的位置,从而检测到遥控器的存在。 项目已被ECCV 2020收录,并获得了居住地目标导航挑战赛的第一名。 一起来看看实现的过程。 让机器人「学点常识」 事实上,以往大部分采用机器学习训练的语义导航机器人,找东西的效果都不太好。 相比于人类潜意识中形成的常识,机器人往往有点“死脑筋”,它们更倾向于去记住目标物体的位置。 但物体所处的场景往往非常复杂,而且彼此间差异很大(正所谓每个人的家,乱得各有章法),如果单纯以大量不同场景对系统进行训练,模型泛化能力都不太好。 于是,相比于用更多的样本对系统进行训练,这次研究者们换了一种思路: 采用半监督学习的方式,使用一种名为semantic curiosity(语义好奇心)的奖励机制对系统进行训练。 训练的核心目的,是让系统基于对语义的

Hacker News 简讯 2020-08-17

我与影子孤独终老i 提交于 2020-08-17 01:01:47
最后更新时间: 2020-08-17 01:00 Hiding messages in x86 binaries using semantic duals - (yossarian.net) 使用语义对偶在x86二进制文件中隐藏消息 得分:64 | 评论:19 Nim – Python-like statically-typed compiled language - (nim-lang.org) Nim–类Python的静态类型编译语言 得分:59 | 评论:49 Show HN: GradientMagic - (gradientmagic.com) 表演HN:GradientMagic 得分:67 | 评论:6 Kapton: Miracle Material with a Tragic History - (hackaday.com) 卡普顿:具有悲剧历史的奇迹材料 得分:26 | 评论:4 OPDS – Easy to Use, Open and Decentralized Content Distribution - (opds.io) OPD—易于使用、开放和分散的内容分发 得分:25 | 评论:8 A guide to learning algorithms through LeetCode - (github.com) LeetCode学习算法指南 得分:55 |