知识图谱

清华大学教授:唐杰——深度分析:人工智能的下个十年

℡╲_俬逩灬. 提交于 2020-12-16 16:05:25
来源:图灵人工智能 唐杰教授从人工智能发展的历史开始,深入分析 人工智能近十年的发展 ,阐述了 人工智能在感知方面取得的重要成果 ,尤其提到 算法 是这个 感知时代 最重要、最具代表性的内容。 重点讲解了 BERT、ALBERT、MoCo2 等取得 快速进展的算法 。最后说到 下一波人工智能浪潮的兴起 ,就是实现 具有推理、可解释性、认知的人工智能 。 作者:唐杰教授 人工智能对社会和经济影响的日益凸显,各国政府也先后出台了对人工智能发展的政策,并将其上升到国家战略的高度。截至目前,包括美国、中国和欧盟在内的多国和地区颁布了国家层面的人工智能发展政策。 在这个时代背景下, 我们需要考虑人工智能未来十年会怎样发展。 首先,我们需要从人工智能的发展历史中找到灵感。 我们再深入分析 AI 近十年的发展,会看到一个重要的标志:人工智能在感知方面取得重要成果。人工智能在语音识别、文本识别、视频识别等方面已经超越了人类,我们可以说 AI 在感知方面已经逐渐接近人类的水平。从未来的趋势来看,人工智能将会有一个从感知到认知逐步发展的基本趋势,如下图所示: 首先,我们来看看 AI 在感知方面做了哪些事情。在感知方面,AlphaGo、无人驾驶、文本和图片之间的跨媒体计算等取得了快速发展。从宏观来看,算法是这个感知时代最重要、最具代表性的内容。如果把最近十年的重要算法进行归类,以深度学习为例进行展示的话

从数据到知识,为何离不开这架飞轮?

眉间皱痕 提交于 2020-12-12 18:12:47
每当提到亚马逊,飞轮效应是一个必定会谈及的话题。作为亚马逊的核心商业理念,飞轮效应在亚马逊二十余年发展历程中体现的淋漓尽致。如今,飞轮效应甚至被商业界奉为圭臬。 所谓飞轮效应,即一个巨大的飞轮,要想把它转动起来,实现难度可谓空前,只有每一次推动都用尽全力,顺着同一个方向转动;刚开始可能会非常慢,随着时间的积累,到达临界点之后,它就会越转越快,最终形成飞轮效应。 事实上,飞轮效应揭示了一个道理:即万事开头难,当随着不断持续的探索与深入之后,积累的正反馈会越来越多,离成功自然越来越近。那么,除了在商业领域应用外,在如今这个数字化时代下,海量数据的增长极易让各种组织陷入数据沼泽之中,能否利用飞轮效应避免数据沼泽,从海量数据中不断提取价值,变成越用越好的知识? 正是出于此初衷,爱数在整合、治理、洞察非结构化数据的生产力平台AnyShare Family 7中引入了飞轮架构,让众多知识密集型组织看到了知识爆炸时下知识持续创造出价值的希望。 从数据到知识,这些痛点是拦路虎 在数字化时代下,企业并不缺数据,而是缺乏从数据到知识的方法。所以你会看到,很多企业注重收集各种数据,却并不能很好地让员工用起来,尤其是在设计院、制造企业、高校、政府、能源等这些知识密集型的组织中,愈发注重数据的积累,却愈发感觉到知识应用起来变得困难。 这其中问题出在哪里? 在很多知识密集型组织中的实际情况来看

华为应用市场:携手共建全场景数字商品分发生态

♀尐吖头ヾ 提交于 2020-12-12 10:37:56
华为开发者大会2020(Together)于9月1 0 日在东莞松山湖盛大开幕。9月1 1 日上午,在备受关注的华为应用市场分论坛上,华为消费者云服务应用市场业务部部长吴昊分享了平台最新现状和未来规划,并与开发者及合作伙伴深入研讨了如何在全场景智慧生活的发展蓝图下,通过全新形态打破现状,实现数字商品的创新性、突破性发展。 全球月活用户超过4. 9 亿,全球应用分发量同比增长 102 % 作为全球前三大应用分发平台,华为应用市场始终保持高速发展。截止到 2020 年 8月底 ,华为应用市场已覆盖170多个国家和地区,全球月活用户超过4. 9 亿,同比增长超过3 2 %,全球应用分发量超过 2610 亿,全球应用分发量同比增长 10 2 %,其中海外同比增长达 590 %。 华为应用市场将继续发挥五大核心优势——全球化的精品覆盖、全场景的体验创新、全品类的数字商品、全方位的隐私安全以及全生命周期的服务与支持,携手更多开发者及生态伙伴共建可持续发展的全场景、全品类数字商品分发平台,坚定不移构筑全场景智慧化新生态。 创新商业推广产品功能,升维“品效合一” 2020年华为应用市场推广分发量持续稳健增长,截至2020年8月底,推广分发量同比增长106%。 而华为应用市场商业推广今年下半年将围绕更丰富的流量场景,更高效的获客转化,更智能的投放体验和更具吸引力的营销方案展开

####好好好#####知识图谱上的双塔召回:阿里的IntentGC模型

Deadly 提交于 2020-12-11 10:35:59
关注本人的同学可能发现,我最近点评的文章都是关于"GNN在推荐系统应用"方向的。这当然与现如今这个方向非常火有关,但是作为一个合格的炼丹师+调参侠,总要搞清楚一门技术为什么火?这么火的技术对于自己是否有用?根据我的理解,由“传统机器学习→深度学习→图计算或知识图谱”这一路下来的发展脉络如下: 一切技术的目标都是为了更好地“伺候”好“ 推荐系统的一等公民 — ID类特征 ”。用户购买过的商品、光顾过的店铺、搜索过的关键词、商品的分类与标签,都是这样的ID类特征 传统的机器学习只会“ 严格匹配 ”。用户喜欢喝可口可乐,算法不会给他推百事可乐,因为“可口可乐”与“百事可乐”是两个不同的概念,占据了两个不同的ID。这时的推荐算法只有“ 记忆 ”功能。 深度学习的特点是, 一切皆可embedding 。通过将“可口可乐”与“百事可乐”都扩展成embedding向量,发现这两个“概念”不是正交的,反而在向量空间里非常相近,从而推荐系统有机会给一个只喝过可口可乐的用户推荐百事可乐。这时的推荐算法不再只能记忆,而是有了举一反三的“ 扩展 ”功能。 而到了“图计算”或“知识图谱”的阶段,ID类特征换了个名字,变成图上的节点或者知识图谱中的entity。换名字是小事,关键是 这些ID不再是孤立的,而是彼此关联,从而带来了信息的传递 。之前,小明喝过“可口可乐”,只有“可口可乐

知识图谱综述

元气小坏坏 提交于 2020-12-07 04:38:48
知识图谱简介 本文根据幕布上这篇思维导图总结而得 无需AI基础,小白也能看懂的知识图谱技术与应用 ##一、什么是知识图谱? ###定义 学术上:语义网络(Semantic Network)的知识库 应用中:多关系图(Multi-relational Graph) ###什么叫多关系图? 图:由节点和边构成,通常只包含一种类型的节点和边 多关系图:包含多种类型的节点和多种类型的边 ###知识图谱中的节点和边 节点 : 通常用实体(Entity)来表达 实体:现实世界中的事物 边 通常用关系(Relation)来表达 关系:不同实体之间的某种联系 ##二、知识图谱的表达 ###属性图(Property Graph) 运用前提:当知识图拥有属性时 运用场景:工业界 图片概述:李明李飞是父子关系,李明拥有138开头的电话号,开通时间是2018 电话号属性:2018年开通 李明属性:25岁、职位总经理 ###RDF(资源描述框架) 运用前提:不支持实体或关系拥有属性 运用场景:学术界 ##三、知识抽取 ###数据主要来自2种渠道 业务本身的数据 包含在公司内的数据库表 以结构化的方式存储 只需简单预处理即可输入后续AI系统 网络公开、抓取的数据 以网页形式存在 属于非结构化数据 需要借助自然语言处理等技术提取结构化信息 处理非结构化数据涉及的自然语言处理技术 实体命名识别(Name

综述 | 知识图谱技术综述(上)

百般思念 提交于 2020-12-06 18:32:47
题目:知识图谱技术综述 作者:徐增林,盛泳潘,贺丽荣,王雅芳 摘 要 知识图谱技术 是人工智能技术的重要组成部分,其建立的具有 语义处理 能力与 开放互联 能力的 知识库 ,可在 智能搜索、智能问答、个性化推荐 等智能信息服务中产生应用价值。 该文在全面阐述知识图谱定义、架构的基础上,综述知识图谱中的 知识抽取、知识表示、知识融合、知识推理 四大核心技术 的研究进展以及一些典型应用。该文还将评论当前研究存在的挑战。 关 键 词: 知识融合; 知识图谱技术; 知识表示; 开放互联; 语义处理 目录 0 导 读 1 知识图谱的定义与架构 1.1 知识图谱的定义 1.2 知识图谱的架构 2 大规模知识库 2.1 开放链接知识库 2.2 垂直行业知识库 3 知识图谱的关键技术 3.1 知识抽取 3.2 知识 表示 3.3 知识融合 3.4 知识推理 4 知识图谱的典型应用 4.1 智能搜索 4.2 深度问答 4.3 社交网络 4.4 垂直行业应用 5 知识图谱的挑战 5.1 知识获取 5.2 知识表示 5.3 知识融合 5.4 知识应用 6 结束语 7 参考文献 0.导读 人类先后经历了以文档互联为主要特征的“ Web 1.0 ”时代与数据互联为特征的“ Web 2.0 ”时代,正在迈向基于知识互联的崭新“ Web 3.0 ”时代 [1] 。 知识图谱 (knowledge graph)

为什么说卷积神经网络,是深度学习算法应用最成功的领域之一?

百般思念 提交于 2020-12-05 22:12:17
目前,作为深度学习的代表算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉、分类等领域上,都取得了当前最好的效果。 后来,基于深度神经网络和搜索树的智能机器人“AlphaGo”在围棋上击败了人类,这是CNN 给人们的一个大大的惊喜。一年后的 Master 则更是完虐了所有人类围棋高手,达到神一般的境界,人类棋手毫无胜机。 可以说,卷积神经网络是深度学习算法应用最成功的领域之一。 目前,CNN应用也十分广泛。例如Facebook用它进行自动的图像标签,google用它做照片检索,amazon用它做产品推荐,Pinterest用它做个性化家庭定制推送,Instagram用它搭建他们的搜索架构。 那么,基于CNN最经典也是最流行的应用应当是图像处理领域。 而研读卷积神经网络的经典论文,对于学习和研究卷积神经网络必不可缺。 今天,给大家推荐一些资料,有 论文、知识图谱。 7份经典学术论文 这些论文大部分都发表在计算机视觉顶级学术会议上。 这7份论文资料,100p以上的内容体量。 建议收藏学习。 01 resnet 02 CNN 03 batchnorm 04 alexnet 05 visualzing 06 resnet 07 yolo4 目前, 2000+ 的看过这个论文资料的同学都顺利成为各公司算法工程师。大家扫码添即可领取

最近三年四大顶会深度推荐系统上的18篇论文

不想你离开。 提交于 2020-12-05 08:04:26
导读:本文是“深度推荐系统”专栏的第十篇文章,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变化。本文主要根据RecSys 2019中论文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》总结的最近三年四大顶会深度推荐系统上的18个最新算法。 欢迎转载,转载请注明出处以及链接,更多关于深度推荐系统优质内容请关注如下频道。 知乎专栏: 深度推荐系统 微博: 深度传送门 公众号:深度传送门 今年RecSys 2019上出现的一篇极具批判性的论文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》。灵魂一问深度学习是否在推荐系统已经取得了足够可信的进展?在知乎上也引起了激烈的讨论: 如何看待RecSys 2019上的一篇文章认为现有DNN-based推荐算法带来的基本上都是伪提升? 作者总结了过去三年四大顶会(KDD、SIGIR、WWW和RecSys)推荐系统上18个最新算法,只有7个能重现效果。而且在不同的测试数据集上它们与浅层经典方法效果对比中经常都败下阵来

2020人工智能学习路线!内附完整自学书籍+知识图谱!

家住魔仙堡 提交于 2020-12-04 13:22:44
作为AI 初学者来说,最大的问题就是: 资料太多!!!看不完!!! 不知道如何取舍!!!人的精力有限!!! 大部分想转行AI算法岗位的都比较浮躁。跳槽的时候不得其法。虽然AI行业高薪,但是你却并不能掌握其法门。 AI学习不仅仅在于模型掌握了多少,更多的在于你的算法分析和设计能力、工程实践能力、算法模型的优化能力。 4本享誉全球的AI好书+8份人工智能知识树 免费 送给大家。 该资料非常适合本科、硕士以及刚接触机器学习的博士,还有一些想要转行AI的小伙伴。看完这些资料以后,预祝你顺利敲开大厂的大门。 数量有限 本号仅限100人 👆立即扫码 速速领取👆 备注:【AI书籍】 01 4本享誉全球的AI好书 这些资料其中4个是享誉全球的人工智能书籍,另外还加一个:人工智能黄埔军校—微软亚洲研究院人工智能学习材料。 这些书籍都比较贵,加起来超过了2580元,全部免费送给大家。 02 8份人工智能知识树 不知道自己的就业职场坐标是什么,没有方向和明确的规划,就难以树立自己的职业核心能力! 给你推荐这8张知识树图谱,这8张知识树图谱对我的职业规划有着重大的影响,各位同学一定要认真参考! 高清大图添加下方二维码获取 这些资料都比较贵, 总价值超过 5000元 ,但是对自我的职业发展价值则是无价的! 别慌,这些资料这一次全部免费分享给大家。 扫描下方二维码, 30分钟之内,将会添加你

人工智能中国专利技术分析报告发布,百度三年蝉联榜首

删除回忆录丶 提交于 2020-12-02 23:13:32
近日,国家工业信息安全发展研究中心、工信部电子知识产权中心发布《2020人工智能中国专利技术分析报告》,展示我国人工智能领域创新发展新态势。其中,在人工智能专利申请量和授权量方面,百度分别以9364件专利申请和2682件专利授权处于第一位,这也是百度连续三年在该人工智能领域专利分析报告中总申请量授权量蝉联第一,展现出中国AI“头雁”的实力。 报告中的人工智能专利申请排名显示,我国权利主体在人工智能领域技术创新活跃,前十名中,我国的企业、高校及科研院所占了8个名额。其中,百度人工智能领域专利申请成绩斐然,申请数量超过微软和三星两家国外权利主体数量之和。此外,百度在深度学习技术、自然语言处理、智能语音、自动驾驶、知识图谱、智能推荐、交通大数据多个领域位居专利申请量和授权量首位。 在深度学习领域,百度专利申请量和授权量均为第一名,体现出其在深度学习技术领域具有较强的技术优势。且百度深度学习专利申请量在近三年稳步增长,处于匀速上升的态势。随着百度深度学习技术的快速发展,专利的转化应用也迈入了快车道,百度飞桨深度学习平台是我国首个自主研发、开源开放、功能完备的产业级深度学习平台。 在自然语言处理领域,百度专利申请量以1383件稳居第一,与第三名微软公司申请数量647件相比,具有较大的领先优势。疫情期间百度自然语言处理技术作用巨大,百度灵医智惠基于自然语言处理技术推出的“智能咨询助手