知识图谱

直播预告:细粒度实体分类综述 | AI TIME PhD 知识图谱专题-4

你。 提交于 2021-01-10 08:49:56
AI TIME PhD 知识图谱专题-4 《细粒度实体分类综述》 2020年6月26日 19:30-20:30 AI TIME PhD 知识图谱专题 主题 讲者 时间 大规模在线教育中的知识智能 于济凡 6月05日 事件检测 仝美涵 6月12日 知识图谱推理问答综述 史佳欣 6月19日 细粒度实体分类综述 金海龙 6月26日 第四期: 2020年6月26日 19:30-20:30 报告题目: 细粒度实体分类综述 摘要: 实体分类是知识图谱构建和补全的重要子任务,近些年来吸引了越来越多的研究兴趣。细粒度实体分类相比于传统的命名实体识别,类别数量更多,需要考虑类别之间的依赖关系,为实体提供了更加丰富的语义信息,有助于关系抽取,实体链接,问答系统等下游任务。在这次报告中,讲者将 梳理 细粒度实体分类任务发展的脉络,以及对未来发展方向作出展望。 嘉宾简介: 金海龙 ,清华大学计算机系,知识工程实验室,博士五年级研究生,导师为李涓子教授。 划重点 ! 直播通道: 哔哩哔哩直播通道 扫码 或 点击链接 关注AITIME哔哩哔哩官方账号 观看直播 链接: https://live.bilibili.com/21813994 直播结束后我们会邀请讲者在微信群中与大家答疑交流,请添加“AI TIME小助手(微信号:AITIME_HY)”,回复“图谱”,将拉您进“知识图谱交流群”! AI

知识图谱的综述、构建、存储与应用

我的未来我决定 提交于 2021-01-09 18:04:59
本文介绍知识图谱,首先会讲一段知识图谱的综述作为开场,然后就知识图谱的构建,存储,还有应用进行具体说明。 知识图谱和我们的资源页比较类似,都是需要先构建,然后存储,之后应用。 知识图谱应用广泛,我会以推荐系统为例子,说明知识图谱在推荐系统中的应用。 知识图谱综述 我们首先对知识图谱做一个简短的综述。 计算机为什么需要知识? 比如数字110,对机器来说,110就是一个字符串,与其他数字没有太大的差别。 当然可以借助关联分析,分析出110跟警察,抢劫等相关。但是关联分析比较复杂,需要借助数据挖掘等相关技术。 如果采用知识库,只需要构建一条知识,即110是报警电话。 人工智能分为三个层次,分别是运算智能,感知智能和认知智能。 运算智能是让机器能存会算;感知智能是让机器能听会说、能看会认;认知智能是解决机器能理解会思考的问题。 认知智能需要知识图谱。 知识图谱是一个大规模语义网,包含实体和关系,比如章子怡的丈夫是汪峰; 也包含实体和属性,比如章子怡的出生日期是1979年2月9日。 还包含实体和概念,比如章子怡是一个女演员; 还包含概念之间的关系,比如女演员是演员的子类。演员是人物的子类。 百科图谱一般由 标题,摘要,信息框,标签,图片 等部分组成。 可抽取信息框的内容构建知识图谱,并进行可视化展示。 其中,对于题目理解来讲,函数的提出者,提出时间这些属性不是我们所关心的。 表达式,表示法

聊聊图数据库和图数据库的小知识

百般思念 提交于 2021-01-01 07:39:35
图数据库 - 维基百科 :在计算机科学中, 图数据库 (英语:graph database, GDB )是一个使用 图结构 进行 语义查询 的 数据库 ,它使用 节点 、 边 和属性来表示和存储数据。该系统的关键概念是 图 ,它直接将存储中的数据项,与数据 节点 和节点间表示关系的 边 的集合相关联。这些关系允许直接将存储区中的数据链接在一起,并且在许多情况下,可以通过一个操作进行检索。图数据库将数据之间的关系作为优先级。查询图数据库中的关系很快,因为它们永久存储在数据库本身中。可以使用图数据库直观地显示关系,使其对于高度互连的数据非常有用。 图数据库是一种 非关系型数据库 ,以解决现有 关系数据库 的局限性。图模型明确地列出了数据节点之间的依赖关系,而关系模型和其他 NoSQL 数据库模型则通过隐式连接来链接数据。图数据库从设计上,就是可以简单快速地检索难以在关系系统中建模的复杂层次结构的。图数据库与 20 世纪 70 年代的网络模型数据库相似,它们都表示一般的图,但是网络模型数据库在较低的抽象层次上运行,并且不能轻松遍历一系列边。 图数据库的底层存储机制可能各有不同。有些依赖于关系引擎并将图数据“存储”到表中(虽然表是一个逻辑元素,但是这种方法在图数据库、图数据库管理系统和实际存储数据的物理设备之间施加了另一层抽象)。另一些则使用 键值存储 或 面向文档的数据库 进行存储

为什么算法专家都建议学好C++?

点点圈 提交于 2020-12-30 16:52:53
C++一直被称作永不过时的开发语言,比如游戏、服务器、人工智能等领域都必须用到C++! 虽然网上有很多教程和资料,但仍有很多人说C++难学,究其原因是没有找到正确的学习方法! GoogleTest框架一直广泛应用于C/C++项目测试 ,是一个非常重要的测试软件。 它的开发过程几乎覆盖C++核心知识和C++项目开发经常遇到的问题,是新手锻炼C++开发能力最好的项目之一! 因此,今天就给大家分享1个《C++难点突破训练营》! 这个训练营,老师会带你使用C++实现快速排序算法,深刻理解C++编程思想。 而且会重点带你经历,从GoogleTest实现原理到构建项目的全流程,让你能够从0到1独立开发一个C++项目,快速提升项目能力! 特训营老师胡船长是我一直非常敬重的大神,他早在10年前就获得了ACM亚洲区金牌,并2次晋级全球总决赛。 此后任职百度知识图谱部,推动开发百度NLP推理引擎开发。 他也会从自己在百度多年的面试角度出发,讲解大厂面试的核心关键点,教你如何准备大厂面试,拿下高薪offer! 特训营原价 599 元,靠着关系搞到 100 个免费名额, 0 元即可入学!只要你是统招本科及以上学历,就可以抢占! 长按3秒 即可扫码 你现在长按识别上方二维码或点击阅读原文,即可直接抢占 0 元免费名额。 来源: oschina 链接: https://my.oschina.net/u

PTMs| 2020最新NLP预训练模型综述

点点圈 提交于 2020-12-25 17:17:41
本篇文章主要介绍邱锡鹏老师在2020年发表的一篇预训练模型的综述: 「Pre-trained Models for Natural Language Processing: A survey」 [1] 。 该综述系统地介绍了nlp中的预训练模型。主要的贡献包括: 1.深入盘点了目前主流的预训练模型 ,如word2vec,ELMo,BERT等。 2. 提出了一种预训练模型的分类体系 ,通过四种分类维度来划分目前已有的预训练模型。包括: 表征的类型,即:是否上下文感知 编码器结构,如:LSTM、CNN、Transformer 预训练任务类型,如:语言模型LM,带掩码的语言模型MLM,排列语言模型PLM,对比学习等 针对特定场景的拓展和延伸。如:知识增强预训练,多语言预训练,多模态预训练和模型压缩等 3. 如何将PTMs学到的知识迁移到下游的任务中。 4. 收集了目前关于PTMs的学习资料。 5. 指明PTMs未来的研究方向 ,如:局限、挑战、建议。 由于篇幅原因,本文主要针对前面两点进行梳理,即 「目前主流的预训练模型」 和 「预训练模型的分类体系」 。 我们建立了 自然语言处理、机器学习等 讨论组,欢迎大家加入讨论。人数达到上限,添加下方好友手动邀请,注意一定要 备注 ,不然无法通过。 1. 背景 「nlp、cv领域的传统方法极度依赖于手动特征工程」 。例如nlp中的log

2020年读书总结

ⅰ亾dé卋堺 提交于 2020-12-23 08:52:40
有记录的是 42 本 杂志,哲学,育儿,技术,经济 自我认为不满意,进度有些偏慢,有些事是有影响。 心情,新*病*,家*事多,也有好事的影响,我整理的知识图谱的时间比较多了(体现:现在笔记共有 3529 篇,看看明年是多少?)。 明年 不做计划,不做目标 望大家都好! 来源: oschina 链接: https://my.oschina.net/u/4280438/blog/4830601

让保险不再只是“事后诸葛”,这家公司用AI撬动万亿健康险市场

随声附和 提交于 2020-12-23 03:41:57
      健康险是一个未被AI充分挖掘的万亿级庞大市场,行业最主要的痛点在于风控阶段缺乏询证的过程管理。所谓过程管理就是从承保开始对投保人的健康状况进行全方面的监控和管理。 好人生科技用AI大数据技术让过程管理真正落地,同时基于过程管理首创 “全量承保”的产品运营模式,这也是业内首家敢对保险公司做这样的“结果承诺”的健康险科技公司。 从技术实现层面来说,汤子欧博士指出:AI与各个行业结合的过程中,最缺乏的其实是行业的逻辑与知识图谱。正因如此,这也成为好人生科技能够在保险科技行业内利用AI大数据技术实现领先的关键。    撰文 | 徐丹   晚上十一点,小杨刚刚结束手中的工作准备休息,这时手机APP弹出一个推送,包括小杨一天的健康报告,如运动量、饮食健康等,同时对他第二天的健康生活进行安排,如起床时间、饮水量、熬夜排毒方案等,甚至包括盐摄入量等。   一周前,小杨发现自己有轻微的偏头痛,便利用该健康管理App中的智能机器人医生进行了自我诊断,此后,App每天都会给小杨发送健康报告,并给出精准的饮食、运动、睡眠以及是否需要就医等健康建议。一周后,小杨的偏头痛已经缓解了不少。   在疫情的影响下,这种O2O远程医疗对很多人来说并不陌生。特殊的是,小杨使用的App属于一家健康险公司,投保后便可以免费得到后续的全程健康管理服务。    很长一段时间,健康险都是执行严格的漏斗式筛选

MySQL 面试,必须掌握的 8 大核心点

别等时光非礼了梦想. 提交于 2020-12-22 23:47:34
上周末和在北京的哥们国仔涮火锅,席间聊起了最近面试的经历。 他说想换工作的原因很简单,就是要涨工资,原来的公司呆了两年多,薪资浮动不超过 500 元。而身边跳槽的那些同事,薪资都已经是自己的 2 倍了。 在准备面试的过程中,国仔坦言道还蛮辛酸的。 白天要上班敲代码,晚上甚至会加班,导致搜集面试题目的时间都没有,而且网上好多都是千篇一律的搬来搬去的文章,感觉面试官都不屑于问到类似的问题。 工作后整个人都有点懒了,知道怎么用代码实现却不再关注为什么要这么使用。但是面试时候好像更关注 why 多于 how。有些问题甚至工作时都没遇到过。 说到这儿,国仔已经吃完了一盘羊肉,镜片被热气蒙上了一层薄薄的雾。国仔取下眼镜一边用衣角擦拭,一边继续念叨: 我觉得获得高薪的关键:就是高效的准备面试。 如果当初有个人能给我一份总结好的面试锦囊,我就不至于慌成那样。 对于程序员来说, 面试内容一般分为两个部分: 编程面试题部分 + 数据库面试题部分 。 据不完全调查,作为数据库中的主流选择 MySQL 的薪资待遇正在逐年增加,而且似乎不仅仅是程序员在学,就连很多产品经理和运营人也开始学习 MySQL 去分析数据。 △图来自猎聘网 为了让大家能避开国仔面试时的苦恼,我们特意邀请到两位有着 10 年工作经验的技术老兵,前前后后大概花了三个多月的时间,改了 6 个版本,最终形成了这套 MySQL 面试题

MySQL 面试,必须掌握的 8 个知识点

别说谁变了你拦得住时间么 提交于 2020-12-22 19:55:26
上周末和在北京的哥们国仔涮火锅,席间聊起了最近面试的经历。 他说想换工作的原因很简单,就是要涨工资,原来的公司呆了两年多,薪资浮动不超过 500 元。而身边跳槽的那些同事,薪资都已经是自己的 2 倍了。 在准备面试的过程中,国仔坦言道还蛮辛酸的。 白天要上班敲代码,晚上甚至会加班,导致搜集面试题目的时间都没有,而且网上好多都是千篇一律的搬来搬去的文章,感觉面试官都不屑于问到类似的问题。 工作后整个人都有点懒了,知道怎么用代码实现却不再关注为什么要这么使用。但是面试时候好像更关注 why 多于 how。有些问题甚至工作时都没遇到过。 说到这儿,国仔已经吃完了一盘羊肉,镜片被热气蒙上了一层薄薄的雾。国仔取下眼镜一边用衣角擦拭,一边继续念叨: 我觉得获得高薪的关键:就是高效的准备面试。 如果当初有个人能给我一份总结好的面试锦囊,我就不至于慌成那样。 对于程序员来说, 面试内容一般分为两个部分: 编程面试题部分 + 数据库面试题部分 。 据不完全调查,作为数据库中的主流选择 MySQL 的薪资待遇正在逐年增加,而且似乎不仅仅是程序员在学,就连很多产品经理和运营人也开始学习 MySQL 去分析数据。 △图来自猎聘网 为了让大家能避开国仔面试时的苦恼,我们特意邀请到两位有着 10 年工作经验的技术老兵,前前后后大概花了三个多月的时间,改了 6 个版本,最终形成了这套 MySQL 面试题

阿里巴巴文娱NLP团队招聘

只谈情不闲聊 提交于 2020-12-19 15:06:41
团队简介 阿里巴巴文娱NLP团队大量招人(P6-P8),我们承接着文娱全部技术线的各类NLP需求,专注研发自然语言分析技术(分类、聚类、情感、问答、关系抽取、知识图谱),为各项顶层业务提供NLP技术支持(知识推断、意图识别、query改写、搜索相关性、全网搜索等)。 我们不断夯实技术进而驱动商业,目标是成为最有价值的商业自然语言处理团队,采用平台化策略服务好阿里内外的各种需求。 阿里巴巴文娱部门NLP算法团队支撑文娱集团整体业务线的NLP需求,专注研发自然语言分析技术(分类、聚类、情感、问答、关系抽取、知识图谱),为各项顶层业务提供NLP技术支撑(知识推断、意图识别、query改写、搜索相关性、全网搜索等)。在不断夯实技术进而驱动商业,成为最有价值的商业自然语言处理团队,采用平台化策略服务阿里内外的各种需求。 坐标 - 杭州 岗位职责 - 运用机器学习、深度学习技术,研发文本分析、知识图谱相关算法,并应用于个性化推荐&搜索; - 改进和研发文本理解、文本生成、主题发现、知识抽取等技术; - 跟踪业界与学界最新进展,并能够快速应用到实际业务中。 岗位要求 - 编程基础扎实,熟练使用至少一种常用编程语言,如 Python / C++ / Java,熟悉 Tensorflow、Keras、Caffe等深度学习工具。 - 熟悉机器学习的基础方法(分类、回归、排序、降维等