知识图谱

2021美赛D题分析与思考

限于喜欢 提交于 2021-02-07 10:39:54
D题概述 以音乐为主题的图建模问题,可能需要一定的图算法(运筹、图神经网络)、图数据库(Neo4.j、Nosql、Graph等)、知识图谱(这块不算很了解只能算感觉)的基础才能很好将问题落地 问题背景 许多歌曲都有相似的旋律,许多艺术家对音乐流派的重大转变做出了贡献。有时,这些变化 是由于一位艺术家影响了另一位艺术家。有时,它是对外部事件(如重大世界事件或技术进 步)的响应而出现的变化。 希望团队开发一种衡量音乐 影响力的模型。这个问题要求你考察艺术家和流派的进化和革命趋势。 需要满足的需求 使用 Influence_Data 数据集或其中的一部分创建音乐影响力的(多个)定向网络,其中影 响者连接到追随者。开发参数来捕捉这个网络中的‘music influence’。通过创建定向影响 者网络的子网络来探索音乐影响力的子集。描述此子网。在这个子网络中,你的‘music influence’指标揭示了什么? 使用 FULL_MUSIC_DATA 和/或音乐特征的两个汇总数据集(具有艺术家和年份)来开发 音乐相似性度量模型。用你的衡量标准,流派内的艺术家比流派间的艺术家更相似吗? 比较流派之间和流派内部的相似之处和影响。流派的区别是什么?流派是如何随着时间的推移而变化的?流派与流派之间是否关联 说明 DATA_ENAFSONCE

探索语言交互技术在政务数字化的应用

孤人 提交于 2021-02-04 16:14:34
摘要: 在智慧城市的建设中,政府也希望能够使用新技术来提供更好的服务。 最近去公积金中心办理逐月还贷的业务,由于害怕排队时间较长,还没到上班时间就早早排队去了。正当我等待得百无聊赖之时,坐旁边的一位小兄弟对着手机说:转1000块钱给我妈。我看他用手机人脸识别了一把,看样子是转账成功了,开心地继续刷手机。作为一名业内人士,对这位孝顺的小兄弟,我心生感(kui)慨(jiu)之余,立马想到,如果我能对着手机说:帮我办下公积金还贷业务,然后能很快办完,我就可以不用在这等而是去加班奋斗了。很可惜,我的愿望暂时不能实现。 好的消息是,随着目前智慧城市建设的推进,政府也希望能够借助数字化手段,提高政府治理能力,方便市民办理各项业务。这其中,采用语音作为交互方式的新兴应用也逐步出现。事实上,在一些发达国家,也能看到这类应用。比如在推行数字政府的新加坡,可以通过像LifeSG[[1]]这类应用用语音来获取政务服务。在2019年4月份,英国数字政府部门上线语音查询政府公开信息的服务,用户在家可以通过Google Home或者Amazon Alexa智能音箱直接查询 http:// GOV.UK 网站上超过12,000项政府信息,市民可通过语音完成的任务范围逐渐扩大,从“国家最低工资标准”到“我如何申请一个新的护照”等等,并且陆续上线更多的查询服务,比如办理结婚手续的详细过程等[[2]]。

不要再用arxiv链接了!为了让论文引用更规范,上交毕业生、南加州大学华人博士创建了一个小工具

£可爱£侵袭症+ 提交于 2021-01-30 09:14:57
只需两步,将文献的 arXiv 信息转换为正式来源信息。 机器之心报道,作者:魔王。 伴随着预印本平台 arXiv 的广泛使用,越来越多的研究者喜欢在写论文参考文献时直接使用 arXiv 信息。这看似非常方便,但也存在问题:这篇 arXiv 论文是否在 ACL、EMNLP、NAACL、ICLR 或 AAAI 等学术会议上发表过? 没错,在某些情况下,只引用 arXiv 信息显得不那么准确,这种不准确的文献条目甚至可能会违反某些会议的论文提交或 camera-ready 版本提交规则。 如何解决这一问题呢?最近,上交毕业生、南加州大学博士生林禹臣开发了一个简单的 Python 工具——Rebiber,它能够基于 ACL Anthology 和 DBLP 数据库自动解决这一问题。 项目地址: https:// github.com/yuchenlin/re biber 下图展示了 Rebiber 的使用示例: 在该示例中,文章的原始信息来自 Google Scholar,仅包括标题、作者、期刊(arXiv)、年份。而事实上该论文已被 EMNLP 2020 接收,原始信息显然不够准确。 经过 Rebiber 转换后,原始 arXiv 信息被转换为来自正式来源的准确信息,包括标题、作者、年月、出版商、数字对象识别码(doi)、网址等详细内容。 Rebiber 支持的会议包括 ACL

数字经济时代的智能化大数据治理

不羁岁月 提交于 2021-01-24 14:20:38
转载本文需注明出处:微信公众号EAWorld,违者必究。 当今,数字化转型正在各行业快速发展,以数据、流量、知识为主的的数字经济时代到来,数据在其中的重要性不言而喻。 在企业内部,数据团队正逐渐变成一个专业、独立的部门,未来数据部门的肩上要扛起包括保证数据质量、管理数据架构、提供平台与工具等在内的各种数据相关的职责,来支持各方对数据的使用、形成企业的数据资产。做为支撑数字化转型的基础设施,数据治理已经成为数据团队履行数据职责的重要手段。 我们正在尝试通过一些智能化的技术来实现数据治理,建立企业统一的数据工作环境。本文主要介绍了通过智能化的手段来实现大数据治理的一些技巧,以及其中的核心技术。 目录: 一、治理数据,从发现数据问题开始 二、三个智能化大数据治理的案例 三、大数据治理的十大智能化能力 四、 总结 一、治理数据,从发现数据问题开始 科学探究的过程一般是从发现问题开始的,数据治理也是如此。先发现问题,再寻找解决方法,最后提供相应的技术支撑,这是做数据治理的一般思路。 1.企业中常见的四类数据问题 在颠覆企业业务的数据经济时代,数据无疑成为企业拥抱变化的基础,数据跟实体一样变成了生产资料的一部分。但是我们仔细观察之后,会发现企业存在着各种各样的数据问题: 第一类问题就是数据资产不清晰 。现在很多企业都不了解自己的数据,企业中到底有多少数据?数据都是什么样的

百万级文献分析,十万字深入解读:机器之心发布《全球AI技术发展趋势报告》

六月ゝ 毕业季﹏ 提交于 2021-01-23 09:34:36
2017 年,机器之心发布了《机器之心人工智能技术趋势报告》,系统介绍了人工智能领域(AI) 下不同的技术分支,并以定性分析的方法讨论了各分支技术当时所处的发展阶段、瓶颈以及未来发展方向,帮助AI产业从业者提供技术趋势参考,帮助AI技术应用方、初学者理解飞速发展中的 AI 领域内各项技术的概况和层出不穷的新鲜技术内涵。 在2017版报告发布至今的三年里,越来越多的 AI 技术实现了商业落地,但也有不少深度学习方法开始触碰到技术自身的天花板,亟需突破。在三年后的今天,机器之心在这个可能是 AI 技术发展的关键拐点发布《2020-2021 全球AI技术发展趋势报告》。 相比 2017 年版报告,2020-2021版报告在过往的定性分析方法之外增加了数据层面的挖掘、分析和探索,更加侧重对具体技术趋势的挖掘以及量化分析指标的形成。基于开源的论文与专利语料,结合机器之心自有的相关数据库,综合文献报告审阅与问卷访谈等形式,本报告分别从「顶会趋势(NeurIPS) 分析」、「专家问卷分析」以及「专业分析」三个不同角度呈现分析结果,辅助读者了解近年来 AI 领域的热门趋势技术。 你将从报告中获得什么? 人工智能技术发展七大趋势领域概览 一、(人类)自然语言技术 大规模预训练语言模型成为主流 语音识别技术应用普及度最高 问答系统、聊天机器人相关应用放缓 情感分析、文本分类增速不减 跨领域融合越来越多

2021斯坦福图机器学习课程CS224W开课了,Jure Leskovec主讲

て烟熏妆下的殇ゞ 提交于 2021-01-19 12:59:50
2021 年第一个月刚刚过半,有些学校的新学期就已经开始了。 机器之心报道,作者:小舟、魔王。 图是一种强大的数据结构,可以用于建模许多真实世界的场景,图能够对样本之间的关系信息进行建模。但是真实图的数据量庞大,动辄上亿节点、而且内部拓扑结构复杂,很难将传统的图分析方法如最短路径、DFS、BFS、PageRank 等算法应用到这些任务上。因此有研究者提出将机器学习方法和图数据结合起来,即图机器学习,这逐渐成为近年来机器学习中的一股热潮,特别是图神经网络(GNN)。 此前,斯坦福大学计算机学院副教授 Jure Leskovec 等人开了一门课程——CS224W,主题是图机器学习。最近,CS224W 2021 冬季课程开课了。 课程主页: http:// web.stanford.edu/class/ cs224w/ 这门课程主要聚焦分析大量图时所面对的计算、算法和建模挑战。通过研究底层图结构及其特征,学习者可以了解机器学习技术和数据挖掘工具,从而在多种网络中有所发现。 这门课程涉及的主题包括:表征学习和图神经网络;万维网算法;基于知识图谱的推理;影响力最大化;疾病爆发检测;社交网络分析。 预备知识 学习者需要具备以下背景知识: 基础计算机科学原理知识,能够写出不错的计算机程序;熟悉基础概率论知识;熟悉基础线性代数知识。 课程会在开始的几周内概述这些背景知识。 此外

数字化新技术在气象服务中的应用场景设计

瘦欲@ 提交于 2021-01-15 22:52:51
【本文2300字,阅读需要7分钟】 数字化时代,人工智能、大数据、云计算、边缘计算、物联网、移动互联网、第五代通信等新技术正在逐步影响着人们的生活。将这些数字化时代的新技术应用于气象服务的具体应用场景上会怎样?今天开开“脑洞”,大胆的进行了一些设计,虽然只是一种想法,但我非常希望我们的气象服务越来越智慧,越来越有价值。以下是具体的设计思路和应用场景,如有不妥之处请业内同行批评指正。 (一)大城市安全运行气象服务设计 设计思路: 基于物联网+边缘计算+区块链技术的大城市安全运行气象服务。随着5G技术应用的逐步成熟,阻碍万物互联的网络传输将得到解决,这些技术结合研发的气象服务产品将应用于城市交通、输电线网、输气管网、排水通道等保障大城市安全运行的基础生命线上。物联网的应用能够将气象环境的观测应用于常规探测设备无法触达的领域,尤其是条件恶劣的“生命线”上,快速收集海量设备数据,解决目前行业气象服务中无法解决的全链条追踪监测问题,同时应用边缘计算技术解决物联网探测设备的实时业务、数据优化以及安全隐私保护等方面的关键问题。通过边缘计算可将应用视频图像等大量计算识别天气要素的算法部署到边缘和终端,减少数据量传输,增强天气信息采集能力。最后再结合区块链技术搭建出气象数据交易平台,让物联网探测以及边缘计算分析后的气象信息可信度更高,构建出气象数据生产者与消费者之间点对点的协作机制与桥梁

一套代码、多端运行,大前端时代,如何用Flutter制霸全平台?

☆樱花仙子☆ 提交于 2021-01-15 04:51:17
“小步快跑、快速迭代”的开发大环境下 ,“一套代码、多端运行” 可以说是很多技术团队的梦想。为了这个梦想,我 曾考察过很多跨平台开发框架 ,比如 React Native、Weex、PWA 等等,但是因为各种原因,放弃了。 直到2018年12月5日,谷歌公开发布 Flutter 1.0版本, Flutter 正式成为全平台框架,支持手机、Web、桌面电脑和嵌入式设备,“一套代码、多端运行”的梦想貌似看到了一线曙光。 Flutter 提供了一整套从底层渲染逻辑到上层开发语言的完整方案,有跨平台、高保真、高性能等优点。 因为这些革命性的优点,从发布到现在,它的热度一路攀升,受到了很多开发者的热切青睐,也有了 很多知名的商业案例,比如阿里闲鱼、今日头条、腾讯 Now、美团等。 Flutter示例 在正式版发布半年多的时间里, Flutter 在 GitHub 上的 Star 就已经超过了 68,000, 已经发布了 4 年多的同行业领头羊 React Native 项目,Star 也不过 78,000。 现在看来, 在 Google 的强力带动下,Flutter 极有可能成为跨平台开发领域的终极解决方案。 如何高效学习、快速上手 Flutter呢? 从 Flutter 发布到现在的大半年时间,我接触到很多 前端、Android、iOS 的开发者 ,超过 80% 的人告诉我他正在学或打算学

一套代码、多端运行,大前端时代,如何用Flutter制霸全平台?

做~自己de王妃 提交于 2021-01-15 03:32:47
“小步快跑、快速迭代”的开发大环境下 ,“一套代码、多端运行” 可以说是很多技术团队的梦想。为了这个梦想,我 曾考察过很多跨平台开发框架 ,比如 React Native、Weex、PWA 等等,但是因为各种原因,放弃了。 直到2018年12月5日,谷歌公开发布 Flutter 1.0版本, Flutter 正式成为全平台框架,支持手机、Web、桌面电脑和嵌入式设备,“一套代码、多端运行”的梦想貌似看到了一线曙光。 Flutter 提供了一整套从底层渲染逻辑到上层开发语言的完整方案,有跨平台、高保真、高性能等优点。 因为这些革命性的优点,从发布到现在,它的热度一路攀升,受到了很多开发者的热切青睐,也有了 很多知名的商业案例,比如阿里闲鱼、今日头条、腾讯 Now、美团等。 Flutter示例 在正式版发布半年多的时间里, Flutter 在 GitHub 上的 Star 就已经超过了 68,000, 已经发布了 4 年多的同行业领头羊 React Native 项目,Star 也不过 78,000。 现在看来, 在 Google 的强力带动下,Flutter 极有可能成为跨平台开发领域的终极解决方案。 如何高效学习、快速上手 Flutter呢? 从 Flutter 发布到现在的大半年时间,我接触到很多 前端、Android、iOS 的开发者 ,超过 80% 的人告诉我他正在学或打算学

浅谈细粒度实体分类的前世今生 | AI Time PhD知识图谱专题

此生再无相见时 提交于 2021-01-10 08:58:36
AI TIME欢迎每一位AI爱好者的加入! 实体分类是知识图谱构建和补全的重要子任务,其中细粒度实体分类为实体提供了更加丰富的语义信息,有助于关系抽取、实体链接、问答系统等下游任务。 细粒度实体分类是什么?和传统的命名实体识别有什么区别?任务的难点在哪里?采用什么方法解决?目前有哪些数据集可用?未来的发展方向如何? 为解除这些困惑,第四期AI Time PhD知识图谱专题分享的直播间,我们请到清华大学计算机系、知识工程实验室的博士五年级研究生金海龙,为大家梳理了细粒度实体分类任务发展的脉络,并对未来作出了展望。 一、FGET定义及问题 传统的 命名实体识别(NER )面向 粗粒度 的类别,比如人物、地点和组织机构等,对实体的刻画不够精确。 图:命名实体识别(来自medium.com) 实际生活中,我们需要更加细粒的类别来刻画实体,提供更加具体的语义信息,增强指示性,比如篮球员动员和香港歌手等。以关系抽取为例,实体的细粒度类别能很大程度暗示实体间候选的关系。实体类别信息越粗,实体间的候选关系就越倾于复杂,相应的关系抽取任务也变得更困难。于是,下游应用催生了细粒度实体分类这个任务。 细粒度实体分类 (FGET) : Fine-grained Entity Typing, 给定候选 实体 (Mention) 及其 上下文 (Context) ,预测可能的 类别集合 (Type) 。