浅谈细粒度实体分类的前世今生 | AI Time PhD知识图谱专题
AI TIME欢迎每一位AI爱好者的加入! 实体分类是知识图谱构建和补全的重要子任务,其中细粒度实体分类为实体提供了更加丰富的语义信息,有助于关系抽取、实体链接、问答系统等下游任务。 细粒度实体分类是什么?和传统的命名实体识别有什么区别?任务的难点在哪里?采用什么方法解决?目前有哪些数据集可用?未来的发展方向如何? 为解除这些困惑,第四期AI Time PhD知识图谱专题分享的直播间,我们请到清华大学计算机系、知识工程实验室的博士五年级研究生金海龙,为大家梳理了细粒度实体分类任务发展的脉络,并对未来作出了展望。 一、FGET定义及问题 传统的 命名实体识别(NER )面向 粗粒度 的类别,比如人物、地点和组织机构等,对实体的刻画不够精确。 图:命名实体识别(来自medium.com) 实际生活中,我们需要更加细粒的类别来刻画实体,提供更加具体的语义信息,增强指示性,比如篮球员动员和香港歌手等。以关系抽取为例,实体的细粒度类别能很大程度暗示实体间候选的关系。实体类别信息越粗,实体间的候选关系就越倾于复杂,相应的关系抽取任务也变得更困难。于是,下游应用催生了细粒度实体分类这个任务。 细粒度实体分类 (FGET) : Fine-grained Entity Typing, 给定候选 实体 (Mention) 及其 上下文 (Context) ,预测可能的 类别集合 (Type) 。