非结构化数据_事件抽取
1.任务: 识别事件触发词及事件类型 抽取事件元素,判断角色 抽取描述事件的词组和句子 事件属性标注 事件共指消解 2. 流水线方法: 将事件抽取任务分解为一系列基于分类的子任务,每个子任务由一个机器学习分类器负责实施 分类器包括: 事件触发词分类器:判断词汇是否为事件触发词,并基于触发词信息对事件分类 元素分类器:判断词组是否为事件的元素 元素角色分类器:判断事件元素的角色类别 属性分类器:判断事件的属性 可报告性分类器:判断是否值得报告 3.联合抽取方法: 事件的所有相关信息会同个一个模型同时抽取出来,采用联合推断或者联合建模 事件抽取子任务模型--将所有模型的目标函数组合--联合推断的目标函数 动态多池化卷积神经网络模型: 词向量学习:无监督方式 词汇级特征抽取:基于词的向量表示获取事件抽取的相关词汇线索 句子级特征抽取:通过动态多池化卷积神经网络获取句子的语义组合特征 分类器:产生事件元素的角色类别 来源: https://www.cnblogs.com/hapyygril/p/11956514.html