语义分析

关于flex/bison 语法分析的问题

你说的曾经没有我的故事 提交于 2019-12-09 13:32:46
关于flex/bison 语法分析的问题 在进行语法分析的时候,发现在flex词法分析中分析过的词传不过来,之后查了网上说要用yylval参数传值,但是我需要传的参数种类很多,于是我申明了一个union,并给YYSTYPE定义为这个union(YYSTPE是yylval的类型),但是发现报错如下: union中的类型没有找到,一直以为是编译器出了问题,但是查看bison生成的头文件发现了事实的真相。 bison中为了满足各个符号不同的语义值的类型可以定义 %union{ …… } 如图: 其中YYSTYPE的定义就来源于这个,而不能自己在flex文件中定义union,然后赋值给YYSTYPE 如果需要用到yylval直接引用头文件 #include "xxx.tab.h" 即可 件 #include "xxx.tab.h" 即可 来源: CSDN 作者: AnnaZhan 链接: https://blog.csdn.net/AnnaZhan/article/details/103456037

美团餐饮娱乐知识图谱——美团大脑揭秘

一笑奈何 提交于 2019-12-07 17:52:35
前言 “ I’m sorry. I can’t do that, Dave.” 这是经典科幻电影《2001: A Space Odyssey》里HAL 9000机器人说的一句话,浓缩了人类对终极人工智能的憧憬。让机器学会说这样简单一句话,需要机器具备情感认知、自我认识以及对世界的认识,来辅助机器处理接收到的各种信息,了解信息背后的意思,从而生成自己的决策。而这些认知模块的基础,都需要机器具备知识学习组织推理的能力,知识图谱就是为实现这些目标而生。 今年5月,美团NLP中心开始构建大规模的餐饮娱乐知识图谱——美团大脑,它将充分挖掘关联各个场景数据,用AI技术让机器“阅读”用户评论数据,理解用户在菜品、价格、服务、环境等方面的喜好,挖掘人、店、商品、标签之间的知识关联,从而构建出一个“知识大脑”。美团大脑已经在公司多个业务中初步落地,例如智能搜索推荐、智能金融、智能商户运营等。 此前,《 美团大脑:知识图谱的建模方法及其应用 》一文,介绍了知识图谱的分类及其具体应用,尤其是常识性知识图谱及百科全书式知识图谱分别是如何使用的。之后我们收到非常多的反馈,希望能进一步了解“美团大脑”的细节。为了让大家更系统地了解美团大脑,NLP中心会在接下来一段时间,陆续分享一系列技术文章,包括知识图谱相关的技术,美团大脑背后的算法能力,千亿级别图引擎建设以及不同应用场景的业务效果等等

js 中{},[]中括号,大括号使用详解(转)

有些话、适合烂在心里 提交于 2019-12-07 12:11:05
js 中{},[]中括号,大括号使用详解 作者: 字体:[ 增加 减小 ] 类型:转载 <!--end art_info--> { } 大括号,表示定义一个对象,大部分情况下要有成对的属性和值,或是函数 <!--NEWSZW_HZH_BEGIN--> 一、{ } 大括号,表示定义一个对象,大部分情况下要有成对的属性和值,或是函数。 如:var LangShen = {"Name":"Langshen","AGE":"28"}; 上面声明了一个名为“LangShen”的对象,多个属性或函数用,(逗号)隔开,因为是对象的属性, 所以访问时,应该用.(点)来层层访问:LangShen.Name、LangShen.AGE,当然我们也可以用数组的方式来访问,如:LangShen["Name"]、LangShen["AGE"],结果是一样的。 该写法,在JSON数据结构中经常用,除此之外,我们平时写函数组的时候,也经常用到,如: 复制代码 代码如下: var LangShen = { Name = function(){ return "LangShen"; }, Age = function(){ return "28"; } } 调用方式差不多,因为是函数组,所以要加上(),如:alert( LangShen.Name() ); 二、[ ]中括号,表示一个数组,也可以理解为一个数组对象。

16 中文句法依存分析

ぃ、小莉子 提交于 2019-12-06 10:23:19
句法分析是自然语言处理(NLP)中的关键技术之一,其基本任务是确定句子的句法结构或者句子中词汇之间的依存关系。主要包括两方面的内容:一是确定语言的语法体系,即对语言中合法句子的语法结构给予形式化的定义;另一方面是句法分析技术,即根据给定的语法体系,自动推导出句子的句法结构,分析句子所包含的句法单位和这些句法单位之间的关系。 句法分析被用在很多场景中,比如搜索引擎用户日志分析和关键词识别,比如信息抽取、自动问答、机器翻译等其他自然语言处理相关的任务。 语法体系 句法分析需要遵循某一语法体系,根据该体系的语法确定语法树的表示形式,我们看下面这个句子: 西门子将努力参与中国的三峡工程建设。 用可视化的工具 Stanford Parser 来看看句法分析的整个过程: 短语结构树由终节点、非终结点以及短语标记三部分组成。句子分裂的语法规则为若干终结点构成一个短语,作为非终结点参与下一次规约,直至结束。如下图: 句法分析技术 依存句法分析 依存句法 依存句法(Dependency Parsing, DP)通过分析语言单位内成分之间的依存关系揭示其句法结构。 直观来讲,依存句法的目的在于分析识别句子中的“主谓宾”、“定状补”这些语法成分,并分析各成分之间的关系。 依存句法的结构没有非终结点,词与词之间直接发生依存关系,构成一个依存对,其中一个是核心词,也叫支配词,另一个叫修饰词,也叫从属词。

快速理解web语义化

本秂侑毒 提交于 2019-12-06 05:34:43
什么是Web语义化 Web语义化是指使用恰当语义的html标签、class类名等内容,让页面具有良好的结构与含义,从而让人和机器都能快速理解网页内容。语义化的web页面一方面可以让机器在更少的人类干预情况下收集并研究网页的信息,从而可以读懂网页的内容,然后将收集汇总的信息进行分析,结果为人类所用;另一方面它可以让开发人员读懂结构和用户以及屏幕阅读器(如果访客有视障)能够读懂内容。 简单来说就是利于 SEO,便于阅读维护理解。 总结起来就是: 正确的标签做正确的事情 页面内容结构化 无CSS样子时也容易阅读,便于阅读维护和理解 便于浏览器、搜索引擎解析。 利于爬虫标记、利于SEO html 语义化标签 HTML为网页文档内容提供上下文结构和含义。对于HTML体系而言,Web语义化是指使用语义恰当的标签,使页面有良好的结构,让页面元素有含义,便于被浏览器、搜索引擎解析、利于SEO。通常我们所说的HTML应该是完全脱离表现信息的,其中的标签应该都是语义化地定义了文档的结构。 代码示例: <html> <body> <article> <header> <h1>h1 - WEB 语义化</h1> </header> <nav> <ul> <li>nav1 - HTML语义化</li> <li>nav2 - CSS语义化</li> </ul> </nav> <section>

web语义化之SEO和ARIA

人盡茶涼 提交于 2019-12-06 04:14:58
在 快速理解web语义化 的时候,只知道web语义化有利于 SEO 和便于屏幕阅读器阅读,但并不知道它是如何有利于 SEO 和便于阅读器阅读的,带着这个疑问,进行了一番探索总结。 SEO 什么是SEO? SEO (Search Engine Optimization,搜索引擎优化 ),是一种利用搜索引擎的搜索规则来提高目的网站在有关搜索引擎内的排名的方式。通俗来讲就是根据搜素引擎的规则来优化你的网站,让你的网站能够在用户的搜索结果中排在前面,提高网站的访问量。 SEO常用方式 采用DIV+CSS布局 采用div-css布局的网站对于搜索引擎很是友好,因此其避免了Table嵌套层次过多而无法被搜索引擎抓取的问题,而且简洁、结构化的代码更加有利于突出重点和适合搜索引擎抓取。 尽量不使用表格布局,因为搜索引擎对表格布局嵌套3层以上的内容懒的去抓取。 TDK优化 TDK,即 title , description , keywords 。 一、title 在 SEO 中,标题的优化占着举足轻重的地位,无论是从用户体验的角度出发,还是从搜索引擎的排名效果出发, title 都是页面优化最最重要的因素。 title 的分隔符一般有 , , _ , - 和空格。其中 _ 对百度比较友好,而 - 对谷歌比较友好,空格在英文站点可以使用但中文少用。 推荐做法: 每个网页应该有一个独一无二的标题

知识图谱从哪里来:实体关系抽取的现状与未来

隐身守侯 提交于 2019-12-05 01:59:57
原地址:https://zhuanlan.zhihu.com/p/91762831 作者:韩旭、高天宇、刘知远 (欢迎转载,请标明原文链接、出处与作者信息) 最近几年深度学习引发的人工智能浪潮席卷全球,在互联网普及带来的海量数据资源和摩尔定律支配下飞速提升的算力资源双重加持下,深度学习深入影响了自然语言处理的各个方向,极大推动了自然语言处理的发展。来到2019年的今天,深度学习的诸多局限性也慢慢得到广泛认知。对于自然语言处理而言,要做到精细深度的语义理解,单纯依靠数据标注与算力投入无法解决本质问题。如果没有先验知识的支持,“中国的乒乓球谁都打不过”与“中国的足球谁都打不过”,在计算机看来语义上并没有巨大差异,而实际上两句中的“打不过”意思正好相反。因此,融入知识来进行知识指导的自然语言处理,是通向精细而深度的语言理解的必由之路。然而,这些知识又从哪里来呢?这就涉及到人工智能的一个关键研究问题——知识获取。 知识图谱 现有大型知识图谱,诸如Wikidata、Yago、DBpedia,富含海量世界知识,并以结构化形式存储。如下图所示,每个节点代表现实世界中的某个实体,它们的连边上标记实体间的关系。这样,美国作家马克·吐温的相关知识就以结构化的形式记录下来。 目前,这些结构化的知识已被广泛应用于搜索引擎、问答系统等自然语言处理应用中。但与现实世界快速增长的知识量相比

理解业务的思维框架:数据模型+规则+语义

我是研究僧i 提交于 2019-12-03 15:36:24
概述 中大型业务系统中,往往多种业务相互交叉,错综复杂,使得系统变得难以理解。一般的方法是,通过阅读工程代码来理解系统。但这种方法是有局限性的。因为工程代码,往往是系统设计实现与业务的混合体,并不完全一致地表达着业务本身: 由于当时的技术和系统架构的限制,往往实现的并不是最优的业务视角,而是折衷过的; 部分代码写得比较蹩脚,表达不准确,甚至有 BUG ,反而妨碍真正理解业务本身。 要真正理解业务,需要从业务本身上去理解,严格区分出“业务规则”与“系统设计与实现”这两个不同的层面。工程代码,可以作为重要的参考。 三要素 数据模型 数据模型指的是,需要哪些数据项,数据项之间的关联,如何有序地组织这些数据项。数据模型是软件整体设计的导航图。确定良好的数据模型,设计就成功了一大半。 比如交易的基本数据模型如下。通过这个模型,可以全局式地概览交易所涉及到的各种基本数据、各个基础模块,有一个整体而基本的把握。 针对具体业务,则可更容易地理解和分析。具体业务的数据模型,通常是基础数据模型再加上一些扩展性的数据集。 规则 规则指的是,数据项及流程要满足什么约束 ?为了什么目标而服务 ? 比如,为了构建线上交易,需要一个交易下单流程。定义交易下单流程:参数校验 -> 补全信息 -> 价格计算 -> 落库 -> 发送创建订单成功的消息。一个流程就是一条规则。 下单流程还可以扩展得更完整一些:进入店铺

语法制导翻译――语义分析

匿名 (未验证) 提交于 2019-12-02 23:42:01
语义分析 和 中间代码生成 可以同时进行,称为 语义翻译 语法分析 、 语义分析 、 中间代码生成 可以同时进行,称为 语法制导翻译 参考: https://liuyehcf.github.io/2017/11/06/%E7%BC%96%E8%AF%91%E5%8E%9F%E7%90%86-%E8%AF%AD%E6%B3%95%E5%88%B6%E5%AF%BC%E7%BF%BB%E8%AF%911/ /*--> */ /*--> */ /*--> */ /*--> */ /*--> */ SDT中的语义分析,和中间代码生成绑到一块了; 在花括号中执行语义动作(可以包括生成中间代码和类型检查),就认为是计算了节点属性; 而属性是什么完全是看需求来的。 步骤: /*--> */ /*--> */ /*--> */ /*--> */ /*--> */ 参考PLY在词法分析部分生成符号表,符号表参考要检查的错误类型确定其数据类型,P56标明使用SDT和使用符号表的关系 在语法分析构建语法分析树时添加语义动作,包括类型检查和中间代码生成。添加的动作在parser.py中尽量简洁,可以引入自定义模块,使用该模块中的方法。

语义角色标注

半世苍凉 提交于 2019-12-02 23:41:18
语义角色标注 本教程源代码目录在 book/label_semantic_roles ,初次使用请您参考 Book文档使用说明 。 # 说明 本教程可支持在 CPU/GPU 环境下运行 Docker镜像支持的CUDA/cuDNN版本 如果使用了Docker运行Book,请注意:这里所提供的默认镜像的GPU环境为 CUDA 8/cuDNN 5,对于NVIDIA Tesla V100等要求CUDA 9的 GPU,使用该镜像可能会运行失败; 文档和脚本中代码的一致性问题 请注意:为使本文更加易读易用,我们拆分、调整了 train.py 的代码并放入本文。本文中代码与train.py的运行结果一致,可直接运行train.py进行验证。 # 背景介绍 自然语言分析技术大致分为三个层面:词法分析、句法分析和语义分析。语义角色标注是实现浅层语义分析的一种方式。在一个句子中,谓词是对主语的陈述或说明,指出“做什么”、“是什么”或“怎么样,代表了一个事件的核心,跟谓词搭配的名词称为论元。语义角色是指论元在动词所指事件中担任的角色。主要有:施事者(Agent)、受事者(Patient)、客体(Theme)、经验者(Experiencer)、受益者(Beneficiary)、工具(Instrument)、处所(Location)、目标(Goal)和来源(Source)等。 请看下面的例子,“遇到”