gremlin

图数据库调研

女生的网名这么多〃 提交于 2020-09-25 18:33:28
概述 本文转自:http://tang.love/2018/08/31/graph_database_research/ 这里记录一下图数据相关的调研结论。下面是图数据库的定义: A graph database is a database that uses graph structures for semantic queries with nodes, edges and properties to represent and store data. 注意,这里只是说了通过 提供类似图的语义查询功能,并没有规定图的存储结构。图数据库的主要优点: 更好,更快速的查询和分析; 更简单和更自然的数据建模; 同时支持实时更新和查询; 数据结构的灵活性。 图数据库是所有数据管理系统中成长最快的分类,下面分别从图检索语言和图数据库两个方面来介绍图数据市场的发展。 图检索语言 这里主要对比下面: Cypher :Neo4j 的查询语言称作 Cypher,Cypher 是对图形的声明查询语言,使用图形模式匹配作为主要的机制作 图形数据选择(包括只读和变更操作)。Cypher 的声明模式匹配性质意味着可以通过描述想从它那里得到什么查询图形数据。 SPARQL :面向 RDF(Resource Description Framework)的三元组数据,W3C 标准,无 schema

python gremlin connection timeout issue

守給你的承諾、 提交于 2020-08-25 05:16:17
问题 Getting gremlin driver timeout issue as below. We have increased the throughput and tried but still in vein. [12/05/2019 06:50:33 > 1376bf: ERR ] Traceback (most recent call last): [12/05/2019 06:50:33 > 1376bf: ERR ] File "Integrated_Algorithm_PD_MChart_V0.2.py", line 120, in <module> [12/05/2019 06:50:33 > 1376bf: ERR ] productDevelopment_cs_response = execute_traversals(client) [12/05/2019 06:50:33 > 1376bf: ERR ] File "Integrated_Algorithm_PD_MChart_V0.2.py", line 77, in execute

沃尔玛的产品知识图谱

我的梦境 提交于 2020-08-19 04:21:06
作者|Karthik Deivasigamani 编译|VK 来源|Medium 介绍 电子商务目录是通过从卖家、供应商/品牌获取数据而创建的。合作伙伴(销售商、供应商、品牌)提供的数据往往不完整,有时会遗漏我们客户正在寻找的关键信息。尽管合作伙伴遵循一个规范(一种发送产品数据的约定格式),但在标题、描述和图像中隐藏着大量数据。除了我们的合作伙伴提供的数据外,互联网上还有许多非结构化数据,如产品手册、产品评论、博客、社交媒体网站等。 沃尔玛正致力于构建一个零售图谱(Retail Graph),捕捉有关产品及其相关实体的知识,以帮助我们的客户更好地发现产品。它是一个产品知识图谱,可以在零售环境中回答有关产品和相关知识的问题,可用于语义搜索、推荐系统等。本文进一步阐述了什么是零售图谱、如何构建零售图谱、围绕图模型的技术选择、数据库和一些用例。 沃尔玛的零售图谱是什么 零售图谱捕获了零售世界中存在的产品和实体之间的连接。实体是存在的物体、事物、概念或抽象,例如客厅、野生动物摄影、颜色、农舍风格。我们关注的实体大致有两种:抽象的和具体的。前者帮助我们回答诸如“夏日游泳池派对用品”、“农家客厅家具”、“野生动物摄影镜头”之类的问题,而后者帮助我们回答诸如“蓝色牛仔裤裤子”、“木制餐桌”之类的问题。该图谱还将产品之间的关系捕获到两个类别,替代品和补充品(附件、兼容产品等)。它还试图将抽象概念