Spark学习笔记-GraphX-1
Spark学习笔记-GraphX-1 标签: Spark Graph GraphX 图计算 2014-09-29 13:04 2339人阅读 评论 (0) 收藏 举报 分类: Spark (8) 版权声明:本文为博主原创文章,未经博主允许不得转载。 Spark GraphX是一个分布式图处理框架,Spark GraphX基于Spark平台提供对图计算和图挖掘简洁易用的而丰富多彩的接口,极大的方便了大家对分布式图处理的需求。 Spark GraphX由于底层是基于Spark来处理的,所以天然就是一个分布式的图处理系统。 图的分布式或者并行处理其实是把这张图拆分成很多的子图,然后我们分别对这些子图进行计算,计算的时候可以分别迭代进行分阶段的计算,即对图进行并行计算。 Spark GraphX基本操作: [plain] view plain copy import org.apache.spark.SparkContext import org.apache.spark._ import org.apache.spark.graphx._ import org.apache.spark.graphx.Graph import org.apache.spark.graphx.Edge import org.apache.spark.graphx.VertexRDD import org