Input阶段将数据节点上的数据进行反序列化,然后划分切片。 数据切片:(1)一个job的map阶段并行度由客户端在提交job时的切片数决定 (2)每个切片分配一个MapTask并行实例处理 (3)默认情况下,切片的大小等于BlockSize,也就是数据块大小 来源:https://www.cnblogs.com/lihui001/p/12516712.html 标签 并行处理