《Hadoop大明白》【2】pyspark的应用场景

[亡魂溺海] 提交于 2020-02-29 07:46:47

1,python的码农涉猎Hadoop,首选pyspark

2,开发spark应用,需要知道的几个点:

【1】SQL语句:insert into / overwirte

【2】DataFrame的常用API

【3】UDF函数

【4】Kafka组件使用

【5】Avro序列化

【6】RDD的坑:谨防嵌套使用
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!