Severless SQL on OSS 实验(DataLakeAnalytics on OSS)
摘要: 数据存储在OSS后,可以有多种方式查询分析OSS数据,如自建Spark/Presto/Impala(阿里云EMR以及Hadoop社区官方已支持OSS), 使用MaxCompute、DataLakeAnalytics等。 基于OSS的数据查询分析 数据存储在OSS后,有多种查询分析的方法,包括阿里云MaxCompute、DataLakeAnalytics产品等Severless查询分析服务,也可以自建Spark、Presto、Imapla应用来分析OSS上的数据。 实验步骤(DataLakeAnalytics on OSS) 本次实验,主要介绍实验DataLakeAnalytics如何Severless地查询分析OSS上的数据。 服务开通 OSS服务: 1.开通OSS服务 https://www.aliyun.com/product/oss DataLakeAnalytics服务: 1. 申请DataLakeAnalytics的试用资格 备注:目前DataLakeAnalytics公测中,需提交公测申请,开通试用。 操作步骤 准备数据 登录控制台 , 并创建目录 请创建 华东1 区域的OSS测试Bucket(目前DataLakeAnalytics产品公测区域为华东1)。 备注:Bucket名称是全局唯一,如果提示名称已存在,请更换一个Bucket名称。 创建目录(建议目录如下