Sqoop -- 用于Hadoop与关系数据库间数据导入导出工作的工具
转: https://blog.csdn.net/qx12306/article/details/67014096 Sqoop是一款开源的工具,主要用于在Hadoop相关存储(HDFS、Hive、HBase)与传统关系数据库(MySql、Oracle等)间进行数据传递工作。Sqoop最早是作为Hadoop的一个第三方模块存在,后来被独立成为了一个Apache项目。除了关系数据库外,对于某些NoSQL数据库,Sqoop也提供了连接器。 一、Sqoop基础知识 Sqoop项目开始于2009年,可以在Hadoop相关存储与传统关系数据库之间进行数据导入导出工作。Sqoop会开启多个MapReduce任务来并行进行数据导入导出工作,提高工作效率。 二、Sqoop安装 本实例安装版本: sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz 。 1、将安装文件上传到/usr/local/目录下并解压,然后重命名为sqoop。 2、配置环境变量,执行命令:vi /etc/profile,增加export $SQOOP_HOME=/usr/local/bin,并在export PATH中增加$PIG_HOME/bin,然后执行命令:source /etc/profile使配置文件立即生效。 3、将需要连接的数据库驱动文件拷贝至lib目录下