使用 sqoop 将 hive 数据导入 mysql 后出现乱码:
进入数据库,输入 show variables like 'character%';
回车
我这里有两种解决办法,如下
方法1:修改数据库配置文件
(1)在下面这个位置添加几行配置
vim /etc/my.cnf
init_connect='SET collation_connection = utf8_unicode_ci'
init_connect='SET NAMES utf8'
character-set-server=utf8
collation-server=utf8_unicode_ci
skip-character-set-client-handshake
(2)重启 mysql 服务
systemctl restart mysqld.service(我这里centos7)
或
service mysqld restart(centos6)
再次查看编码:
之后再执行命令的时候在mysql数据库名后面加上?useUnicode=true&characterEncoding=utf-8
就可以了。
示例:sqoop export --connect "jdbc:mysql://数据库ip:3306/数据库名称?useUnicode=true&characterEncoding=utf-8" ...
sqoop-export \
--connect "jdbc:mysql://localhost:3306/lft?useUnicode=true&characterEncoding=utf-8" \
--username root \
--password 123456 \
--table test3 \
--export-dir /user/hive/warehouse/hadoop.db/test3 \
--input-fields-terminated-by '\001';
方法2:两行命令快速搞定
用下面两行命令代替修改配置文件的步骤,然后执行命令的时候也加上?useUnicode=true&characterEncoding=utf-8
就OK了。
set character_set_database=utf8;
set character_set_server=utf8;
来源:oschina
链接:https://my.oschina.net/u/4318023/blog/4483504