DataX通过纯Java代码启动

徘徊边缘 提交于 2020-12-19 07:21:23

       DataX是阿里巴巴团队开发的一个很好开源项目,但是他们对如何使用只提供了python命令启动方式,这种方式对于只是想简单的用下DataX的人来说很是友好,仅仅需要几行代码就可以运行,但是如果你需要在DataX上进行二次开发,那么用python来控制程序加显得很没有掌控力度,也不容易和别的模块进行融合,今天来说下DataX纯Java代码的启动方式,也顺便来记录一下以后想用的时候加能直接用了

       

    先把测绘的代码写上  就一行。     

     突然想起来还有好多代码没敲完!!!!先写到这,后面的下午6点前更新。

---------------------------------------------------

   机器太差了,给mysql创建1000万条数据一直创建不好,正好趁这个时间来继续更新

   这里面启动的时候会加载两个配置文件 一个是datax.py  另一个是 xxx.json   

   先说第一个    这是一个python格式的配置文件,如果我们用纯java来启动的话需要把这个配置转换一下

   转换成Java格式大致就是下面这些   

java

//JVM启动参数
-server
-Xms1g
-Xmx1g
-Xms1g
-Xmx1g
-XX:+HeapDumpOnOutOfMemoryError
-XX:HeapDumpPath=/Users/xx/JavaProjects/DataX-master/core/src/main/log
-XX:+HeapDumpOnOutOfMemoryError
-XX:HeapDumpPath=/Users/xx/JavaProjects/DataX-master/core/src/main/log

//环境变量
-Dloglevel=info
-Dfile.encoding=UTF-8
-Dlogback.statusListenerClass=ch.qos.logback.core.status.NopStatusListener
-Djava.security.egd=file:///dev/urandom
-Ddatax.home=/Users/hongming/JavaProjects/DataX-master/core/src/main
-Dlogback.configurationFile=/Users/xx/JavaProjects/DataX-master/core/src/main/conf/logback.xml
-Dlog.file.name=c_main_bin_data_json


-classpath /Users/xx/JavaProjects/DataX-master/core/src/main/lib/*:.

com.alibaba.datax.core.Engine -mode standalone -jobid -1 -job /Users/xx/Downloads/datax-b/core/src/main/bin/job.json

   这时候我们按照这个来配置一下环境变量   

  Run--》Edit Configurations  

涉及到项目隐私  我就不贴图了

配置如下

program arguments  com.alibaba.datax.core.Engine -mode standalone -jobid -1 -job /Users/xx/Downloads/datax-b/core/src/main/bin/job.json

Environment variables  

-Dloglevel=info 
-Dfile.encoding=UTF-8 
-Dlogback.statusListenerClass=ch.qos.logback.core.status.NopStatusListener 
-Djava.security.egd=file:///dev/urandom 
-Ddatax.home=/Users/hongming/JavaProjects/DataX-master/core/src/main 
-Dlogback.configurationFile=/Users/xx/JavaProjects/DataX-master/core/src/main/conf/logback.xml 
-Dlog.file.name=c_main_bin_data_json

-D去掉之后依次添加进去  

比如 loglevel=info 

module  选core  

配置完成  点击ok

然后这时候如果你点运行的话会告诉你插件加载失败

 

我们来看看插件加载的路径在哪

找了一圈 。发现在这个路径下

com/alibaba/datax/core/util/container/CoreConstant.java

这里面是配置的全局变量和局部变量  这时候你把自己的插件

DATAX_PLUGIN_READER_HOME
DATAX_PLUGIN_WRITER_HOME

路径修改为自己的

如果提示找不到 core.json的配置文件 那就把上面的
DATAX_CONF_PATH 

修改成自己的
这时候如果你的json没写错的话应该就没什么问题了
可以接着往下开发了。

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!