美文网首页
DataX调优及常见问题

DataX调优及常见问题

作者: Map_Reduce | 来源:发表于2019-10-27 20:47 被阅读0次

jvm参数

在datax 中导数据使用过程中往往会因为,目标数据过大导致datax oom,那么可以调大datax的jvm参数来防止oom,在python命令后,使用 -jvm=”-Xms5G -Xmx 5G”来调大

python datax.py  --jvm="-Xms5G -Xmx5G" ../job/test.json

writeMode Insert ignore

当datax 导入mysql数据时,可能会因为有有数据报错,导致datax导数据会异常慢,那么可以修改mysqlwriter的writeMode模式 修改为Insert ignore 忽略报错,速度会显著提升。

java.io.IOException: Maximum column length of 100,000 exceeded in column...异常信息

如果报java.io.IOException: Maximum column length of 100,000 exceeded in column...异常信息,说明数据源column字段长度超过了100000字符。
需要在json的reader里增加如下配置

"csvReaderConfig":{
   "safetySwitch": false,
   "skipEmptyRecords": false,
   "useTextQualifier": false
}
safetySwitch = false;//单列长度不限制100000字符

相关文章

  • DataX调优及常见问题

    jvm参数 在datax 中导数据使用过程中往往会因为,目标数据过大导致datax oom,那么可以调大datax...

  • Hive调优

    宏观调优思路 1.资源充足加内存 2.数据接入慢调优接入工具Sqoop/Datax 3.Hive参数调优 4.sq...

  • 学习Java VisualVM的使用

    使用 VisualVM 进行性能分析及调优 JVisualVM 进行性能分析及调优 JVM(5):tomcat...

  • Nginx负载调优总结

    nginx负载调优总结 一、调优手册 二、参数获取方式及调优详解: 对nginx的调优很大一部分是对nginx配置...

  • 软件性能分析及调优原理

    性能分析及调优原理 作...

  • Hadoop 2.7.2 运行错误集锦

    1. 借鉴 Yarn下Mapreduce的内存参数理解&xml参数配置MapReduce内存调优hive常见问题(...

  • Java性能调优

    概览 设计优化 Java程序优化 Java程序优化并行程序开发及优化 JVM调优 Java性能调优工具

  • 用户画像5:开发性能及作业调度

    本章主要总结开发性能调优及作业调度相关的产品知识,性能调优主要是减少性能消耗和提高ETL作业时间,常见的调优就会数...

  • MySQL及调优

    介绍 MySQL是在开发过程中使用的最多的一个关系型数据库。所以了解和掌握对它的调优是很有必要的。 MySQL数据...

  • 配置及调优

    Zend OPcache: Nginx 把HTTP请求转发给PHP-FPM, PHP-FPM再把请求交给某个PHP...

网友评论

      本文标题:DataX调优及常见问题

      本文链接:https://www.haomeiwen.com/subject/kguqyctx.html