kettle是使用java开发的,主要运行在jvm上,这样它的执行效率就和jvm的调优有关了,我在平时的使用中,主要是用kitchen.sh(其实其它的*.sh也是一样的),在默认的情况下内存的使用配置是这样的
# ****************************************************************** # ** Set java runtime options ** # ** Change 512m to higher values in case you run out of memory ** # ** or set the PENTAHO_DI_JAVA_OPTIONS environment variable ** # ** (JAVAMAXMEM is there for compatibility reasons) ** # ****************************************************************** if [ -z "$JAVAMAXMEM" ]; then JAVAMAXMEM="512" fi if [ -z "$PENTAHO_DI_JAVA_OPTIONS" ]; then PENTAHO_DI_JAVA_OPTIONS="-Xmx${JAVAMAXMEM}m" fi
为了能让kettle更好的运行,我修改成了这样
# ****************************************************************** # ** Set java runtime options ** # ** Change 512m to higher values in case you run out of memory ** # ** or set the PENTAHO_DI_JAVA_OPTIONS environment variable ** # ** (JAVAMAXMEM is there for compatibility reasons) ** # ****************************************************************** if [ -z "$JAVAMAXMEM" ]; then JAVAMAXMEM="16384" fi if [ -z "$PENTAHO_DI_JAVA_OPTIONS" ]; then PENTAHO_DI_JAVA_OPTIONS="-Xms${JAVAMAXMEM}m -Xmx${JAVAMAXMEM}m -Xss1024m" fi
可以看到,首先我加大了xmx,其次我添加了xms和xss,这是为什么呢?
将xms调整到与xmx一样,是为了让jvm在GC后,不要再进行内存分配,直接使用指定的值,这样省去了计算并分配内存的时间,而添加xss是为了让kettle在单次Job中执行更多更深入的循环,如果没有大的循环可以不用配置xss,因为jvm在起线程的时候每个线程都会分配xss指定大小的内存,也就是说xss越大,可用的线程就越少,这点是需要注意的!
修改完成后,从内存的监控图中可以看出,内存的分配和回收所形成的图形是类似"WW"形的,直上直下,执行时间也明显的比修改前少了。
好了,就先到这儿,如果还有其它方面的优化,我会再和大家分享的。
原文:http://my.oschina.net/sucre/blog/391856