一、背景
线上一个项目,每次机器重启时项目都会报出大量的Timeout,同时每个集群节点都被监控到较为频繁的Full GC。之后同事虽然尝试过JVM调优并适当调大了老年代空间,但依然不能根本上解决问题。当时该问题被初步归咎于系统中整合的Groovy,但并未证实。问题汇总如下:
- 问题一:项目启动时报出大量Timeout;
- 问题二:项目运行时,频繁Full GC;
随后,我着手做另外一个项目GLUE,该项目同样需要整合Groovy,在做并发测试时,我发现了同样的问题。
经过排查并做出优化,新项目GLUE在并发测试下基本不存在Full GC的问题,在此将问题处理过程记录如下,希望可以给大家一点参考。
二、分析
新系统GLUE底层基于Groovy实现,系统通过执行 “groovy.lang.GroovyClassLoader.parseClass(groovyScript)” 进行Groovy代码解析,Groovy为了保证解析后执行的都是最新的脚本内容,每进行一次解析都会生成一次新命名的Class文件,底层代码如下图:
因此,如果Groovy类加载器设置为单例,当对脚本(即使同一段脚本)多次执行该方法时,会导致 “GroovyClassLoader” 装载的Class越来越多。如果此处临时加载的类不能够被及时释放,最终将会导致PermGen OutOfMemoryError。即使情况没有那么糟糕,也会引起频繁的full GC,从而影响稳定运行时的性能。
然后,我翻阅了线上启动时大量Timeout以及Full GC的项目代码。发现该项目同样适用“GroovyClassLoader”进行groovy脚本解析,断点接入如下:
首先,我发现该项目中的Groovy类加载器是单例; 其次,该项目中的加载一次页面,将会调用多达31次“groovy.lang.GroovyClassLoader.parseClass(groovyScript)”方法进行groovy脚本解析。这很震惊,但是庆幸的是,该系统对解析后的Class做了缓存。
三、分析结果
经过分析,该项目启动是被报大量Timeout和运行Full GC的问题基本锁定,原因如下:
-
启动时Timeout原因:项目启动完成后,该节点经过健康检查无误被切到线上集群环境,接收线上流量。但是,由于该项目上单个页面模块太多,上文中一张页面加载需要执行解析函数多达31次,而且该项目还托管这许多其他的页面,这导致这些页面的预热时间比较久。但是不幸的是,项目已经通过了健康检查,大量流量涌入阻塞等待页面加载完成,因此导致项目启动时被报大量Timeout。
-
频繁Full GC原因:该项目中Groovy类加载使用单例,当对脚本(即使同一段脚本)多次执行该方法时,会导致 “GroovyClassLoader” 装载的Class越来越多。如果此处临时加载的类不能够被及时释放,最终将会导致PermGen OutOfMemoryError。即使情况没有那么糟糕,也会引起频繁的full GC,从而影响稳定运行时的性能。
三、验证
为了对上述猜想进行验证,设计了一下三段代码进行简单测试。代码逻辑分别为:
- Test1.java:并行启动100个线程,并行解析groovy脚本,使用单例类加载器;
- Test2.java:并行启动100个线程,并行解析groovy脚本,使用非单例类加载器;
- Test3.java:并行启动100个线程,并行打印log。
本文中测试方法为,启动下面三段测试代码中的Main方法,通过查看各自JVM的GC情况从而验证GroovyClassLoader对JVM的影响。
代码A:Test1.java
import java.io.BufferedReader;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;import java.util.concurrent.ExecutorService;import java.util.concurrent.Executors;import java.util.concurrent.TimeUnit;import java.util.concurrent.atomic.AtomicInteger;import groovy.lang.GroovyClassLoader;public class Test { public static void main(String[] args) throws InterruptedException, IOException { final String code = readAll("DemoHandlerAImpl.groovy"); final AtomicInteger count = new AtomicInteger(0); ExecutorService executorService = Executors.newCachedThreadPool(); for (int i = 0; i < 100; i++) { executorService.execute(new Runnable() { @Override public void run() { while (true) { try { TimeUnit.SECONDS.sleep(2); } catch (InterruptedException e) { e.printStackTrace(); } Object object = parseClass(code); System.out.println("COUNT1=" + count.incrementAndGet() + ", " + object.hashCode()); } } }); } } static GroovyClassLoader classLoader = new GroovyClassLoader(); public static Object parseClass(String code){ return classLoader.parseClass(code); } public static String readAll(String logFile){ try { InputStream ins = null; BufferedReader reader = null; try { ins = new FileInputStream(Thread.currentThread().getContextClassLoader().getResource(logFile).getPath()); reader = new BufferedReader(new InputStreamReader(ins, "utf-8")); if (reader != null) { String content = null; StringBuilder sb = new StringBuilder(); while ((content = reader.readLine()) != null) { sb.append(content).append("\n"); } return sb.toString(); } } finally { if (ins != null) { try { ins.close(); } catch (IOException e) { e.printStackTrace(); } } if (reader != null) { try { reader.close(); } catch (IOException e) { e.printStackTrace(); } } } } catch (Exception e) { e.printStackTrace(); } return null; }}
代码2:Test2.java
import java.io.BufferedReader;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;import java.util.concurrent.ExecutorService;import java.util.concurrent.Executors;import java.util.concurrent.TimeUnit;import java.util.concurrent.atomic.AtomicInteger;import groovy.lang.GroovyClassLoader;public class Test2 { public static void main(String[] args) throws InterruptedException, IOException { final String code = readAll("DemoHandlerAImpl.groovy"); final AtomicInteger count = new AtomicInteger(0); ExecutorService executorService = Executors.newCachedThreadPool(); for (int i = 0; i < 100; i++) { executorService.execute(new Runnable() { @Override public void run() { while (true) { try { TimeUnit.SECONDS.sleep(2); } catch (InterruptedException e) { e.printStackTrace(); } Object object = parseClass(code); System.out.println("COUNT2=" + count.incrementAndGet() + ", " + object.hashCode()); } } }); } } static GroovyClassLoader classLoader = new GroovyClassLoader(); public static Object parseClass(String code){ classLoader = new GroovyClassLoader(); return classLoader.parseClass(code); } public static String readAll(String logFile){ try { InputStream ins = null; BufferedReader reader = null; try { ins = new FileInputStream(Thread.currentThread().getContextClassLoader().getResource(logFile).getPath()); reader = new BufferedReader(new InputStreamReader(ins, "utf-8")); if (reader != null) { String content = null; StringBuilder sb = new StringBuilder(); while ((content = reader.readLine()) != null) { sb.append(content).append("\n"); } return sb.toString(); } } finally { if (ins != null) { try { ins.close(); } catch (IOException e) { e.printStackTrace(); } } if (reader != null) { try { reader.close(); } catch (IOException e) { e.printStackTrace(); } } } } catch (Exception e) { e.printStackTrace(); } return null; }}
代码3:Test3.java
import java.io.BufferedReader;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;import java.util.concurrent.ExecutorService;import java.util.concurrent.Executors;import java.util.concurrent.TimeUnit;import java.util.concurrent.atomic.AtomicInteger;import groovy.lang.GroovyClassLoader;public class Test3 { public static void main(String[] args) throws InterruptedException, IOException { final String code = readAll("DemoHandlerAImpl.groovy"); final Object object = parseClass(code); final AtomicInteger count = new AtomicInteger(0); ExecutorService executorService = Executors.newCachedThreadPool(); for (int i = 0; i < 100; i++) { executorService.execute(new Runnable() { @Override public void run() { while (true) { try { TimeUnit.SECONDS.sleep(2); } catch (InterruptedException e) { e.printStackTrace(); } System.out.println("COUNT3=" + count.incrementAndGet() + ", " + object.hashCode()); } } }); } } static GroovyClassLoader classLoader = new GroovyClassLoader(); public static Object parseClass(String code){ classLoader = new GroovyClassLoader(); return classLoader.parseClass(code); } public static String readAll(String logFile){ try { InputStream ins = null; BufferedReader reader = null; try { ins = new FileInputStream(Thread.currentThread().getContextClassLoader().getResource(logFile).getPath()); reader = new BufferedReader(new InputStreamReader(ins, "utf-8")); if (reader != null) { String content = null; StringBuilder sb = new StringBuilder(); while ((content = reader.readLine()) != null) { sb.append(content).append("\n"); } return sb.toString(); } } finally { if (ins != null) { try { ins.close(); } catch (IOException e) { e.printStackTrace(); } } if (reader != null) { try { reader.close(); } catch (IOException e) { e.printStackTrace(); } } } } catch (Exception e) { e.printStackTrace(); } return null; }}
测试Groovy脚本:DemoHandlerAImpl.groovy
import java.util.Arrays;import java.util.HashMap;import java.util.HashSet;import java.util.List;import java.util.Map;import java.util.Set;/** * 场景A:托管 “配置信息” ,尤其适用于数据结构比较复杂的配置项 * 优点:在线编辑;推送更新;+ 直观; * @author xuxueli 2016-4-14 15:36:37 */public class DemoHandlerAImpl { public Object handle(Mapparams) { // 【基础类型配置】 boolean ifOpen = true; // 开关 int smsLimitCount = 3; // 短信发送次数阀值 String brokerURL = "failover:(tcp://127.0.0.1:61616,tcp://127.0.0.2:61616)"; // 套接字配置 // 【列表配置】 Set blackShops = new HashSet (); // 黑名单列表 blackShops.add(15826714); blackShops.add(15826715); blackShops.add(15826716); blackShops.add(15826717); blackShops.add(15826718); blackShops.add(15826719); // 【KV配置】 Map emailDispatch = new HashMap (); // 不同BU标题文案配置 emailDispatch.put(555, "淘宝"); emailDispatch.put(666, "天猫"); emailDispatch.put(777, "聚划算"); // 【复杂集合配置】 Map > openCitys = new HashMap >(); // 不同城市推荐商户配置 openCitys.put(11, Arrays.asList(15826714, 15826715)); openCitys.put(22, Arrays.asList(15826714, 15651231, 86451231)); openCitys.put(33, Arrays.asList(48612323, 15826715)); return smsLimitCount; }}
在系统运行四分钟后,Test1.java对应JVM的GC如图:
从日志可以发现,共解析groovy达38694次。
在系统运行四分钟后,Test2.java对应JVM的GC如图:
从日志可以发现,共解析groovy达39100次。
在系统运行四分钟后,Test3.java对应JVM的GC如图:
从日志可以发现,共解析groovy达40000次。
三、测试结果分析
通过观察内存曲线图,可以获取测试结果:
- Test1.java:Test1.java:PS MarkSweep有5次,PS Scavenge高达1210次,分散均匀;
- Test2.java:Test2.java:PS MarkSweep有5次,PS Scavenge达到485次,分散均匀;
- Test3.java:Test3.java:PS MarkSweep有0次,PS Scavenge仅5次,且仅在线程启动时触发PS Scavenge。
从上述测试结果可以得到结论:
- 1、Groovy类加载器,频繁解析Groovy代码将会导致PS MarkSweep;
- 2、单例Groovy类加载器,比非单例更容易导致PS Scavenge;
- 3、单例和多实例Groovy类加载器方式,PS MarkSweep基本一致,因为两种方式parseClass生成的Class数量基本一致,即占用的PermGen空间基本一致,所以两种方式在Full GC上的表现基本一致,如果要减少Full GC,减少parseClass才是根本解决方法;但是二者PS Scavenge却有数倍的差别,是因为单例方式parseClass过程中冗余大量的中间对象,这些中间对象会被PS Scavenge掉,不会引起大的问题。因此,减少parseClass次数才是解决的正途。
四、总结优化
- 1、为避免启动时Timeout,应该在项目完全预热完成后再切入线上环境;
- 2、避免在在单次调用时触发多次groovy脚本解析,解析过程本身比较耗时,可并行处理,或者将多个脚本合并为单个脚本;
- 3、针对每个groovy脚本解析后生成的Java对象实例做缓存,而不是代码本身做缓存;
- 4、仅仅在接收到清除缓存的广播时解析生成新的Java实例对象,避免groovy的频繁解析,减少Class装载频率;
- 5、周期性的异步刷新类加载器,避免因全局类加载器频繁parseClass导致的PS Scavenge。
PermGen回收
PermGen中对象回收规则:ClassLoader可以被回收,其下的所有加载过的没有对应实例的类信息(保存在PermGen)可被回收。因此,JVM回收之后,可以将GroovyClassLoader加载的冗余新信息回收掉。
但是。GC在JVM中通常是由一个或一组进程来实现的,它本身也和用户程序一样占用heap空间,运行时也占用CPU。因此,当GC运行时间较长时,用户能够感到 Java程序的停顿。因此,尽量避免GC。