涤生

1 分钟阅读

现代 Java 应用程序有大量的字符串操作,例如,Web 服务 API 调用(即 JSON、REST、SOAP 等)、外部数据源调用(SQL、从 DB 返回的数据等)以及文本解析和文本创建等。因此,字符串对象很容易就占据了约至少 30% 的内存。然而,这些 String 对象中的大多数都是重复的,这些字符串的重复浪费了大量内存。因此,优化重复字符串对象浪费的内存是 Java 非常受欢迎的功能之一。在 G1 中,Java 就对此功能做了支持。

G1 做了什么?

G1 GC 算法运行时,它将从内存中删除垃圾对象。它还从内存中删除重复的字符串对象(字符串重复数据删除)。可以通过设置以下 JVM 参数来激活此功能:

-XX:+UseG1GC -XX:+UseStringDeduplication

注意1:为了使用此功能, 需要在 Java 8 update 20 或更高版本上运行。 注意2:为了使用-XX:+UseStringDeduplication,您需要使用 G1 GC 算法。

让我们看一个例子吧

选择这个简单的示例就是为了研究 JVM 如何处理重复的字符串。让我们通过这个简单的程序来验证 Java 的这个功能。

 public class StringDeduplicationExample {

 public static List<String>myStrings = new ArrayList<>();

 public static void main(String[] args) throws Exception {

   for (int counter = 0; counter < 200; ++counter) {

     for (int secondCounter = 0; secondCounter < 1000; ++secondCounter) {
       // Add it 1000 times.
       myStrings.add(("Hello World-" + counter));
     }

     System.out.println("Hello World-" + counter + " has been added 1000 times");
   }
 }
}

这个程序非常简单,主要就是创建字符串对象:

  • 1000 个“ Hello World-0”字符串实例
  • 1000 个“ Hello World-1”字符串实例
  • 1000 个“ Hello World-2”字符串实例
  • 1000 个“ Hello World-199”字符串实例

我们使用两组不同的 JVM 参数来运行这个程序。

第一组

第一次通过设置-XX:+UseStringDeduplicationJVM 参数来运行程序。即:

-Xmx20M -XX:+UseG1GC -XX:+UseStringDeduplication

第二组

第二次,不设置-XX:+UseStringDeduplication参数的情况下运行同一程序:

-Xmx20M -XX:+UseG1GC

在这两次运行中,我们都捕获了堆的 Dump 信息,并通过堆的 Dump 分析工具HeapHero.io对其进行了分析。 HeapHero.io 会检测由于各种无效的编程习惯而浪费的内存量,当然也包括由于重复的字符串而浪费的内存量。

以下是 HeapHero.io 生成的报告: 1. 第一组 Heap Dump 分析报告 2. 第二组 Heap Dump 分析报告

这是该报告中一些有趣的发现:

第一组(配置相关参数) 第二组(未配置相关参数)
总体堆使用量 7.94MB 15.89MB
字符串对象的总数 206K 206K
字符串重复而浪费的内存 5.6MB 13.81MB

即使运行的是相同的代码,在运行第一组(配置了-XX:+UseStringDeduplication)中,你可以看到总体堆使用量为 7.94MB,而在运行第二组(未配置了-XX:+UseStringDeduplication)中,则总体堆使用量为 15.89MB。 即使在两次运行中都有相等数量的字符串对象(206K),由于运行第一组中重复的字符串而浪费的内存量为 5.6MB,而在运行第二组中重复的字符串而浪费的内存量为 13.81MB。 由于使用了-XX:+UseStringDeduplication参数,从应用程序中删除了大量重复字符串,从而大幅度减少内存消耗。 因此,你可以利用-XX:+UseG1GC -XX:+UseStringDeduplication来减少重复字符串导致的内存浪费,它会减少应用程序的整体内存占用。

作者:Ram Lakshmanan,原文:G1 GC: Reducing Memory Consumption by 20%


涤生的博客。

转载请注明原创出处,谢谢!

欢迎关注我的微信公众号:「涤生的博客」,获取更多技术分享。

涤生-微信公共号