如何降低Java垃圾回收开销

时间：2023-05-04

阅读：

Tip #1: 预测集合的容量

所有标准的 Java 集合，包括定制和扩展的实现(比如 Trove 和 Google 的 Guava),底层都使用了数组(原生数据类型或者基于对象的类型)。因为数组一旦被分配，其大小就不可变，因此添加元素到集合时，大多数情况下都会导致需要重新申请一个新的大容量数组替换老的数组（指集合底层实现使用的数组）。

即使没有提供集合初始化的大小，大多数集合的实现都尽量优化重新分配数组的处理并且将其开销平摊到最低。不过，在构造集合的时候就提供大小可以得到最佳的效果。

让我们将下面的代码作为一个简单的例子分析一下:

public static List reverse(List & lt; ? extends T & gt; list) {

List result = new ArrayList();

for (int i = list.size() - 1; i & gt; = 0; i--) {

result.add(list.get(i));

}

return result;

}

This method allocates a new array, then fills it up with items from another list, only in reverse order. 这个方法分配了一个新的数组，然后用另一个 list 中元素对该数组进行填充，只是元素的数序发生了变化。

这个处理方式可能会付出惨重的性能代价，其优化的点在添加元素到新的 list 中这行代码。随着每一次添加元素，list 都需要确保其底层数组拥有足够的位置来容纳新的元素。如果有空闲的位置，那么只是简单地将新元素存储到下一个空闲的槽位。如果没有的话，将分配一个新的底层数组，拷贝旧的数组内容到新的数组中，然后添加新的元素。这将导致多次分配数组，那些剩余的旧数组最终被 GC 所回收。

我们可以通过在构造集合时让其底层的数组知道它将存储多少元素，从而避免这些多余的分配

public static List reverse(List & lt; ? extends T & gt; list) {

List result = new ArrayList(list.size());

for (int i = list.size() - 1; i & gt; = 0; i--) {

result.add(list.get(i));

}

return result;

}

上面的代码通过 ArrayList 的构造器指定足够大的空间来存储 list.size() 个元素，在初始化时完成分配的执行，这意味着 List 在迭代的过程中无需再次分配内存。

Guava 的集合类则更进一步，允许初始化集合时明确指定期望元素的个数或者指定一个预测值。

2List result = Lists.newArrayListWithCapacity(list.size());

List result = Lists.newArrayListWithExpectedSize(list.size());

上面的代码中，前者用于我们已经准确地知道集合将要存储多少元素，而后者的分配方式考虑了错误预估的情况。

Tip #2:直接处理数据流

当处理数据流时，比如从一个文件读取数据或者从网络中下载数据，下面的代码是非常常见的：

1byte[] fileData = readFileToByteArray(new File("myfile.txt"));

所产生的字节数组可能被解析 XML 文档、JSON 对象或者协议缓冲消息，以及一些常见的可选项。

当处理大文件或者文件的大小无法预测时，上面的做法很是不明智的，因为当 JVM 无法分配一个缓冲区来处理真正文件时，就会导致OutOfMemeoryErrors。

即使数据的大小是可管理的，当到垃圾回收时，使用上面的模式依然会造成巨大的开销，因为它在堆中分配了一块非常大的区域来存储文件数据。

一种更加好的处理方式是使用合适的 InputStream (比如在这个例子中使用 FileInputStream)直接传递给解析器，不再一次性将整个文件读取到一个字节数组中。所有主流的开源库都提供相应的 API 来直接接受一个输入流进行处理,比如:

FileInputStream fis = new FileInputStream(fileName);

MyProtoBufMessage msg = MyProtoBufMessage.parseFrom(fis);

Tip #3: 使用不可变的对象

不变性有太多的好处。甚至不用我赘述什么。然而，有一个优点会对垃圾回收产生影响，应该关注一下。

一个不可变对象的属性在对象被创建后就不能被修改(在这里的例子使用的是引用数据类型的属性)，比如:

public class ObjectPAIr {

private final Object first;

private final Object second;

public ObjectPair(Object first, Object second) {

this.first = first;

this.second = second;

}

public Object getFirst() {

return first;

}

public Object getSecond() {

return second;

}

将上面的类实例化后会产生一个不可变对象—它的所有属性用 final 修饰,构造完成后就不能改变了。

不可变性意味着所有被一个不可变容器所引用的对象，在容器构造完成前对象就已经被创建。就 GC 而言：这个容器年轻程度至少和其所持有的最年轻的引用一样。这意味着当在年轻代执行垃圾回收的过程中，GC 因为不可变对象处于老年代而跳过它们，直到确定这些不可变对象在老年代中不被任何对象所引用时，才完成对它们的回收。

更少的扫描对象意味着对内存页更少的扫描，越少的扫描内存页就意味着更短的 GC 生命周期，也意味着更短的 GC 暂停和更好的总吞吐量。

Tip #4: 小心字符串拼接

字符串可能是在所有基于 JVM 应用程序中最常用的非原生数据结构。然而，由于其隐式地开销负担和简便的使用，非常容易成为占用大量内存的罪归祸首。

这个问题很明显不在于字符串字面值，而是在运行时分配内存初始化产生的。让我们快速看一下动态构建字符串的例子：

public static String toString(T[] array) {

String result = "[";

for (int i = 0; i & lt; array.length; i++) {

result += (array[i] == array ? "this" : array[i]);

if (i & lt; array.length - 1) {

result += ", ";

}

result += "]";

return result;

}

这是个看似不错的方法，接收一个字符数组然后返回一个字符串。但是这对于对象内存分配却是灾难性的。

很难看清这语法糖的背后，但是幕后的实际情况是这样的：

public static String toString(T[] array) {

String result = "[";

for (int i = 0; i & lt; array.length; i++) {

StringBuilder sb1 = new StringBuilder(result);

sb1.append(array[i] == array ? "this" : array[i]);

result = sb1.toString();

if (i & lt; array.length - 1) {

StringBuilder sb2 = new StringBuilder(result);

sb2.append(", ");

result = sb2.toString();

}

StringBuilder sb3 = new StringBuilder(result);

sb3.append("]");

result = sb3.toString();

return result;

}

字符串是不可变的，这意味着每发生一次拼接时，它们本身不会被修改，而是依次分配新的字符串。此外，编译器使用了标准的 StringBuilder 类来执行这些拼接操作。这就会有问题了，因为每一次迭代，既隐式地分配了一个临时字符串，又隐式分配了一个临时的 StringBuilder 对象来帮助构建最终的结果。

最佳的方式是避免上面的情况，使用 StringBuilder 和直接的追加，以取代本地拼接操作符(“+”)。下面是一个例子:

public static String toString(T[] array) {

StringBuilder sb = new StringBuilder("[");

for (int i = 0; i & lt; array.length; i++) {

sb.append(array[i] == array ? "this" : array[i]);

if (i & lt; array.length - 1) {

sb.append(", ");

}

sb.append("]");

return sb.toString();

}

这里，我们只在方法开始的时候分配了唯一的一个 StringBuilder。至此，所有的字符串和 list 中的元素都被追加到单独的一个StringBuilder中。最终使用 toString() 方法一次性将其转成成字符串返回。

Tip #5: 使用特定的原生类型的集合

Java 标准的集合库简单且支持泛型，允许在使用集合时对类型进行半静态地绑定。比如想要创建一个只存放字符串的 Set 或者存储 Map<Pair, List>这样的 map，这种处理方式是非常棒的。

真正的问题源于当我们想要使用一个 list 存储 int 类型，或者一个 map 存储 double 类型作为 value。因为泛型不支持原生数据类型，因此另外的一种选择是使用包装类型来进行替换，这里我们使用 List 。

这种处理方式是非常浪费的，因为一个 Integer 是一个完全的对象，一个对象的头部占用12个字节以及其内部的所维护的 int 属性，每个Integer 对象总共占用16个字节。这比起存储相同个数的 int 类型的 list 而言，其消耗的空间是它的四倍！比这个更加严重的问题在于，事实上因为 Integer 是真正的对象实例，因此它需要垃圾收集阶段被垃圾收集器所考虑是否要回收。

为了处理这个问题，我们在 Takipi 中使用非常棒的 Trove 集合库。Trove 摒弃了部分泛型的特定来支持特定的使用内存更高效的原生类型的集合。比如，我们使用非常消耗性能的 Map<Integer, Double>,在 Trove 中有另一种特别的选择方案，其形式为 TIntDoubleMap

TIntDoubleMap map = new TIntDoubleHashMap();

map.put(5, 7.0);

map.put(-1, 9.999);

...

Trove 的底层实现使用了原生类型的数组，所以当操作集合的时候不会发生元素的装箱(int->Integer)或者拆箱(Integer->int), 没有存储对象，因为底层使用原生数据类型存储。

在 Java 继承中，超类（父类）是通用类，定义了对象的行为和属性，而子类（派生类）从超类继承并扩展其功能。子类可以使用超类的非私有成员，并可以覆写超类的方法。多态：多态性允许一个对象

2024-03-17 02:02:13

Java对象导向编程中的封装与继承是程序设计中的基本概念，对于Java开发者来说至关重要。在面向对象的编程中，封装和继承是两个核心概念，理解它们对于构建可靠和可扩展的代码至关

2024-03-17 02:01:56

Java继承的灵活性在面向对象编程中发挥着重要作用，其中多态作为继承的一种表现形式，具有强大的功能和威力。通过多态，我们可以实现同一接口的不同表现，提高代码的可复用性和可扩

2024-03-17 02:01:37

Java继承是面向对象编程的核心概念之一，构建了类之间的层次结构。在这种结构中，子类继承父类的属性和方法，而父类又可以继承自祖先类。php小编苹果将为您详细介绍Java继承的层

2024-03-17 02:01:20

Java中的switch语句用于根据不同的条件执行不同的代码块。它可以替代较长的if-else if-else语句，使代码更加简洁易读。switch语句的基本语法如下：switch (expression) {case v

2024-03-17 02:00:59

Java类与对象是面向对象编程的核心概念，理解其基础原理至关重要。php小编鱼仔将为您揭开Java类与对象的神秘面纱，带您深入探索面向对象编程的精髓。通过本文，您将了解类和对象

2024-03-17 02:00:41

Java Servlet 是 Java Web 开发中的重要组件，掌握其高级技巧和最佳实践可以提升开发效率和代码质量。本文由 php小编柚子精心撰写，将为您深入探索 Java Servlet 的进阶之道，带

2024-03-17 02:00:23

Java Servlet 是开发 Java Web 应用程序的重要组件，然而在使用过程中难免会遇到各种故障和错误。本文将带领读者进入一场关于 Java Servlet 故障排除的旅程，探索常见问题和错

2024-03-17 02:00:03

作为Java Web开发的重要组成部分，Servlet扮演着连接前端与后端的桥梁角色。本指南将从入门到精通，为你揭示Servlet的工作原理、使用方法和高级技巧，助你在Web开发领域游刃有余

2024-03-17 01:59:42

Java JSON 处理一直是开发中的重要环节。通过高效处理 JSON 数据，可以提升应用程序性能。本文由 php小编百草为您介绍 Java 中关于 JSON 的处理技巧，帮助您更好地理解并运用这

2024-03-17 01:59:24

Java RESTful API 是一种用于构建 Web 服务的技术，具有高度灵活性和可扩展性。在这篇文章中，php小编鱼仔将为您介绍如何利用 Java RESTful API 构建一个动态的 Web 应用程序。

2024-03-17 01:59:01

从技术发展的角度出发，对Java RESTful API的未来趋势进行了深入探讨。文章展望了新技术和创新在这一领域的应用，分析了未来发展的方向和可能的变化，为读者呈现了一个关于Java R

2024-03-17 01:58:33

容器化的优势容器化技术带来了诸多优势，包括：隔离性和可移植性：容器将应用程序与底层基础设施隔离开来，确保应用在不同的环境中也能正常运行。弹性伸缩： Kubernetes 可以根据

2024-03-17 01:57:58

spring cloud Config：配置管理的艺术php小编苹果为您介绍Spring Cloud Config——一门配置管理的艺术。通过Spring Cloud Config，您可以实现配置的集中管理和动态刷

2024-03-17 01:57:39

Java RESTful API 与大数据分析的结合，为数据洞察力的提升带来了强大潜力。php小编子墨将为大家深度剖析这一融合应用的优势及技术实现，帮助读者更好地理解如何利用Java RESTf

2024-03-17 01:57:21

過度封裝：過度限制資料和方法的存取會導致程式碼變得僵化和難以維護。應適度地提供存取，同時保持資料的完整性。無效封裝：無效封裝會允許未經授權的存取，從而導致資料洩露和安

2024-03-17 01:53:54

Java 线程池是一种管理线程的机制，有助于提升并发程序的性能和效率。通过集中管理线程资源，线程池可以避免线程创建和销毁的开销，减少内存消耗，并提高代码的可维护性。创建线程

2024-03-17 01:53:33

MapStruct Plus 是 MapStruct 的增强工具，在 Mapstruct 的基础上，实现了自动生成 Mapper 接口的功能，并强化了部分功能，使 Java 类型转换更加便捷、优雅。MapStructPlus官网此次

2024-03-17 01:39:15

我们都知道，我们写的Java程序需要先经过编译，生成了.class文件（字节码文件）。然而，计算机并不能直接解释.class文件里面的内容，这时候就需要一个能加载、解释.class文件并且能按.c

2024-03-15 20:58:13

引言在复杂的应用程序设计中，尤其是那些涉及多个状态变迁和业务流程控制的场景，有限状态机（Finite State Machine, FSM）是一种强大而有效的建模工具。Spring框架为此提供了Sprin

2024-03-12 12:05:41

面向对象编程（OOP）是一个将现实世界抽象为一系列对象的编程范式，这些对象通过消息传递机制来互相交流和协作。OOP 的主要特性包括四个基本概念：封装（Encapsulation）、继承（Inherit

2024-03-11 18:44:45

前言在做SpringBoot项目的过程中，有时客户会提出按照指定时间执行一次业务的需求。如果客户需要改动业务的执行时间，即动态地调整定时任务的执行时间，那么可以采用Spring

2024-03-11 18:39:05

前言不知道大家在开发的时候，有没有想过（遇到）这些问题：大家都是按需要开发，都是一个职级的同事，为什么有些人的思路就很清晰，代码也很整洁、易懂；而自己开发，往往不知道怎么下手设

2024-03-11 18:38:21

目录前言一、枚举类的注解二、RESTful 接口三、类属性转换四、Stream 流五、判空和断言 5.1判空部分 5.2断言部分文章小结前言笔者目前从事一线 Java 开发今年

2024-03-11 18:37:52

目录前言一、代码优化 1.1Stream 流自分页 1.2数据库分页 1.3其它思考二、硬件配置 2.1云服务器配置三、文章小结前言OOM 几乎是笔者工作中遇到的线上 bug 中

2024-03-11 18:37:25

目录前言一、JSON 回顾 1.1结构形式二、其它类型 -> JSON相关 2.1 JavaBean 转 JsonObject 2.2 JavaBean 转 Json 字符串 2.3 List 转 JsonArray 2.4 List 转Jso

2024-03-11 18:36:19

在Spring Boot的应用开发中，MyBatis是一个非常流行的持久层框架，它支持定制化SQL、存储过程以及高级映射。在本篇文章中，我们将学习如何在Spring Boot项目中集成MyBatis，以便通

2024-03-11 00:05:13

JAR 包要在预装 JRE 环境的系统上执行。如果没有预先安装 JRE 环境，又想直接运行 Java 程序，该怎么办呢？这篇文章我们会先学习如何将 Java 程序打包成一个可执行的 Java JAR 文

2024-03-08 22:43:01

介绍供应商接口（Supplier Interface）是 Java 8 引入的 java.util.function 包的一部分，用于在 Java 中实现函数式编程。它表示一个函数，该函数不接收任何参数，但会产生一个类型为

2024-03-08 22:31:58

泛型是什么？等你使用java逐渐深入以后会了解或逐步使用到Java泛型。Java 中的泛型是 JDK 5 中引入的功能之一。"Java 泛型 "是一个技术术语，表示一组与定义和使用泛型类型和方

2024-03-08 22:30:26

2021-02-06

2020-09-18

2020-12-12

2020-05-05

2020-11-20

2021-01-09

2020-09-25

2021-02-06

2021-03-07

2020-09-27

如何降低Java垃圾回收开销

Java 继承的迷宫：导航超类、子类和多态

Java 对象导向编程中的封装与继承：理解基本原则

Java 继承的灵活性：多态的威力

Java 继承的层次结构：子类、父类和祖先

Java switch的用法是什么

揭开 Java 类与对象的神秘面纱：理解对象导向的基础

Java Servlet 的进阶之道：探索高级技巧和最佳实践

Java Servlet 故障排除之旅：解决常见问题和错误

揭秘 Java Servlet：深入浅出的终极指南

Java JSON 处理：提高应用程序性能的利器

Java RESTful API 的实战应用：构建一个动态的 Web 应用程序

Java RESTful API 的未来趋势：展望新技术和创新

Spring Cloud Kubernetes：拥抱容器化，让你的应用驰骋云海

Spring Cloud Config：配置管理的艺术，让你的应用弹性十足

Java RESTful API 与大数据分析的结合：解锁数据洞察力的强大潜力

Java 封装与继承的陷阱和最佳实践：避免常见的错误

Java 线程池实战：提升程序性能与效率

MapStructPlus 1.4.0 发布，体积更轻量！性能更强！

JVM内存结构

Spring状态机（FSM），让订单状态流转如丝般顺滑

『Java 语法基础』面向对象有哪些特性

Spring动态定时任务之ScheduledTaskRegistrar

分享 Java 开发中常用到的设计模式

Java 实际开发中积累的几个小技巧

Java 互联网项目如何防止集合堆内存溢出（一）

日常工作中关于 JSON 转换的经验大全（Java）

从零开始学Spring Boot系列-集成mybatis

Jpackage-制作无需预装Java环境的Jar可执行程序

Java 8 Supplier函数式接口介绍及代码样例

Java核心之细说泛型

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道