能够提高Java应用性能的编码建议

Posted 2023-04-05 XUchenmp

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了能够提高Java应用性能的编码建议相关的知识，希望对你有一定的参考价值。

前言

如果对GC（垃圾收集）有一定了解的读者可跳过该部分直接阅读正文。
现代垃圾收集器都有STW（stop the world：进行GC时整个应用程序都会暂停，就像是整个世界都暂停了一样）这个困扰，因为程序在运行时对象的引用关系是在不断的发生变换的，所以需要暂停用户线程才能更安全的进行GC操作。也就是说GC操作会降低应用程序的性能。
既然GC会降低性能，那么减少GC操作就能提升性能（这个前提是同一款垃圾收集器，STW相同的情况下。CMS触发GC的次数可能会比G1的少，但是可能CMS性能不比G1的好），最直观的办法就是减少应用程序中的垃圾，垃圾减少了GC（垃圾回收）自然也会减少。

正文

1、资源共享的情况下，尽可能的使用单例模式

最有力的论证就是Spring的Bean默认情况下是单例，因为大部分的Bean都是无状态（只做处理，不存储信息）的，因此这些Bean基本都能够共享。Spring也确实是这么做的，他把作用域为单例的Bean都做了一个缓存，避免创建大量的垃圾。
Q：那么有状态的Bean能否使用单例模式？
A：这就要根据具体的使用场景自行衡量利弊。比如在Service中需要有那么几个属性存储一些信息，这种情况下仍然建议使用单例模式，对于存储信息的属性可以使用ThreadLocal或者synchronized保证其线程安全。对于类似于实体类这样的Java Bean，他们存在的目的可能就是为了存储信息，这种情况下就没必要使用单例，一般也不会有开发者把Java Bean注册为Spring Bean。（这里补充一个知识点，Spring Bean是被Spring管理的对象，而Java Bean是一种规范，他们两个没有什么关联关系，别搞混了）

2、存在多个相同对象时，考虑使用享元模式

最有力的论证就是大家常用的装箱基本类型Integer，Integer缓存了-128到127的Integer实例，如果通过Integer.valueOf()获取一个在此范围内的Integer实例，那么你会发现无论获取多少次他们都是一样的，甚至可以用==来判断他们是否相等。当然new Integer()和Integer.valueOf()获取的实例还是只能用equals()判断是否相等，因为new代表的是创建一个新对象，与Integer的缓存无关。所以在获取对象实例时能用静态方法就不要用new，这一点在《Effective Java》中也提到了第1条:用静态工厂方法代替构造器，静态方法的好处并不只是为了使用缓存，具体内容可自行阅读原书籍。

3、对于全是静态方法的工具类，把构造器进行私有化

关于这一点我没有去找一些工具类举例，但是不难论证，如果一个类全是静态方法，那么这个类也没有实例化的必要，因为将这个类实例化将毫无用处。所以建议把构造器私有化，以防止客户端对这个类进行不必要的实例化操作。

4、基本类型优先于装箱基本类型

虽然说Java的自动拆装箱开发者提供了便利，但是这容易让开发者在编写代码时没有意识到程序会进行自动拆装箱。无意识拆装箱浪费一些内存倒还算是小事，还很容易发生逻辑错误（比如说自动装箱后用==判断是否相等），更要命的是这种错误无法被编译器发现。本篇文章内容只讨论内存方面的问题，只是顺带提一嘴，就不展开讲了。

	Runtime runtime = Runtime.getRuntime();
	System.out.println("第一段代码执行前的空余内存:"+runtime.freeMemory());
	//第一段代码
	int sum = 1000;
	for (int i = 0; i < 100000; i++) 
	    sum += i;
	
	Integer sumInteger = Integer.valueOf(sum);
	System.out.println("第一段代码执行后的空余内存:"+runtime.freeMemory());
	//第二段代码
	Integer sum2 = 1000;
	for (int i = 0; i < 100000; i++) 
	    sum2 += i;
	
	System.out.println("第二段代码执行后的空余内存:"+runtime.freeMemory());


运行结果：
第一段代码执行前的空余内存:249999128
第一段代码执行后的空余内存:249999128
第二段代码执行后的空余内存:248667424

可以看到两段功能一样的代码，使用的内存大小却是天壤之别。原因就是第一段代码是用基本类型进行计算，计算完成后再转成Integer，也就是这一段代码只创建了一个Integer对象。而第二段代码因为sum2是包装类型，并且直接在循环中参与了运算，每次运算都会进行自动拆装箱，产生新的Integer，10万次循环也就是产生了10万个Integer实例。所以能使用基本类型的时候就不要用装箱基本类型。

5、在使用容器类时，指定初始化大小以减少容器扩容操作

如果读者了解容器自动扩容的原理，那就应该知道，容器在扩容时不断的复制原容器的内容后丢弃原容器的内容，也就是说容器在不断的扩容就会不断的产生垃圾。

	Runtime runtime = Runtime.getRuntime();
	System.out.println("第一段代码执行前的空余内存:"+runtime.freeMemory());
	//第一段代码
	int sum = 1000;
	for (int i = 0; i < 100000; i++) 
	    sum += i;
	
	Integer sumInteger = Integer.valueOf(sum);
	System.out.println("第一段代码执行后的空余内存:"+runtime.freeMemory());
	//第二段代码
	Integer sum2 = 1000;
	for (int i = 0; i < 100000; i++) 
	    sum2 += i;
	
	System.out.println("第二段代码执行后的空余内存:"+runtime.freeMemory());

运行结果：
第一段代码执行前的空余内存:244139
第一段代码执行后的空余内存:243259
第二段代码执行后的空余内存:242869

从运行结果可以发现第一段代码正是因为在不断的扩容，占用的内存比第二段代码多了约500k，所以如果能提前知道需要多大的容器，在创建容器时就指定容器初始化大小，哪怕是估算的也比容器自动大量扩容要好。

总结

核心思想就是减少在堆中创建垃圾（应用程序在运行过程中创建垃圾是不可避免的事）。但是我为什么不说减少类的实例化操作呢？因为现在的虚拟机不一定只能够在堆中分配内存，有可能类的实例化分配的内存是在栈上。具体可自行学习栈上分配、逃逸分析等相关内容，在我的上篇博客《Java开发的一些编码建议》结语中也有些许介绍。

The WAY to 优化JAVA程序设计和编码，提高JAVA性能

通过使用一些辅助性工具来找到程序中的瓶颈，然后就可以对瓶颈部分的代码进行优化。一般有两种方案：即优化代码或更改设计方法。我们一般会选择后者，因为不去调用以下代码要比调用一些优化的代码更能提高程序的性能。而一个设计良好的程序能够精简代码，从而提高性能。

　　下面将提供一些在JAVA程序的设计和编码中，为了能够提高JAVA程序的性能，而经常采用的一些方法和技巧。

　　1．对象的生成和大小的调整。

　　JAVA程序设计中一个普遍的问题就是没有好好的利用JAVA语言本身提供的函数，从而常常会生成大量的对象（或实例）。由于系统不仅要花时间生成对象，以后可能还需花时间对这些对象进行垃圾回收和处理。因此，生成过多的对象将会给程序的性能带来很大的影响。

　　例1：关于String ,StringBuffer，+和append

　　JAVA语言提供了对于String类型变量的操作。但如果使用不当，会给程序的性能带来影响。如下面的语句：

String name=new String("HuangWeiFeng");   
System.out.println(name+"is my name");

　　看似已经很精简了，其实并非如此。为了生成二进制的代码，要进行如下的步骤和操作：

(1) 生成新的字符串 new String（STR_1);
(2) 复制该字符串;
(3) 加载字符串常量"HuangWeiFeng"（STR_2);
(4) 调用字符串的构架器（Constructor）;
(5) 保存该字符串到数组中（从位置0开始）;
(6) 从java.io.PrintStream类中得到静态的out变量;
(7) 生成新的字符串缓冲变量new StringBuffer(STR_BUF_1);
(8) 复制该字符串缓冲变量;
(9) 调用字符串缓冲的构架器（Constructor）;
(10) 保存该字符串缓冲到数组中（从位置1开始）;
(11) 以STR_1为参数，调用字符串缓冲(StringBuffer)类中的append方法;
(12) 加载字符串常量"is my name"(STR_3);
(13) 以STR_3为参数，调用字符串缓冲(StringBuffer)类中的append方法;
(14) 对于STR_BUF_1执行toString命令;
(15) 调用out变量中的println方法，输出结果。

　　由此可以看出，这两行简单的代码，就生成了STR_1,STR_2,STR_3,STR_4和STR_BUF_1五个对象变量。这些生成的类的实例一般都存放在堆中。堆要对所有类的超类，类的实例进行初始化，同时还要调用类极其每个超类的构架器。而这些操作都是非常消耗系统资源的。因此，对对象的生成进行限制，是完全有必要的。

　　经修改，上面的代码可以用如下的代码来替换。

StringBuffer name=new StringBuffer("HuangWeiFeng"); 
System.out.println(name.append("is my name.").toString());

　　系统将进行如下的操作：

(1) 生成新的字符串缓冲变量new StringBuffer(STR_BUF_1);
(2) 复制该字符串缓冲变量;
(3) 加载字符串常量"HuangWeiFeng"(STR_1);
(4) 调用字符串缓冲的构架器（Constructor）;
(5) 保存该字符串缓冲到数组中（从位置1开始）;
(6) 从java.io.PrintStream类中得到静态的out变量;
(7) 加载STR_BUF_1;
(8) 加载字符串常量"is my name"(STR_2);
(9) 以STR_2为参数，调用字符串缓冲(StringBuffer)实例中的append方法;
(10) 对于STR_BUF_1执行toString命令(STR_3);
(11)调用out变量中的println方法，输出结果。

　　由此可以看出，经过改进后的代码只生成了四个对象变量：STR_1,STR_2,STR_3和STR_BUF_1.你可能觉得少生成一个对象不会对程序的性能有很大的提高。但下面的代码段2的执行速度将是代码段1的2倍。因为代码段1生成了八个对象，而代码段2只生成了四个对象。

　　代码段1：

String name= new StringBuffer("HuangWeiFeng");   
name+="is my";   
name+="name";

　　代码段2：

StringBuffer name=new StringBuffer("HuangWeiFeng");   
name.append("is my");   
name.append("name.").toString();

　　因此，充分的利用JAVA提供的库函数来优化程序，对提高JAVA程序的性能时非常重要的.其注意点主要有如下几方面；

(1) 尽可能的使用静态变量（Static Class Variables）

如果类中的变量不会随他的实例而变化，就可以定义为静态变量，从而使他所有的实例都共享这个变量。

例：

public class foo 
{ 
SomeObject so=new SomeObject(); 
}

就可以定义为：

public class foo 
{ 
static SomeObject so=new SomeObject(); 
}

(2) 不要对已生成的对象作过多的改变。

　　对于一些类(如：String类)来讲，宁愿在重新生成一个新的对象实例，而不应该修改已经生成的对象实例。

例：

String name="Huang"; 
name="Wei"; 
name="Feng";

　　上述代码生成了三个String类型的对象实例。而前两个马上就需要系统进行垃圾回收处理。如果要对字符串进行连接的操作，性能将得更差，因为系统将不得为此生成更多得临时变量，如上例1所示。

(3) 生成对象时，要分配给它合理的空间和大小JAVA中的很多类都有它的默认的空间分配大小。对于StringBuffer类来讲，默认的分配空间大小是16个字符。如果在程序中使用StringBuffer的空间大小不是16个字符，那么就必须进行正确的初始化。

(4) 避免生成不太使用或生命周期短的对象或变量。对于这种情况，因该定义一个对象缓冲池。以为管理一个对象缓冲池的开销要比频繁的生成和回收对象的开销小的多。

(5) 只在对象作用范围内进行初始化。JAVA允许在代码的任何地方定义和初始化对象。这样，就可以只在对象作用的范围内进行初始化。从而节约系统的开销。

例：

SomeObject so=new SomeObject(); 
If(x==1) then 
{ 
Foo=so.getXX(); 
} 

可以修改为： 
if(x==1) then 
{ 
SomeObject so=new SomeObject(); 
Foo=so.getXX(); 
}

2．异常(Exceptions)

　　JAVA语言中提供了try/catch来发方便用户捕捉异常，进行异常的处理。但是如果使用不当，也会给JAVA程序的性能带来影响。因此，要注意以下两点：

(1) 避免对应用程序的逻辑使用try/catch
　　如果可以用if,while等逻辑语句来处理，那么就尽可能的不用try/catch语句。

(2) 重用异常
　　在必须要进行异常的处理时，要尽可能的重用已经存在的异常对象。以为在异常的处理中，生成一个异常对象要消耗掉大部分的时间。

3. 线程(Threading)

　　一个高性能的应用程序中一般都会用到线程。因为线程能充分利用系统的资源。在其他线程因为等待硬盘或网络读写而时，程序能继续处理和运行。但是对线程运用不当，也会影响程序的性能。

例2：正确使用Vector类
　　Vector主要用来保存各种类型的对象（包括相同类型和不同类型的对象）。但是在一些情况下使用会给程序带来性能上的影响。这主要是由Vector类的两个特点所决定的。第一，Vector提供了线程的安全保护功能。即使Vector类中的许多方法同步。但是如果你已经确认你的应用程序是单线程，这些方法的同步就完全不必要了。第二，在Vector查找存储的各种对象时，常常要花很多的时间进行类型的匹配。而当这些对象都是同一类型时，这些匹配就完全不必要了。因此，有必要设计一个单线程的，保存特定类型对象的类或集合来替代Vector类.用来替换的程序如下（StringVector.java）：

public class StringVector   
{   
private String [] data;   
private int count;   
public StringVector()   
{   
this(10); // default size is 10   
}   
public StringVector(int initialSize)   
{   
data = new String[initialSize];   
}   
public void add(String str)   
{   
// ignore null strings   
if(str == null) { return; }   
ensureCapacity(count + 1);   
data[count++] = str;   
}   
private void ensureCapacity(int minCapacity)   
{   
int oldCapacity = data.length;   
if (minCapacity > oldCapacity)   
{   
String oldData[] = data;   
int newCapacity = oldCapacity * 2;   
data = new String[newCapacity];   
System.arraycopy(oldData, 0, data, 0, count);   
}   
}   
public void remove(String str)   
{   
if(str == null) { return; // ignore null str }   
for(int i = 0; i < count; i++)   
{   
// check for a match   
if(data[i].equals(str))   
{   
System.arraycopy(data,i+1,data,i,count-1); // copy data   
// allow previously valid array element be gc′d   
data[--count] = null;   
return;   
}   
}   
}   
public final String getStringAt(int index)   
{   
if(index < 0) { return null; }   
else if(index > count) { return null; // index is > # strings }   
else { return data[index]; // index is good }   
}   
}

因此，代码：

Vector Strings=new Vector(); 
Strings.add("One"); 
Strings.add("Two"); 
String Second=(String)Strings.elementAt(1);

可以用如下的代码替换：

StringVector Strings=new StringVector(); 
Strings.add("One"); 
Strings.add("Two"); 
String Second=Strings.getStringAt(1);

　　这样就可以通过优化线程来提高JAVA程序的性能。用于测试的程序如下（TestCollection.java）:

import java.util.Vector;   
public class TestCollection   
{   
public static void main(String args [])   
{   
TestCollection collect = new TestCollection();   
if(args.length == 0)   
{   
System.out.println("Usage: java TestCollection [ vector | stringvector ]");   
System.exit(1);   
}   
if(args[0].equals("vector"))   
{   
Vector store = new Vector();   
long start = System.currentTimeMillis();   
for(int i = 0; i < 1000000; i++)   
{   
store.addElement("string");   
}   
long finish = System.currentTimeMillis();   
System.out.println((finish-start));   
start = System.currentTimeMillis();   
for(int i = 0; i < 1000000; i++)   
{   
String result = (String)store.elementAt(i);   
}   
finish = System.currentTimeMillis();   
System.out.println((finish-start));   
}   
else if(args[0].equals("stringvector"))   
{   
StringVector store = new StringVector();   
long start = System.currentTimeMillis();   
for(int i = 0; i < 1000000; i++) { store.add("string"); }   
long finish = System.currentTimeMillis();   
System.out.println((finish-start));   
start = System.currentTimeMillis();   
for(int i = 0; i < 1000000; i++) {   
String result = store.getStringAt(i);   
}   
finish = System.currentTimeMillis();   
System.out.println((finish-start));   
}   
}   
}

　　关于线程的操作，要注意如下几个方面：

(1) 防止过多的同步
　　如上所示，不必要的同步常常会造成程序性能的下降。因此，如果程序是单线程，则一定不要使用同步。

(2) 同步方法而不要同步整个代码段
　　对某个方法或函数进行同步比对整个代码段进行同步的性能要好。

(3) 对每个对象使用多”锁”的机制来增大并发。
　　一般每个对象都只有一个”锁”，这就表明如果两个线程执行一个对象的两个不同的同步方法时，会发生”死锁”。即使这两个方法并不共享任何资源。为了避免这个问题，可以对一个对象实行”多锁”的机制。如下所示：

class foo 
{ 
private static int var1; 
private static Object lock1=new Object(); 
private static int var2; 
private static Object lock2=new Object(); 
public static void increment1() 
{ 
synchronized(lock1) 
{ 
var1++; 
} 
} 
public static void increment2() 
{ 
synchronized(lock2) 
{ 
var2++; 
} 
} 
}

4．输入和输出(I/O)

　　输入和输出包括很多方面，但涉及最多的是对硬盘，网络或数据库的读写操作。对于读写操作，又分为有缓存和没有缓存的；对于数据库的操作，又可以有多种类型的JDBC驱动器可以选择。但无论怎样，都会给程序的性能带来影响。因此，需要注意如下几点：

(1) 使用输入输出缓冲
　　尽可能的多使用缓存。但如果要经常对缓存进行刷新（flush）,则建议不要使用缓存。

(2) 输出流(Output Stream)和Unicode字符串
　　当时用Output Stream和Unicode字符串时，Write类的开销比较大。因为它要实现Unicode到字节(byte)的转换.因此，如果可能的话,在使用Write类之前就实现转换或用OutputStream类代替Writer类来使用。

(3) 当需序列化时使用transient
　　当序列化一个类或对象时，对于那些原子类型（atomic）或可以重建的原素要表识为transient类型。这样就不用每一次都进行序列化。如果这些序列化的对象要在网络上传输，这一小小的改变对性能会有很大的提高。

(4) 使用高速缓存（Cache）
　　对于那些经常要使用而又不大变化的对象或数据，可以把它存储在高速缓存中。这样就可以提高访问的速度。这一点对于从数据库中返回的结果集尤其重要。

(5) 使用速度快的JDBC驱动器（Driver）
　　JAVA对访问数据库提供了四种方法。这其中有两种是JDBC驱动器。一种是用JAVA外包的本地驱动器；另一种是完全的JAVA驱动器。具体要使用哪一种得根据JAVA布署的环境和应用程序本身来定。

5.一些其他的经验和技巧

(1) 使用局部变量。
(2) 避免在同一个类中动过调用函数或方法(get或set)来设置或调用变量。
(3) 避免在循环中生成同一个变量或调用同一个函数（参数变量也一样）。
(4) 尽可能的使用static,final,private等关键字。
(5) 当复制大量数据时，使用System.arraycopy()命令。

以上是关于能够提高Java应用性能的编码建议的主要内容，如果未能解决你的问题，请参考以下文章