Java入门系列之字符串特性

Posted jeffckywang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java入门系列之字符串特性相关的知识,希望对你有一定的参考价值。

前言

上一节我们讲解到字符串本质上就是字符数组,同时详细讲解了字符串判断相等需要注意的地方,本节我们来深入探讨字符串特性,下面我们一起来看看。

不可变性

我们依然借助初始化字符串的方式来探讨字符串的不可变性,如下:

String str = "Jeffcky";
System.out.println(str);

技术图片

上述我们通过字面量的方式来创建字符串,接下来我们对字符串str进行如下操作:

String str = "Jeffcky";
str.substring(0,3).concat("wang").toLowerCase().trim(); 
System.out.println(str);

技术图片

我们看到针对str字符串进行截取、连接、小写等操作后,字符串的值依然未发生改变,这就是字符串的不可变性,我们通过查看任意一个对字符串操作的方法,比如concat方法源码:

public String concat(String str) 
        int otherLen = str.length();
        if (otherLen == 0) 
            return this;
        
        int len = value.length;
        char buf[] = Arrays.copyOf(value, len + otherLen);
        str.getChars(buf, len);
        return new String(buf, true);

通过查看concat源码得出:原始的str值永远都没有发生改变,它的值只是被复制,然后将我们连接的文本添加到复制的副本里,最后返回一个新的String。所以到这里我们知道针对字符串的操作都是复制一份字符串,然后对复制后的字符串进行操作,最终返回一个新的String对象。

字符串池

我们再来看看上一节所给出的代码示例,如下:

public class Main 
    public static void main(String[] args) 
        String str1 = "Jeffcky";
        String str2 = "Jeffcky";
        System.out.println(str1 == str2);
        System.out.println(str1.equals(str2));
    

技术图片

当我们实例化一个String时(在本例中为Jeffcky)保存在Java堆内存(用于所有Java对象的动态内存分配)中。虽然在这个例子中我们有两个不同的引用变量,但它们都只是指Java Heap Memory中的同一内存位置,虽然看起来有两个不同的String对象,但实际上只有一个,而str2永远不会被实例化为对象,而是在内存中分配对应于str1的对象,这是因为Java针对字符串进行了优化处理,每次要实例化此类String对象时,都会将要添加到堆内存的值与先前添加的值进行比较,如果值已存在,则不初始化对象,并将值分配给引用变量,这些值保存在名叫“字符串池”中,该字符串池包含所有文字字符串值,当然我们可以通过new运算符绕过这种情况。

为什么字符串是不可变或final呢? 

上述我们通过例子说明了字符串的不可变性特性,那么为什么字符串是不可变的呢?可以参考知乎回答:《https://www.zhihu.com/question/31345592》。我认为主要在于有效共享对象,节省内存空间。当程序运行时,创建的String实例的数量也会增长,如果不缓存String常量,堆空间中会有大量的String,占用内存空间,所以String对象被创建后缓存在字符串池中,若缓存的字符串被多个客户端共享,此时一个客户端的操作修改了字符串则影响到其他客户端,因此通过字符串的不可变性来规避这种风险,同时通过缓存和共享字符串常量,JVM为Java应用程序节省内存。

有了字符串不可变性,可以很安全的被多线程所共享,我们不用担心线程同步问题,确保线程安全。

有了字符串不可变性,可以很好的使用比如HashMap,我们能正确检索到存储到HashMap中的对象,若字符串可变且在插入到HashMap后并修改了字符串内容,此时将会出现丢失对应字符串所映射的对象。

有了字符串不可变性,此时会缓存字符串哈希码,所以每次调用字符串的hashcode方法时都不用计算,使得在HashMap中使用键非常快。

其他等等......

接下来我们一起来通过源码的方式来看看String的实现,如下:

public class Main 
    public static void main(String[] args) 
        char a[] = j, e, f, f, c, k, y;
        String str = new String(a);
        System.out.println(str);
    

我们通过字符数组创建字符串的方式去查看源码,如下:

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence 
    /** The value is used for character storage. */
    private final char value[];

    /**
     * Initializes a newly created @code String object so that it represents
     * an empty character sequence.  Note that use of this constructor is
     * unnecessary since Strings are immutable.
     */
    public String() 
        this.value = new char[0];
    

    /**
     * Allocates a new @code String so that it represents the sequence of
     * characters currently contained in the character array argument. The
     * contents of the character array are copied; subsequent modification of
     * the character array does not affect the newly created string.
     *
     * @param  value
     *         The initial value of the string
     */
    public String(char value[]) 
        this.value = Arrays.copyOf(value, value.length);
    
    
    ...

我们看到字符串对象定义为final(当前我们还未学到final,我们只需要知道通过final关键字修饰说明该类不可继承),网上有很多例子说字符串对象通过final关键字修饰,说明字符串不可变,其实这种说法是不严谨且错误的。String通过final关键字修饰的原因在于:确保不能通过扩展和覆盖行为来破坏String类的不可变性而非说明字符串不可变。比如,如下例子:

public class Main 
    public static void main(String[] args) 
        String str1 = "Jeffcky";
        String str2 = "Jeffcky".toUpperCase();
        System.out.println(str1);
        System.out.println(str2);
    

技术图片

现在字符串str2为"Jeffcky".toUpperCase(),我们将同一个对象修改为“JEFFCKY”,如果修改了字符串变量,其他字符串变量也将自动受到影响,比如str1也将是"JEFFCKY",很显然是不可取的。

总结

本文我们详细介绍了字符串的不可变、字符串池特性,同时解释了字符串为何不可变,以及说明字符串类定义为final,并不是说明其不可变,只是为了不允许通过扩展或覆盖来破坏字符串的不可变性。

以上是关于Java入门系列之字符串特性的主要内容,如果未能解决你的问题,请参考以下文章

Java入门系列之StringBuilderStringBuffer

Java入门系列之StringBuilderStringBuffer

Java入门系列之包装类

JDK8系列之Stream API入门教程和示例

Java入门系列之集合LinkedList入门

java入门概念个人理解之集合类特性对比列表