浅谈常量字符串

Posted 2023-04-05 追梦小蔡

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了浅谈常量字符串相关的知识，希望对你有一定的参考价值。

今天早上看网课刚好学到字符函数的部分，刚好对常量字符串有些疑惑的地方，现在组织了下语言，把今天关于常量字符串的思考写成这篇博客

当我们编写程序时，常量字符串是一种非常常见的数据类型。常量字符串指的是在程序中声明的一个不可更改的字符串变量，其值在声明后就不能再被修改。在许多情况下，将字符串定义为常量可以提高程序的可读性和可维护性。

常量字符串可以通过两种方式来定义：使用关键字 const 或者使用预处理器指令 #define。

使用 const 关键字定义常量字符串时，可以将其作为一个变量进行声明并且初始化，如下所示：

const char* const STR = "Hello, world!";

这里 const char* 表示一个指向字符型数据的指针，而第二个 const 则表示该指针是一个常量，即它本身的值也不能被修改。STR 是一个指向字符串 "Hello, world!" 的常量指针。

另一种常量字符串的定义方式是使用预处理器指令 #define，如下所示：

#define STR "Hello, world!"

这里 #define 定义了一个名为 STR 的常量字符串，其值为 "Hello, world!"。在编译时，预处理器将会把所有 STR 出现的地方替换成 "Hello, world!"。

需要注意的是，在使用 #define 定义常量字符串时，没有办法像使用 const 关键字定义的常量字符串那样获取其长度。因此，在使用 #define 定义常量字符串时，需要自行计算其长度，并且不能使用 C++11 中的 constexpr 特性。

在程序中使用常量字符串可以带来很多好处。首先，由于常量字符串的值不能被修改，因此可以防止程序中不想要的错误修改。其次，将字符串定义为常量可以提高程序的可读性和可维护性，因为常量名称本身就可以表达出字符串的含义，而无需再花费额外的精力进行解释。

总之，在编写程序时，使用常量字符串是一种非常好的实践，可以提高代码的质量和可读性，从而让程序更加易于维护。

浅谈JAVA中字符串常量的储存位置

在讲述这些之前我们需要一些预备知识：

Java的内存结构我们可以通过两个方面去看待它。

一、从抽象的JVM的角度去看。相关定义请参考JVM规范：Chapter 2. The Structure of the Java Virtual Machine

从该角度看的话Java内存结构包含以下部分：该部分内容可以结合：JVM简介（更加详细深入的介绍）

1、栈区：由编译器自动分配释放，具体方法执行结束后，系统自动释放JVM内存资源。

其作用有保存局部变量的值，包括：1.用来保存基本数据类型的值；2.保存类的实例对象的引用。也可以用来保存加载方法时的帧。

2、堆区：一般由程序员分配释放，JVM不定时查看这个对象，如果没有引用指向这个对象就回收。

其作用为用来存放动态产生的数据，包括new出来的实例，数组等。注意创建出来的对象只包含属于各自的成员变量，并不包括成员方法。

因为同一个类的对象拥有各自的成员变量，存储在各自的堆中，但是他们共享该类的方法，并不是每创建一个对象就把成员方法复制一次。

3、代码区：存放程序中方法的二进制代码，而且是多个对象共享一个代码空间区域。

4、数据区：用来存放static定义的静态成员。

5、常量池：JVM为每个已加载的类型维护一个常量池，常量池就是这个类型用到的常量的一个有序集合。包括直接常量(基本类型，String)和对其他类型、方法、字段的符号引用。池中的数据和数组一样通过索引访问。由于常量池包含了一个类型所有的对其他类型、方法、字段的符号引用，所以常量池在Java的动态链接中起了核心作用。常量池存在于堆中。

下图大致描述了JAVA的内存分配

二、从操作系统上的进程的角度。相关定义请参考各种操作系统的资料，例如Linux的话可以参考这个简单的介绍：Linux Processes explained （此方面一般被较少地谈论到，本文对此仅仅做一个稍微的介绍）

这里切记一点：JVM规范所描述的抽象JVM概念与实际实现并不总一一对应。

接来下我们来看一段代码实例与注释：

public class TestStringConstant {
    public static void main(String args[]) {
        // 字符串常量，分配在常量池中，编译器会对其进行优化，  Interned table
        // 即当一个字符串已经存在时，不再重复创建一个相同的对象，而是直接将s2也指向"hello".
        String s1 = "hello";   
        String s2 = "hello";
        // new出来的对象，分配在heap中.s3与s4虽然它们指向的字符串内容是相同的，但是是两个不同的对象.
        // 因此==进行比较时，其所存的引用是不同的，故不会相等
        String s3 = new String("world");      
        String s4 = new String("world");
        
        System.out.println(s1 == s2);   // true
        System.out.println(s3 == s4);   // false
        System.out.println(s3.equals(s4));   // true   
        // String中equals方法已经被重写过，比较的是内容是否相等.
    }
}

那么对于上例代码中提到的编译器的优化，下面将进行更进一步的详细介绍。请看下例代码：

class A {
    private String a = "aa";
    public boolean methodB() {
        String b = "bb";
        final String c = "cc";
        return false;
    }
}

　"aa"、"bb"的String对象按JVM规范在Java heap上，在JDK8之前的HotSpot VM实现里在PermGen，在JDK7开始的HotSpot VM里在普通Java heap里（而不在PermGen里）；"cc"如果存在的话也一样，但是可能会不存在。

这些String对象属于“interned String”。String是Java对象，根据JVM规范的定义它必须存在于Java heap中，interned String也不例外。Interned String特别的地方在于JVM会有个StringTable存着interned String的引用，保证内容相同的String对象不被重复intern。（这里便是编译器的优化）

这个StringTable怎样实现JVM规范里并没有规定，不过通常它并不保存String对象的内容，而只是保存String对象的引用而已。

从JVM规范看a、b、c变量：

a变量作为A类的对象实例字段，会跟随A的实例在Java heap上。

b变量作为局部变量会在Java线程栈上。

c变量虽然也是局部变量，但因为有final修饰并且有初始化为一个常量值，所以c是一个常量。它可能会被优化掉（就没有c这个变量了），也可能跟b一样作为局部变量在Java线程栈上。

通过以上相信大家对于字符串常量的分配区域以及java的内存分配有了一个较为形象的了解。

下面是一些相关知识点的补充与注意事项：

1.分清什么是实例什么是对象。Class a= new Class();此时a叫实例，而不能说a是对象。实例在栈中，对象在堆中，操作实例实际上是通过实例的指针间接操作对象。多个实例可以指向同一个对象。

2.栈中的数据和堆中的数据销毁并不是同步的。方法一旦结束，栈中的局部变量立即销毁，但是堆中对象不一定销毁。因为可能有其他变量也指向了这个对象，直到栈中没有变量指向堆中的对象时，它才销毁，而且还不是马上销毁，要等垃圾回收扫描时才可以被销毁。

3.以上的栈、堆、代码段、数据段等等都是相对于应用程序而言的。每一个应用程序都对应唯一的一个JVM实例，每一个JVM实例都有自己的内存区域，互不影响。并且这些内存区域是所有线程共享的。这里提到的栈和堆都是整体上的概念，这些堆栈还可以细分。

4.类的成员变量在不同对象中各不相同，都有自己的存储空间(成员变量在堆中的对象中)。而类的方法却是该类的所有对象共享的，只有一套，对象使用方法的时候方法才被压入栈，方法不使用则不占用内存。

从HotSpot VM的实现看：

当methodB()被解释执行时，输入的字节码是怎样的就会怎样执行，而由于javac的实现不会优化掉变量b，所以调用methodB()时它一定会在Java线程栈上的局部变量区里；当字节码里变量c存在时，它也跟b一样在Java线程栈的局部变量区。

当methodB()被JIT编译执行时，由于局部变量b、c都没有被使用，所以它们经过JIT编译后就消失了，调用methodB()不会在栈上给b或c变量分配任何空间。

通过以上相信大家对于字符串常量的分配区域以及java的内存分配有了一个较为形象的了解。

下面是一些相关知识点的补充与注意事项：

对于String的相关补充：

对于String的修改其实是new了一个StringBuilder并调用append方法，然后调用toString返回一个新的String.

（注意：append方法并不会new一个新的对象.）

但是JVM是会对String进行优化的，比如：

String str = "I" + "love" + "java"

其中的字符串在编译的时候就能够确认，所以编译器会直接将其拼接成一个字符串放在常量池："I love java"

但是若代码为下面这样：

String a = "I";
String b = "love";
String c = "java";
String str = a + b + c;

那么只有等到运行的时候才能够确定str最终是什么，编译器并不会对其进行优化，而是通过StringBuilder对字符串改变来实现的。

但是注意，要是此处给 a, b, c添加上 final 关键字，则编译器就能够对其进行优化。我们可以做下面这样一个测试：

public class foo{
    public static void main(String[] args) {
        String a = "I ";
        String b = "love ";
        String c = "java";
        
        final String a1 = "I ";
        final String b1 = "love ";
        final String c1 = "java";
        
        String str = a + b + c;
        String str1 = a1 + b1 + c1;     // equals to str1 = "I " + "love " + "java"
        String str2 = "I " + "love " + "java";
        
        System.out.println(str == "I love java");   // output false
        System.out.println(str1 == "I love java");  // output true
        System.out.println(str2 == "I love java");  // output true
        System.out.println(a + "love " + "java" == "I love java");  // output false
        System.out.println(a1 + "love " + "java" == "I love java");  // output true
    }
}

Note:

　　StringBuilder 和 StringBuffer 的区别：

StringBuffer 是线程安全的；StringBuilder 是非线程安全的。

因为StingBuffer是在StringBuilder的基础上加锁，而加锁是一个重量级的操作，需要调用操作系统内核来实现。

比较耗时。

故在效率上： StringBuilder > StringBuffer

以上是关于浅谈常量字符串的主要内容，如果未能解决你的问题，请参考以下文章