Java--深入理解字符串的String#intern()方法奥妙之处
Posted 吾日三省贾斯汀
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java--深入理解字符串的String#intern()方法奥妙之处相关的知识,希望对你有一定的参考价值。
学习背景
进入正文学习字符串的intern()方法之前,先给下这4个问题,看下自己是否都知道答案?
1、String s1 = “a” + “b”; //创建了几个对象?
2、String s2 = new String(“ab”); //创建了几个对象?
3、String s3 = new String(“a”) + new String(“b”); //创建了几个对象?
4、String s4= new String(“a”) + new String(“a”); s4.intern(); //创建了几个对象?
如果都清楚,恭喜你,大佬一枚,不用往下学习了,哈哈哈!
那如果不太确定或者需要加深自己的理解,建议进入正文一起来了解下吧!
当然,也可以拉到最后有答案!
String#intern()示例代码
先来执行一下String调用intern()方法的一段示例代码:
public class StringInternTest {
public static void main(String[] args) {
String reference1 = new String("a");
reference1.intern();
String reference2 = "a";
System.out.println(reference1 == reference2);
String reference3 = new String("a") + new String("a");
reference3.intern();
String reference4 = "aa";
System.out.println(reference3 == reference4);
}
}
JDK1.6 执行输出结果:
false
false
JDK1.7 执行输出结果:
false
true
大家可以先思考一下为什么结果是这样的?往下会具体介绍!
String##intern()源码
先来看一下intern()方法的JDK源码如下:
/**
* Returns a canonical representation for the string object.
* <p>
* A pool of strings, initially empty, is maintained privately by the
* class {@code String}.
* <p>
* When the intern method is invoked, if the pool already contains a
* string equal to this {@code String} object as determined by
* the {@link #equals(Object)} method, then the string from the pool is
* returned. Otherwise, this {@code String} object is added to the
* pool and a reference to this {@code String} object is returned.
* <p>
* It follows that for any two strings {@code s} and {@code t},
* {@code s.intern() == t.intern()} is {@code true}
* if and only if {@code s.equals(t)} is {@code true}.
* <p>
* All literal strings and string-valued constant expressions are
* interned. String literals are defined in section 3.10.5 of the
* <cite>The Java™ Language Specification</cite>.
*
* @return a string that has the same contents as this string, but is
* guaranteed to be from a pool of unique strings.
*/
public native String intern();
很显然通过源码可以看到intern()是一个native本地方法,但是native具体实现源码已经被隐藏了,这是一个历史故事了,SUN公司在JDK7开发期间,由于技术竞争和商业竞争陷入泥潭,无力再投入精力继续研发JDK,Oracle半路杀出直接收购Sun公司,Oracle接管JDK的研发后,发版了自己的Oracle JDK,Oracle的native底层等很多源码就被隐藏了,不过Oracle官方也声明OpenJDK和Oracle JDK7及以后版本,源码几乎是一模一样的,想要了解native底层源码具体实现过程,可以下载开源的OpenJDK的源码进行查看。
OpenJDK官网:https://hg.openjdk.java.net/
GitHub也开源啦:https://github.com/openjdk/jdk
例如String对应的OpenJDK底层源码主入口:jdk7\\jdk\\src\\share\\native\\java\\lang\\String.c
Java_java_lang_String_intern(JNIEnv *env, jobject this)
{
return JVM_InternString(env, this);
}
native底层方法的实现,需要掌握C和C++的语法,学习门槛要求比较高,这里不是我们要学习的重点,不做具体介绍。
String#intern()方法作用
前面JDK源码intern()方法的英文注释已经说明了intern()方法的有具体用途了,网上也有很多说明,不过这里我以个人的理解以及话术简单概括下intern()方法的作用如下:
(1)只要调用String对象的intern(),都会去找到字符串常量池,然后判断String对象的字符串内容是否已经存在常量池中,
不存在,则往字符串常量池中创建该字符串内容的对象(JDK6及之前)或创建新的引用并指向堆区已有对象地址(JDK7之后)
,存在则直接返回。(2)JDK7时,字符串常量池从永久代脱离,迁移到堆区中,相比于JDK6,变化不只是字符串常量池迁移到堆区而已,另一个变化就是调用字符串对象的intern()方法,如果字符串常量池中不存在该字符串内容的对象,则不会再像JDK6直接往字符串常量池中创建该字符串内容的对象,而是创建一个新的引用并指向堆区已有对象地址,实现字符串常量池和堆区字符串共用的目的,效率更高。
JDK6 String#intern()执行说明
一张图介绍前面示例代码JDK6执行过程如下:
/**
* JDK6 String#intern()执行说明
*/
public class StringInternTest {
public static void main(String[] args) {
//Step6.1
//创建了2个对象,分别是堆区的String对象和字符串常量池中的"a"对象,reference1引用指向在堆区中的对象地址
String reference1 = new String("a");
//Step6.2
//判断字符串常量池,是否该字符串"a",此前,池中已经有该对象了,因此会返回池中的对象地址的引用
reference1.intern();
//Step6.3
//字符串常量池中已存在字符串"a",因此reference2引用直接指向对象在字符串常量池中的地址
String reference2 = "a";
//reference1指向对象地址是在堆区,reference2指向对象地址是在永久代的常量池,显然不可能一样
System.out.println(reference1 == reference2);
//Step6.4
//创建了2个对象,分别是在堆区的String对象(内容是"aa")和字符串常量池中的"a"对象
//reference3引用指向对象在堆区中的地址,这过程还会在堆区创建了两个无引用的"a"对象,这里不做讨论
String reference3 = new String("a") + new String("a");
//Step6.5
//判断永久代中的字符串常量池,是否存在该字符串"aa",这里是首次出现,因此直接将字符串拷贝并放到池中
reference3.intern();
//Step6.6
//池中已存在该字符串,reference2引用直接指向对象在永久代字符串常量池中的地址
String reference4 = "aa";
//同样,reference3指向堆区地址,reference4指向永久代常量池中的地址,显然不可能一样
System.out.println(reference3 == reference4);
}
}
JDK7 String#intern()执行说明
一张图介绍前面示例代码JDK7执行过程如下:
/**
* JDK1.7 String#intern()执行说明
**/
public class StringInternTest {
public static void main(String[] args) {
//Step7.1
//创建了2个对象,分别是堆区的String对象和字符串常量池中的"a"对象,reference1引用指向在堆区中的对象地址
String reference1 = new String("a");
//Step7.2
//判断字符串常量池,是否该字符串"a",此前,池中已经有该对象了,因此会返回池中的对象地址的引用
reference1.intern();
//Step7.3
//字符串常量池中已存在字符串"a",因此reference2引用直接指向对象在字符串常量池中的地址
String reference2 = "a";
//reference1指向对象地址是在堆区,reference2指向对象地址是在堆区的字符串常量池,引用指向的对象地址不一样
System.out.println( reference1 == reference2);
//Step7.4
//创建了2个对象,分别是在堆区的String对象(内容是"aa")和字符串常量池中的"a"对象(注意并不会创建"aa"对象)
//reference3引用指向对象在堆区中的地址,这过程还会在堆区创建了两个无引用的"a"对象,这里不做讨论
String reference3 = new String("a") + new String("a");
//Step7.5
//判断堆区的字符串常量池中,是否存在该字符串"aa",显然这里是首次出现
//但并不像JDK6会新建对象"aa"存储,而是存储指向堆区已有对象地址的一个新引用
reference3.intern();
//Step7.6
//指向池中已有该字符串的新引用,reference4引用直接指向字符串常量池中的这个新引用,新引用则指向堆区已有对象地址
String reference4 = "aa";
//reference4指向新引用,而新引用则指向堆区已有对象地址,跟reference3引用直接指向的对象地址是同一个
System.out.println(reference3 == reference4);
}
经典面试问题之创建了几个对象?
在实际的Java面试当中,经常会被问到字符串创建了几个对象的问题,主要是考察学习者对于对象的实例化以及字符串常量池在JVM结构体系中是如何运行的,个人觉得比较常见问题,无法就是如下几个:
1、最简单的比如:String s1 = “a” + “b”;创建了几个对象?
答:最多1个,多个字符串常量相加会被编译器优化为一个字符串常量即"ab",如果字符串常量池不存在,则创建该对象。
2、相对简单的比如:String s1 = new String(“ab”);创建了几个对象?
答:1个或2个,使用new实例化对象,必然会在堆区创建一个对象,另外一个就是如果在字符串常量池中不存在"ab"这个对象,则会创建这个"ab"常量对象。
3、稍微难一点的比如:String s2 = new String(“a”) + new String(“b”);创建了几个对象?
答:至少4个,最多6个
堆区的1个new StringBuilder()和2个new String()
还有1个是StringBuilder()的toString()方法底层实现是new String(value, 0, count)
另外2个即"a"、"b"可能会在常量池新建对象
有的同学可能会有疑问,那这个toString过程"ab"字符串不会在常量池中也创建吗?
答案是,不会,最后StringBuilder的toString() 的调用,底层new String(value, 0, count)
并不会在字符串常量池中去创建"ab"对象。
两个new String相加会被优化为StringBuilder,可以通过javac和javap查看汇编指令如下:
javac InternTest.java
javap -c InternTest
public class com.justin.java.lang.InternTest {
public com.justin.java.lang.InternTest();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
public static void main(java.lang.String[]);
Code:
0: new #2 // class java/lang/StringBuilder
3: dup
4: invokespecial #3 // Method java/lang/StringBuilder."<init>":()V
7: new #4 // class java/lang/String
10: dup
11: ldc #5 // String a
13: invokespecial #6 // Method java/lang/String."<init>":(Ljava/lang/String;)V
16: invokevirtual #7 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
19: new #4 // class java/lang/String
22: dup
23: ldc #8 // String b
25: invokespecial #6 // Method java/lang/String."<init>":(Ljava/lang/String;)V
28: invokevirtual #7 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
31: invokevirtual #9 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
34: astore_1
35: return
}
6、最难的无非就是再调用intern()方法,比如:
String s3= new String(“a”) + new String(“b”);
s3.intern();创建了几个对象?
答:最少4个,最多7个
1个new StringBuilder()和2个new String
还有1个是StringBuilder()的toString()方法底层实现是new String(value, 0, count)
另外"a"、“b"可能会在常量池新建对象
最后调用intern()方法时,会去字符串常量池,判断"ab"是否存在,不存在,JDK6时会创建"ab” 1个对象,JDK7则只创建"ab"的引用并指向堆区内容为"ab"的StringBuilder对象地址。
以上是关于Java--深入理解字符串的String#intern()方法奥妙之处的主要内容,如果未能解决你的问题,请参考以下文章
通过反编译深入理解Java String及intern(转)