java核心基础 --- String.intern

青春壹個敷衍的年華 提交于 2021-02-12 19:30:24

本篇博文转载自: https://tech.meituan.com/2014/03/06/in-depth-understanding-string-intern.html

相信很多 JAVA 程序员都做过类似 String s = new String("abc") 这语句创建了几个对象的题目。这种题目主要就是为了考察程序员对字符串对象的常量池掌握与否。上述的语句中是创建了 2 个对象,第一个对象是 "abc" 字符串存储在常量池中,第二个对象在 JAVA Heap 中的 String 对象。

除此之外,我们还应该掌握 String 常量池的相关知识。它的主要使用方法有两种:

  • 直接使用双引号声明出来的 String 对象会直接存储在常量池中
  • 如果不是使用双引号声明的 String 对象,可以使用 String 提供的 intern 方法。intern 方法会从字符串常量池中查询当前字符串是否存在,若不存在就会将当前字符串放入常量池中。不过这个方法在 JDK6 和 JDK7 中却会表现出不一样的行为,接下来我们来看看他们的区别。

先来看一段代码:

public static void main(String[] args){
    String s = new String("1");
    s.intern();
    String s2 = "1";
    System.out.println(s == s2);
    
    String s3 = new String("1") + new String("1");
    s3.intern();
    String s4 = "11";
    System.out.println(s3 == s4);
}

打印结果为:

  • jdk6 下 false false
  • jdk7 下 false true

具体为什么稍后解释,然后将 s3.intern(); 语句下调一行,放在 String s4 = "11" 后面。将 s.intern() 放在 String s2 = "1" 后面。是什么结果呢?

public static void main(String[] args) {
    String s = new String("1");
    String s2 = "1";
    s.intern();
    System.out.println(s == s2);

    String s3 = new String("1") + new String("1");
    String s4 = "11";
    s3.intern();
    System.out.println(s3 == s4);
}

打印结果为:

  • jdk6 下 false false
  • jdk7 下 false false

JDK6 中的解释

jdk6图

注:图中绿色线条代表 string 对象的内容指向。黑色线条代表地址指向

如上图所示。首先说一下 jdk6 中的情况,在 jdk6 中上述的所有打印都是 false 的,因为 jdk6 中的常量池是放在 perm(是一个类静态的区域,主要存储一些加载类信息,常量池,方法片段等内容) 区中的,Perm 区和正常的 JAVA Heap 区域是完全分开的。上面说过如果是使用引号声明的字符串都是会直接在字符串常量池中生成,而 new 出来的 String 对象是放在 JAVA Heap(堆) 区域。所以拿一个 JAVA Heap 区域的对象地址和字符串常量池的对象地址进行比较肯定是不相同的,即使调用 String.intern 方法也是没有任何关系的。

JDK7 中的解释

再说说 JDK7 中的情况,这里要明确的一点是,在 JDK7 的版本中,字符串常量池已经从 Perm 区域移到正常的 Java Heap 区域了,现在来解释为什么会有上述的打印结果。

jdk7图1

  • 在第一段代码中,先看 s3 和 s4 字符串。String s3 = new String("1") + new String("1"),这句代码中现在生成了 2 个对象,是字符串常量池中的 1 和 JAVA Heap 中的 s3 引用指向的对象。中间还有 2 个匿名的 new String("1") 我们不去讨论他们。此时 s3 引用对象内容是 "11",但此时常量池中是没有 "11" 对象的。
  • 接下来 s3.intern 这一句代码,是将 s3 中的 11 字符串放入 String 常量池中,因为此时常量池中不存在 11 字符串,因此常规的做法是跟 jdk6 图中表示的那样,在常量池中生成一个 11 对象,关键点是 jdk7 中常量池不在 Perm 区域了,这块做了调整。常量池中不需要再存储一份对象了,可以直接存储堆中的引用。这份引用指向 s3 引用的对象。也就是说引用地址是相同的。
  • 最后 String s4 = "11" 这句代码中 11 是显示声明的,因此会直接去常量池中创建,创建的时候发现已经有这个对象了,此时也就是指向 s3 引用对象的一个引用。所以 s4 引用就指向和 s3 一样了。因此最后的比较 s3 == s4 是 true。
  • 再看 s 和 s2 对象。String s = new String("1") 这一句代码,生成了 2 个对象。常量池中的 1 和 JAVA Heap 中的字符串对象。s.intern() 这一句是 s 对象去常量池中寻找后发现 1 已经存在常量池了
  • 接下来 String s2 = "1" 这句代码是生成一个 s2 的引用指向常量池中的 1 对象。结果就是 s 和 s2 的引用地址明显不同。图中画的很清晰。

jdk7图2

  • 来看第二段代码,从上边第二幅图中观察。第一段代码和第二段代码的改变就是 s3.intern 的顺序放在 String s4 = "11"后了。这样,首先执行 String s4 = "11" 声明 s4 的时候常量池中是不存在 11 对象的,执行完毕后,11 对象是 s4 声明产生的对象。然后再执行 s3.intern 时,常量池中 11 对象已经存在,此时 s3 和 s4 的引用是不同的。
  • 第二段代码中的 s 和 s2 代码中,s.intern 这一句往后放也不会有什么影响了,因为对象池中在执行第一句代码 String s = new String("1") 的时候已经生成了 1 对象了。下边的 s2 声明都是直接从常量池中取地址引用的。s 和 s2 的引用地址是不会相同的。

小结

从上述的例子代码可以看出 jdk7 版本对 intern 操作和敞亮池都做了一定的修改。主要包括 2 点:

  • 将 String 常量池从 Perm 区域移动到了 JAVA Heap 区域
  • 使用 String.intern 方法时,如果存在堆中的对象,会直接保存对象的引用,而不会重新创建对象。
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!