目录
背景String底层原理
拼接的方法
经典但有时不优雅的 +
优点
缺点
业务一
万能的StringBuilder
线程安全的StringBuffer
灵活的String.format()
有点绿色的concat
JDK1.8优雅写法
经典的Guava
总结
背景
字符串拼接不管是在业务上,还是写算法时都会频繁使用到。对于Java来说,字符串拼接有着很多种方式,他们之间的区别是什么,对应不同的业务哪种更好用呢。
String底层原理
在讨论字符串拼接时,首先需要知道String的底层原理。
我们这里只讨论jdk1.8之后的情况,看下结构
private final byte[] value;
这一行代码已经可以说明很多东西。字符串实质就是不可变的byte数组。因为不可变,所以对他进行拼接对他拼接实际就是生成了多个对象,这就是不鼓励对字符串进行拼接的原因。但不可变也有很多好处,例如线程安全、可以存在字符串缓冲池复用字符串等。
拼接的方法
经典但有时不优雅的 +
String a = "123"; String b = "456"; String c = a + b;
c这个字符串就是ab拼接起来的字符串,“123456”
这段代码反编译出来的代码是
String c = (new StringBuilder()).append(a).append(b).toString();
可以看出这个 + 是Java的语法糖,他实际上是调用的StringBuilder,通过append()来进行拼接。关于StringBuilder我们后面再讲,先来讲下这个用法的优缺点。
优点
“+”,最大的优点就是简洁。如果两个字符串需要首尾拼接,+号义不容辞的成为了最好的使用方式。
缺点
说到缺点的话就多了。简洁也是他的最大缺点,也就是不够灵活。
业务一
有一个字符串List,我需要把他们拼接起来,怎么办?
for(String tmp:list){ s += tmp; }
简洁的一批,但是他隐藏着很大的问题!
上面说到这种拼接方式实际是通过StringBuilder的append的方法。你不需要知道他的原理,你只需要知道,每次循环,他都会new一个StringBuilder对象。创建对象的开销是很大的,如果List有几千几万,内存开销和时间开销是不能接受的!
所以阿里巴巴的规范说到:
表面上是推荐,实际就是禁止。写算法会消耗大量时间导致不通过,业务也会因为这种方式提高了无故的开销,属于领导看了想打死的代码。
业务二
大家好,我叫XX,我是来自XXX学校的大X学生,我的爱好是XXX。
一个经典的模板,我需要替换掉中间的XXX为controller的参数,怎么办呢?
String s = "大家好,我叫"+name+"我是来自"+school+"学校的大"+num+“学生,我的爱好是”+aihao;
属于可用但极其丑陋的代码。如果其他接口也需要这个模板,我还要把这段话复制到所有位置上吗?如果我要改动这个,我要对所有代码进行改动吗。
万能的StringBuilder
先介绍下StringBuilder的原理。把字符串拼接想象成数组就很好理解了,StringBuilder有点类似于ArrayList,可变数组。
/** * The value is used for character storage. */ char[] value;
区别就是没有final修饰,当到达阈值时进行扩容操作。append方法就是往后插入。
那么就可以解决上面业务一的问题了。
StringBuilder sb = new StringBuilder(); for(String tmp:list){ sb.append(tmp); } String s = sb.tostring();
相比于上面,只创建了一个StringBuilder对象,减少循环创建的开销。
线程安全的StringBuffer
StringBuffer与StringBuilder相比,有线程安全的优势,通过上锁的方式。同时导致效率略低于StringBuilder。
灵活的String.format()
这个严格来说应该叫做格式化,但也可以用来拼接。
熟悉c语言的应该能够懂,我这里举一个例子
String msg = String.format(“我是%s小学的学生,我爱吃%s”,"阳光","屎"); //输出 我是阳光小学的学生,我爱吃屎
使用字符串链代替%s,生成需要的字符串。也不仅可以拼接字符串,可以看下下图(偷的图,没全部验证过,错了别找我)
这种方式就解决了业务二的问题。通过编写枚举或者常量字符串留出对应的位置,使用时再用String.format()拼接。
有点绿色的concat
为什么说他绿色呢,就是我还没有找到他有什么优势。
String s = "123".concat("456"); //结果等价于 String s = "123" + "456";
concat方法的原理是数组扩容后复制之前的内容并写新的内容,和StringBuilder底层有点相像。
但是相比于“+”号来说,既不简便,又没有什么效率上的提高。在循环字符串拼接的条件,效率上会略有一点优势,但是这种情况是根本不被允许的,所以concat就很鸡肋。
JDK1.8优雅写法
刚才提到业务一的解决办法可以使用朴素的StringBuilder来解决,但是对于业务代码来说有一点冗长。
Jdk1.8给出了优雅的答案
String s = String.join("_", list);
一行代码,就可以把list里的字符串通过“_”拼接起来。
经典的Guava
guava是我们crud程序员的好伙伴,这里就不用多说了。我们最常接触到的其实就是guava的本地缓存和字符串操作。
String result = Joiner.on(",").join(list);
也是简洁的一句话,但是相比于jdk本土的字符串方法来说,他还有一些其他的特性。例如可以把为null的数组给跳过或者替换掉等等。功能要比jdk的要丰富一点。在正常的web项目里基本都会有Guava的依赖,使用起来还是很方便的。
总结
这篇文章偏重于代码编写方面,如何写出简洁高效的代码,是我们要追求的。不要让你写的垃圾代码恶心到接手的同事就好了。