使用 Groovy 进行字符串连接

Posted

技术标签:

【中文标题】使用 Groovy 进行字符串连接【英文标题】:String concatenation with Groovy 【发布时间】:2012-07-06 17:50:06 【问题描述】:

在 Groovy 中连接字符串的最佳(惯用)方法是什么?

选项 1:

calculateAccountNumber(bank, branch, checkDigit, account) 
    bank + branch + checkDigit + account

选项 2:

calculateAccountNumber(bank, branch, checkDigit, account) 
    "$bank$branch$checkDigit$account"

我在旧的 Groovy 网站上就这个主题提出了一个有趣的观点:可以做的事情,但最好不要做。

在 Java 中,您可以使用“+”符号连接字符串。但是Java 只需要“+”表达式的两项之一是 字符串,不管它是在第一个还是在最后一个。爪哇 将在“+”的非字符串对象中使用 toString() 方法 表达。但是在 Groovy 中,你应该是安全的 您的“+”表达式以正确的方式实现了 plus() 方法, 因为 Groovy 会搜索并使用它。在 Groovy GDK 中,只有数字 和 String/StringBuffer/Character 类有 plus() 方法 实现连接字符串。为避免意外,请始终使用 GStrings。

【问题讨论】:

【参考方案1】:

我总是选择第二种方法(使用 GString 模板),但是当像您这样有多个参数时,我倾向于将它们包装在 $X 中,因为我发现它更具可读性。

在这些方法上运行一些基准测试(使用Nagai Masato 的优秀GBench module)也表明模板比其他方法更快:

@Grab( 'com.googlecode.gbench:gbench:0.3.0-groovy-2.0' )
import gbench.*

def (foo,bar,baz) = [ 'foo', 'bar', 'baz' ]
new BenchmarkBuilder().run( measureCpuTime:false ) 
  // Just add the strings
  'String adder' 
    foo + bar + baz
  
  // Templating
  'GString template' 
    "$foo$bar$baz"
  
  // I find this more readable
  'Readable GString template' 
    "$foo$bar$baz"
  
  // StringBuilder
  'StringBuilder' 
    new StringBuilder().append( foo )
                       .append( bar )
                       .append( baz )
                       .toString()
  
  'StringBuffer' 
    new StringBuffer().append( foo )
                      .append( bar )
                      .append( baz )
                      .toString()
  
.prettyPrint()

这在我的机器上给了我以下输出:

Environment
===========
* Groovy: 2.0.0
* JVM: Java HotSpot(TM) 64-Bit Server VM (20.6-b01-415, Apple Inc.)
    * JRE: 1.6.0_31
    * Total Memory: 81.0625 MB
    * Maximum Memory: 123.9375 MB
* OS: Mac OS X (10.6.8, x86_64) 

Options
=======
* Warm Up: Auto 
* CPU Time Measurement: Off

String adder               539
GString template           245
Readable GString template  244
StringBuilder              318
StringBuffer               370

因此,鉴于它的可读性和速度,我建议使用模板 ;-)

注意:如果您在 GString 方法的末尾添加 toString() 以使输出类型与其他指标相同,并使其成为更公平的测试,StringBuilderStringBuffer 会在速度方面击败 GString 方法.然而,由于 GString 可以在大多数情况下代替 String (您只需要谨慎使用 Map 键和 SQL 语句),因此大多数情况下都可以不进行最终转换

添加这些测试(如 cmets 中所要求的那样)

  'GString template toString' 
    "$foo$bar$baz".toString()
  
  'Readable GString template toString' 
    "$foo$bar$baz".toString()
  

现在我们得到结果:

String adder                        514
GString template                    267
Readable GString template           269
GString template toString           478
Readable GString template toString  480
StringBuilder                       321
StringBuffer                        369

如你所见(如我所说),它比 StringBuilder 或 StringBuffer 慢,但仍然比添加字符串快一点...

但仍然更具可读性。

在下面的农村编码员评论后编辑

更新到最新的 gbench,用于连接的更大字符串和一个初始化为合适大小的 StringBuilder 的测试:

@Grab( 'org.gperfutils:gbench:0.4.2-groovy-2.1' )

def (foo,bar,baz) = [ 'foo' * 50, 'bar' * 50, 'baz' * 50 ]
benchmark 
  // Just add the strings
  'String adder' 
    foo + bar + baz
  
  // Templating
  'GString template' 
    "$foo$bar$baz"
  
  // I find this more readable
  'Readable GString template' 
    "$foo$bar$baz"
  
  'GString template toString' 
    "$foo$bar$baz".toString()
  
  'Readable GString template toString' 
    "$foo$bar$baz".toString()
  
  // StringBuilder
  'StringBuilder' 
    new StringBuilder().append( foo )
                       .append( bar )
                       .append( baz )
                       .toString()
  
  'StringBuffer' 
    new StringBuffer().append( foo )
                      .append( bar )
                      .append( baz )
                      .toString()
  
  'StringBuffer with Allocation' 
    new StringBuffer( 512 ).append( foo )
                      .append( bar )
                      .append( baz )
                      .toString()
  
.prettyPrint()

给予

Environment
===========
* Groovy: 2.1.6
* JVM: Java HotSpot(TM) 64-Bit Server VM (23.21-b01, Oracle Corporation)
    * JRE: 1.7.0_21
    * Total Memory: 467.375 MB
    * Maximum Memory: 1077.375 MB
* OS: Mac OS X (10.8.4, x86_64)

Options
=======
* Warm Up: Auto (- 60 sec)
* CPU Time Measurement: On

                                    user  system  cpu  real

String adder                         630       0  630   647
GString template                      29       0   29    31
Readable GString template             32       0   32    33
GString template toString            429       0  429   443
Readable GString template toString   428       1  429   441
StringBuilder                        383       1  384   396
StringBuffer                         395       1  396   409
StringBuffer with Allocation         277       0  277   286

【讨论】:

我不反对使用 GString 模板来提高可读性,但您应该在两个 GString 测试后附加 .toString() 重新运行测试。我的运行表明它们的性能几乎与String adder 相同。我的猜测是您运行的测试实际上并没有处理连接,所以它只是创建一个 GString 对象并存储引用。 StringBuilder 仍然是最快的,如果您在某个时候需要 String,请放心。 不知何故我错过了下半场!当然,即使您将 GString 保留为“原样”,在 some 点它也必须转换为真正的 String,(即使只是打印出来),所以真正的时机是最后一组。最后,当时间如此接近时,GString 模板的易读性胜过StringBuilder,所以它没有实际意义。 :-) @OverZealous Ahhh 是的,一如既往,有lies, damned lies and benchmarks ;-) 我觉得可读性是关键,因为我们已经在使用 Groovy,我们已经声明裸机性能是不是我们的主要考虑;-) 是的,GStrings 的一大优点是它们直到最后一刻才转换为字符串。这意味着,例如,如果您使用低于日志记录阈值的 log4j 记录器记录 GString,则 GString 根本不会被转换。 测试中缺少的是具有计算容量的 StringBuilder。原因是 foo+bar+baz 会导致一两次缓冲区扩展,这会增加时间。【参考方案2】:
def my_string = "some string"
println "here: " + my_string 

不太清楚为什么上面的答案需要进入基准测试、字符串缓冲区、测试等。

【讨论】:

为简单起见点赞。我只需要连接两个字符串。大声笑【参考方案3】:

在当前硬件上重现 tim_yates 答案并添加 leftShift() 和 concat() 方法来检查结果:

  'String leftShift' 
    foo << bar << baz
  
  'String concat' 
    foo.concat(bar)
       .concat(baz)
       .toString()
  

结果显示 concat() 是纯字符串更快的解决方案,但如果你可以在其他地方处理 GString,GString 模板仍然领先,而值得一提的是 leftShift()(按位运算符)和 StringBuffer( ) 初始分配:

Environment
===========
* Groovy: 2.4.8
* JVM: OpenJDK 64-Bit Server VM (25.191-b12, Oracle Corporation)
    * JRE: 1.8.0_191
    * Total Memory: 238 MB
    * Maximum Memory: 3504 MB
* OS: Linux (4.19.13-300.fc29.x86_64, amd64)

Options
=======
* Warm Up: Auto (- 60 sec)
* CPU Time Measurement: On

                                    user  system  cpu  real

String adder                         453       7  460   469
String leftShift                     287       2  289   295
String concat                        169       1  170   173
GString template                      24       0   24    24
Readable GString template             32       0   32    32
GString template toString            400       0  400   406
Readable GString template toString   412       0  412   419
StringBuilder                        325       3  328   334
StringBuffer                         390       1  391   398
StringBuffer with Allocation         259       1  260   265

【讨论】:

以上是关于使用 Groovy 进行字符串连接的主要内容,如果未能解决你的问题,请参考以下文章

Jmeter通过groovy脚本,连接mongoDB

csharp 使用StringBuilder对象连接,比使用+ =进行字符串连接要好得多

Groovy:如何按字符串长度顺序对 String:s 的 ArrayList 进行排序?

IDEA连接数据库生成实体类方法与定制Groovy生成脚本

使用预处理器进行字符串连接

GroovyMOP 元对象协议与元编程 ( 使用 Groovy 元编程进行函数拦截 | 动态拦截函数 | 动态获取 MetaClass 中的方法 | evaluate 方法执行Groovy脚本 )