PatternSyntaxException:在 Java 中使用正则表达式时出现非法重复

Posted

技术标签:

【中文标题】PatternSyntaxException:在 Java 中使用正则表达式时出现非法重复【英文标题】:PatternSyntaxException: Illegal Repetition when using regex in Java 【发布时间】:2012-02-03 19:22:46 【问题描述】:

我不太了解正则表达式,但我需要匹配一个简单的模式。以下应返回 true,

Pattern.matches("\"user_id\" : [0-9]*", inputLine)

当 inputLine 为时

"user_id" : 34

但是,我遇到了这个异常:

java.util.regex.PatternSyntaxException: Illegal repetition
"user_id" : 24
    at java.util.regex.Pattern.error(Unknown Source)
    at java.util.regex.Pattern.closure(Unknown Source)
    at java.util.regex.Pattern.sequence(Unknown Source)
    at java.util.regex.Pattern.expr(Unknown Source)
    at java.util.regex.Pattern.compile(Unknown Source)
    at java.util.regex.Pattern.<init>(Unknown Source)
    at java.util.regex.Pattern.compile(Unknown Source)
    at java.util.regex.Pattern.matches(Unknown Source)
    at org.whispercomm.manes.server.http.IntegrationTest.createUser(IntegrationTest.java:173)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(Unknown Source)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(Unknown Source)
    at java.lang.reflect.Method.invoke(Unknown Source)
    at org.junit.runners.model.FrameworkMethod$1.runReflectiveCall(FrameworkMethod.java:45)
    at org.junit.internal.runners.model.ReflectiveCallable.run(ReflectiveCallable.java:15)
    at org.junit.runners.model.FrameworkMethod.invokeExplosively(FrameworkMethod.java:42)
    at org.junit.internal.runners.statements.InvokeMethod.evaluate(InvokeMethod.java:20)
    at org.junit.internal.runners.statements.RunBefores.evaluate(RunBefores.java:28)
    at org.junit.internal.runners.statements.RunAfters.evaluate(RunAfters.java:30)
    at org.junit.runners.ParentRunner.runLeaf(ParentRunner.java:263)
    at org.junit.runners.BlockJUnit4ClassRunner.runChild(BlockJUnit4ClassRunner.java:68)
    at org.junit.runners.BlockJUnit4ClassRunner.runChild(BlockJUnit4ClassRunner.java:47)
    at org.junit.runners.ParentRunner$3.run(ParentRunner.java:231)
    at org.junit.runners.ParentRunner$1.schedule(ParentRunner.java:60)
    at org.junit.runners.ParentRunner.runChildren(ParentRunner.java:229)
    at org.junit.runners.ParentRunner.access$000(ParentRunner.java:50)
    at org.junit.runners.ParentRunner$2.evaluate(ParentRunner.java:222)
    at org.junit.internal.runners.statements.RunBefores.evaluate(RunBefores.java:28)
    at org.junit.runners.ParentRunner.run(ParentRunner.java:300)
    at org.eclipse.jdt.internal.junit4.runner.JUnit4TestReference.run(JUnit4TestReference.java:50)
    at org.eclipse.jdt.internal.junit.runner.TestExecution.run(TestExecution.java:38)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.runTests(RemoteTestRunner.java:467)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.runTests(RemoteTestRunner.java:683)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.run(RemoteTestRunner.java:390)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.main(RemoteTestRunner.java:197)

我做错了什么?

【问题讨论】:

【参考方案1】:

在 Java 的正则表达式方言(以及大多数其他方言)中是特殊的:它们是重复量词 n,m 的开始和结束标记,其中 nm 是整数。因此出现错误消息:“非法重复”。

你应该避开它们:"\\\"user_id\" : [0-9]*\\"

由于您似乎正在尝试解析 JSON,我建议您查看Jackson。

【讨论】:

作为旁注,括号[ ] 也是保留的。 ***.com/questions/14442162/… 捕获组中使用的括号 ( ) 相同。【参考方案2】:

应该有加号:

user_id : [0-9]+

仅当字符串必须包含双撇号时。

当包含大括号的字符串使用:

\user_id : [0-9]+\

【讨论】:

答案是我需要转义。但是,我确实需要 + 而不是 *

以上是关于PatternSyntaxException:在 Java 中使用正则表达式时出现非法重复的主要内容,如果未能解决你的问题,请参考以下文章

标记化错误:java.util.regex.PatternSyntaxException,悬空元字符“*”

java.util.regex.PatternSyntaxException: Unexpected internal error near index 1 ^

java.util.regex.PatternSyntaxException: Unexpected internal error near index 1 ^

PatternSyntaxException类(java JDK源码记录)

java.util.regex.PatternSyntaxException:索引附近的正则表达式模式中的语法错误

Exception in thread "main" java.util.regex.PatternSyntaxException: Unclosed character clas