如何在 Java 中的 String.contains() 方法中使用正则表达式
Posted
技术标签:
【中文标题】如何在 Java 中的 String.contains() 方法中使用正则表达式【英文标题】:How to use regex in String.contains() method in Java 【发布时间】:2013-02-14 08:03:04 【问题描述】:我想检查一个字符串是否按顺序包含“stores”、“store”和“product”这三个词,无论它们之间是什么。
我尝试使用someString.contains(stores%store%product);
和.contains("stores%store%product");
我是否需要显式声明正则表达式并将其传递给方法,还是根本不传递正则表达式?
【问题讨论】:
【参考方案1】:String.contains
String.contains
与字符串、句点一起使用。它不适用于正则表达式。它将检查指定的确切字符串是否出现在当前字符串中。
注意String.contains
不检查字边界;它只是检查子字符串。
正则表达式解决方案
正则表达式比String.contains
更强大,因为您可以在关键字上强制执行单词边界(除其他外)。这意味着您可以将关键字搜索为 words,而不仅仅是 substrings。
将String.matches
与以下正则表达式一起使用:
"(?s).*\\bstores\\b.*\\bstore\\b.*\\bproduct\\b.*"
RAW 正则表达式(删除在字符串文字中完成的转义 - 这是您在打印出上面的字符串时得到的):
(?s).*\bstores\b.*\bstore\b.*\bproduct\b.*
\b
检查单词边界,这样您就不会得到restores store products
的匹配项。请注意,stores 3store_product
也被拒绝,因为 digit 和 _
被认为是单词的一部分,但我怀疑这种情况是否出现在自然文本中。
由于两边都检查了单词边界,所以上面的正则表达式将搜索确切的单词。换句话说,stores stores product
将不匹配上面的正则表达式,因为您正在搜索单词 store
而没有 s
。
.
通常匹配任何字符除了 a number of new line characters。开头的(?s)
使.
匹配任何字符,无一例外(感谢Tim Pietzcker 指出这一点)。
【讨论】:
如果字符串包含换行符,您可能需要将(?s)
添加到正则表达式的开头。
我在这样的 URL 中检查它>> stores.nextag.com/store/4908844/product/1070625777/…
你能解释一下这里的第一个反斜杠吗\\b
@vipin8169:在字符串中,您需要将\
加倍以指定单个\
,因此\\b
将被解释为\b
,如RAW 正则表达式所示。 \b
匹配单词边界,如上所述。
如果需要匹配“.mydomain”。在字符串中。那么它将如何更新正则表达式。我的用例是“www.abc.mydomain.in.io”是否包含.mydomain。与否【参考方案2】:
matcher.find()
可以满足您的需求。示例:
Pattern.compile("stores.*store.*product").matcher(someString).find();
【讨论】:
喜欢这个。我发现 matcher 的正则表达式过于复杂。【参考方案3】:你可以简单地使用String类的matches
方法。
boolean result = someString.matches("stores.*store.*product.*");
【讨论】:
您需要以.*
开头,否则它只会匹配以stores
开头的字符串。
尝试将整个区域与模式匹配。 看来@shmosel 是对的,不是吗?
嗯,它只是匹配,但不检查字符串是否在任何位置包含模式。这不是 OP 寻找的解决方案,我建议改进正则表达式。【参考方案4】:
如果你想检查一个字符串是否包含子字符串或不使用正则表达式,你可以做的最接近的是使用 find() -
private static final validPattern = "\\bstores\\b.*\\bstore\\b.*\\bproduct\\b"
Pattern pattern = Pattern.compile(validPattern);
Matcher matcher = pattern.matcher(inputString);
System.out.print(matcher.find()); // should print true or false.
注意matches() 和find() 之间的区别,如果整个字符串匹配给定的模式,matches() 会返回true。 find() 尝试查找与给定输入字符串中的模式匹配的子字符串。此外,通过使用 find() 您不必在正则表达式模式的开头添加额外的匹配,例如 - (?s).* 和 .* 。
【讨论】:
【参考方案5】:public static void main(String[] args)
String test = "something hear - to - find some to or tows";
System.out.println("1.result: " + contains("- to -( \\w+) som", test, null));
System.out.println("2.result: " + contains("- to -( \\w+) som", test, 5));
static boolean contains(String pattern, String text, Integer fromIndex)
if(fromIndex != null && fromIndex < text.length())
return Pattern.compile(pattern).matcher(text).find();
return Pattern.compile(pattern).matcher(text).find();
1.结果:真
2.结果:真
【讨论】:
fromIndex
被忽略了,不是吗? contains("something", test, 5) => true
【参考方案6】:
从 Java 11 开始,可以使用返回 Predicate<String>
的 Pattern#asMatchPredicate
。
String string = "stores%store%product";
String regex = "stores.*store.*product.*";
Predicate<String> matchesRegex = Pattern.compile(regex).asMatchPredicate();
boolean match = matchesRegex.test(string); // true
该方法能够链接 与其他字符串谓词,只要Predicate
提供and
、or
和negate
方法,这是该方法的主要优点。 p>
String string = "stores$store$product";
String regex = "stores.*store.*product.*";
Predicate<String> matchesRegex = Pattern.compile(regex).asMatchPredicate();
Predicate<String> hasLength = s -> s.length() > 20;
boolean match = hasLength.and(matchesRegex).test(string); // false
【讨论】:
以上是关于如何在 Java 中的 String.contains() 方法中使用正则表达式的主要内容,如果未能解决你的问题,请参考以下文章
java - 如何检查是不是在java中的不同类中单击了按钮?
如何在 Java 中的 javaPairRDD 上使用 aggregateByKey?