使用正则表达式获取字符串中模式的索引

Posted

技术标签:

【中文标题】使用正则表达式获取字符串中模式的索引【英文标题】:Get the index of a pattern in a string using regex 【发布时间】:2012-02-14 20:19:08 【问题描述】:

我想在字符串中搜索特定模式。

正则表达式类是否提供模式在字符串中的位置(字符串中的索引)? 模式的出现次数可能超过 1 次。 有什么实际的例子吗?

【问题讨论】:

docs.oracle.com/javase/6/docs/api/java/util/regex/Matcher.html 【参考方案1】:

使用Matcher:

public static void printMatches(String text, String regex) 
    Pattern pattern = Pattern.compile(regex);
    Matcher matcher = pattern.matcher(text);
    // Check all occurrences
    while (matcher.find()) 
        System.out.print("Start index: " + matcher.start());
        System.out.print(" End index: " + matcher.end());
        System.out.println(" Found: " + matcher.group());
    

【讨论】:

【参考方案2】:
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexMatches

    public static void main( String args[] )

      // String to be scanned to find the pattern.
      String line = "This order was places for QT3000! OK?";
      String pattern = "(.*)(\\d+)(.*)";

      // Create a Pattern object
      Pattern r = Pattern.compile(pattern);

      // Now create matcher object.
      Matcher m = r.matcher(line);
      if (m.find( )) 
         System.out.println("Found value: " + m.group(0) );
         System.out.println("Found value: " + m.group(1) );
         System.out.println("Found value: " + m.group(2) );
       else 
         System.out.println("NO MATCH");
      
   

结果

Found value: This order was places for QT3000! OK?
Found value: This order was places for QT300
Found value: 0

【讨论】:

投反对票时请发表评论! @Shadow 我认为这已被否决,因为它没有作为 OP 请求提供匹配的索引... 好吧...我投了反对票,因为这个答案没有解决问题。 你的正则表达式也有问题。第一个 (.*) 最初消耗整个字符串,然后它后退到足以让 (\d+) 匹配一个数字,然后让第二个 (.*) 消耗剩下的任何内容。我想说,这不是一个特别有用的结果。哦,你在结果中留下了group(3) 不给索引【参考方案3】:

Jean Logeart 的特别版回答

public static int[] regExIndex(String pattern, String text, Integer fromIndex)
    Matcher matcher = Pattern.compile(pattern).matcher(text);
    if ( ( fromIndex != null && matcher.find(fromIndex) ) || matcher.find()) 
        return new int[]matcher.start(), matcher.end();
    
    return new int[]-1, -1;

【讨论】:

以上是关于使用正则表达式获取字符串中模式的索引的主要内容,如果未能解决你的问题,请参考以下文章

Java基础-正则表达式

用于获取仅包含模式列表中单词的字符串的正则表达式?

在javascript中匹配具有多个正则表达式模式的字符串

正则表达式获取 C# 中模式的所有可能匹配项

Pandas - 使用模式/正则表达式编辑索引

python正则表达式