Java 正则表达式:如何匹配 URL 路径?

Posted

技术标签:

【中文标题】Java 正则表达式:如何匹配 URL 路径?【英文标题】:Java Regex: How to Match URL Path? 【发布时间】:2014-08-23 17:01:02 【问题描述】:

我正在尝试提取 URL 路径的第一部分。例如:从http://foo.com/bar/1/2/3我要提取bar。这是我正在使用的代码:

private static String getFirstPartOfPath(String url)

    Pattern pattern = Pattern.compile("^https?://[^/]+/([^/]+)/*$");
    Matcher matcher = pattern.matcher(url);
    if(matcher.find())
    
        System.out.println(matcher.group(1));
    
    return null;

但是,这与上面列出的最琐碎的 url 不匹配,如

public static void main(String[] args)

    getFirstPartOfPath("http://foo.com/bar/1/2/3");

什么都不打印。乍一看,模式字符串似乎很清晰,并且显然应该可以工作。出了什么问题?

【问题讨论】:

【参考方案1】:

不匹配,因为您的正则表达式不正确。你最后有/*/.* 不一样。

使用这个正则表达式:

Pattern pattern = Pattern.compile("^https?://[^/]+/([^/]+)/.*$");

或者删除锚$

Pattern pattern = Pattern.compile("^https?://[^/]+/([^/]+)/");

【讨论】:

知道了,谢谢。当 SO 允许我在 9 分钟内时,我会接受。

以上是关于Java 正则表达式:如何匹配 URL 路径?的主要内容,如果未能解决你的问题,请参考以下文章

求一个正则表达式:校验url和磁盘路径。

php正则匹配图片路径

java匹配url的正则表达式

Nginx学习笔记04URL匹配规则和实际路径

来自 URL 的正则表达式 URL 路径

正则表达式匹配除特定路径之外的所有https URL