nginx 使用 OR 在正则表达式中设置地图

Posted

技术标签:

【中文标题】nginx 使用 OR 在正则表达式中设置地图【英文标题】:nginx using OR set at regex for the map 【发布时间】:2017-12-16 04:08:19 【问题描述】:

我正在尝试为我的网站编写地图,效果很好:

map $request_uri $redirect_uri 
  /en/oldname    /en/newname;
  /de/oldname    /de/newname;
  /fr/oldname    /fr/newname;

直到我尝试实现一些正则表达式,像这样:

map $request_uri $redirect_uri 
  /(?<lang>(en|de|fr))/oldname    /$lang/newname;

上面的地图不起作用,并且由于缺乏调试知识 - 我无法知道为什么。即使是基本的正则表达式(不使用命名捕获)也不适合我:

map $request_uri $redirect_uri 
  /(en|de|fr)/oldname    /en/newname;

nginx 1.10.3

请帮我弄清楚我做错了什么?

【问题讨论】:

【参考方案1】:

Mike,你应该使用“~”符号来表示正则表达式。

看这里Module ngx_http_map_module

正则表达式应该从“~”符号开始进行区分大小写的匹配,或者从“~*”符号(1.0.4)开始进行不区分大小写的匹配。正则表达式可以包含命名和位置捕获,这些捕获随后可以与结果变量一起在其他指令中使用。

正确的配置应该是:

map $request_uri $redirect_uri 
  ~/(?<lang>(en|de|fr))/oldname    /$lang/newname;

祝你好运!


2017.07.13 编辑

这里是基于默认配置的完整配置(echo 指令由 nginx-echo-module 提供)

#user  nobody;
worker_processes  1;

#error_log  logs/error.log;
#error_log  logs/error.log  notice;
#error_log  logs/error.log  info;

#pid        logs/nginx.pid;


events 
    worker_connections  1024;



http 
    include       mime.types;
    default_type  application/octet-stream;

    #log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
    #                  '$status $body_bytes_sent "$http_referer" '
    #                  '"$http_user_agent" "$http_x_forwarded_for"';

    #access_log  logs/access.log  main;

    sendfile        on;
    #tcp_nopush     on;

    #keepalive_timeout  0;
    keepalive_timeout  65;

    #gzip  on;
    map $request_uri $redirect_uri 
      ~/(?<lang>(en|de|fr))/oldname    /$lang/newname;
    

    server 
        listen       80;
        server_name  localhost;

        #charset koi8-r;

        #access_log  logs/host.access.log  main;

        location / 
            echo $redirect_uri;
        

        #error_page  404              /404.html;

        # redirect server error pages to the static page /50x.html
        #
        error_page   500 502 503 504  /50x.html;
        location = /50x.html 
            root   html;
        

        # proxy the php scripts to Apache listening on 127.0.0.1:80
        #
        #location ~ \.php$ 
        #    proxy_pass   http://127.0.0.1;
        #

        # pass the PHP scripts to FastCGI server listening on 127.0.0.1:9000
        #
        #location ~ \.php$ 
        #    root           html;
        #    fastcgi_pass   127.0.0.1:9000;
        #    fastcgi_index  index.php;
        #    fastcgi_param  SCRIPT_FILENAME  /scripts$fastcgi_script_name;
        #    include        fastcgi_params;
        #

        # deny access to .htaccess files, if Apache's document root
        # concurs with nginx's one
        #
        #location ~ /\.ht 
        #    deny  all;
        #
    


    # another virtual host using mix of IP-, name-, and port-based configuration
    #
    #server 
    #    listen       8000;
    #    listen       somename:8080;
    #    server_name  somename  alias  another.alias;

    #    location / 
    #        root   html;
    #        index  index.html index.htm;
    #    
    #


    # HTTPS server
    #
    #server 
    #    listen       443 ssl;
    #    server_name  localhost;

    #    ssl_certificate      cert.pem;
    #    ssl_certificate_key  cert.key;

    #    ssl_session_cache    shared:SSL:1m;
    #    ssl_session_timeout  5m;

    #    ssl_ciphers  HIGH:!aNULL:!MD5;
    #    ssl_prefer_server_ciphers  on;

    #    location / 
    #        root   html;
    #        index  index.html index.htm;
    #    
    #


这是我的测试用例:

yxr nginx # curl localhost/en/oldname
/en/newname
yxr nginx # curl localhost/de/oldname
/de/newname
yxr nginx # curl localhost/fr/oldname
/fr/newname
yxr nginx # curl localhost/cn/oldname

yxr nginx #

2017.07.14 编辑

正如@Mike 指出的那样,这至少需要nginx/1.11.0

【讨论】:

谢谢您的回答,是的,您是对的,我必须使用“~”符号。但不幸的是,它也不是这样工作的。我发现另一个注释“结果值可以包含文本、变量 (0.9.0) 及其组合 (1.11.0)。” - 这可能是我的问题吗?字面意思是我不能使用正则表达式来缩短行数? @Mike 我已经发布了我的完整配置和测试用例。祝你好运! 谢谢,准备测试一下。你用的是什么版本的 nginx? @Mike 我用的是 nginx/1.11.8 谢谢,正如我在上面的评论中所说,版本 > 1.11.0 是必需的,而我有 1.10.3,所以命名捕获的使用不支持我。所以我已经升级到 1.12.1,它现在似乎可以工作了。我会接受您的回答,但请使用有关最低要求版本的信息进行更新。附加问题,你知道我怎样才能实现这样的东西:~/(?(en|de|fr))/oldname-$lang /$lang/newname;?【参考方案2】:

关于mononoke的回答。您不需要在模式匹配中使用额外的括号集,这可能会给某些 pcre 引擎带来一些意想不到的结果,因为您从技术上讲是在 lang 组中添加另一个组。

~/(?<lang>en|de|fr)/oldname    /$lang/newname;

【讨论】:

【参考方案3】:
map $http_user_agent $loggable 
    "~kube-probe"   0;
    default         1;

【讨论】:

以上是关于nginx 使用 OR 在正则表达式中设置地图的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式与 C# 中的 OR 条件最长匹配

Python 正则表达式

qtreewidget设置正则表达式

6-1 文本处理工具和正则表达式

Grafana _field 显示名称模式 - 范围或正则表达式

使用正则表达式查找哈希表/字典/地图