nginx正则表达式

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了nginx正则表达式相关的知识,希望对你有一定的参考价值。

我想通过nginx的正则表达式过滤掉xss攻击,站点的所有页面都是html结尾的。因此我这样写
location ~* html\?~*$
return 400;
expires 10d;


但我在浏览器执行一下代码还是显示的页面
http://www.abc.com/brand/cat976.html?<Script>alert(“XSS attack available!”);</Script>

没有返回400的错误页面。

请问是正则表达式写得不正确吗?

参考技术A “/index.php”请求同样先被字符location “/” 匹配,然后才被正则表达式“笔记:nginx是让客户端程序找到文件的目录位置。具体如何处理这个得让后端来

Nginx里的正则表达式

nginx.conf里面有几个大板块,第一部分是event,里面是设定最大并发数量。然后是各种协议,比如http\https\mail,一个http协议里面可以有多个server,每一个server对应的就是一个网站,在生产中,server 1和server 2乃至server n的内容是一样的,如果 server 1的服务器负载压力过大, nginx会启动负载均衡把用户都引向相对负载压力较小的服务器,这样可以达到保护服务器的目的。


而server下面可以有多个location,而location里就需要填写URI,那什么是URI呢?


URL:统一资源定位符

URI:同一资源标识符


举个例子:www.yahoo.com/nba/GoldenWarriors/players-curry.html,这一大串就是一个url,而uri指的是后面nba/GoldenWarriors/players-curry.html这一段。


location这个参数可以根据uri的不同需求进行配置,可以使用字符串和正则表达式匹配,使用字符串的话没啥说的,写啥就是对应啥;如果要使用正则表达式的话,语法是这样的:location [=|~|~*|^~] /uri/ {……},说一下中括号里各个东西的意思:

~:区分大小写;

~*:不区分大小写;

^~:禁止精确匹配;

=:精确匹配。下面举几个例子


1、location =/ {

    里面就是各个的详细信息

        }

这个使用了"=",所以采用的是精确匹配“/”,即只能访问nginx安装文件夹里的第一层所有文件,第二层的乃至更深的文件都无法访问。同理,当拒绝某ip访问的时候,也是仅仅拒绝这个ip地址访问“/”这个文件夹。


2、location /{

    里面是各种配置信息

    }

这里没有采用"=",也就是说只要是nginx安装文件夹下的所有文件,不管是第几层,只要在这个文件夹下都可以访问。


3、location ^~/images/{

    里面是各种配置信息

    }

首先这里先确定范围是nginx安装目录下的images文件下的所有子文件(包括其子文件夹),但是前面使用了^~,意思是禁止表达式匹配。


4、location ~* \.(gif|jpg|jpeg)${

    里面是各种配置信息

    }

不区分大小的匹配所有以.gif/.jpg/.jpeg结尾的文件夹,但是要注意,如果这个4号式子与上面那个3号式子一起写,无论是3上4下,还是4上3下,/images/下的文件会优先被3号式子选出。


比如,在nginx安装文件夹下有这样一个文件/images/1.gif。虽然它也是gif结尾,但是由于3式子先写,而且对文件夹的范围更精确,所以被3先挑出来,但是由于后面的^~,就脱离了正则的范围。不进入4的控制里。而如果有/AAA/1.jpg。这个文件就会被4挑选出来。

本文出自 “生活就是等待戈多” 博客,请务必保留此出处http://chenx1242.blog.51cto.com/10430133/1749737

以上是关于nginx正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

Nginx中的正则如何匹配数字

nginx-location正则表达式匹配规则及动静分离

nginx 正则表达式

nginx正则表达式(上篇)

Nginx里的正则表达式

一个规则正则表达式的 nginx 多个位置