nginx正则表达式
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了nginx正则表达式相关的知识,希望对你有一定的参考价值。
我想通过nginx的正则表达式过滤掉xss攻击,站点的所有页面都是html结尾的。因此我这样写
location ~* html\?~*$
return 400;
expires 10d;
但我在浏览器执行一下代码还是显示的页面
http://www.abc.com/brand/cat976.html?<Script>alert(“XSS attack available!”);</Script>
没有返回400的错误页面。
请问是正则表达式写得不正确吗?
Nginx里的正则表达式
nginx.conf里面有几个大板块,第一部分是event,里面是设定最大并发数量。然后是各种协议,比如http\https\mail,一个http协议里面可以有多个server,每一个server对应的就是一个网站,在生产中,server 1和server 2乃至server n的内容是一样的,如果 server 1的服务器负载压力过大, nginx会启动负载均衡把用户都引向相对负载压力较小的服务器,这样可以达到保护服务器的目的。
而server下面可以有多个location,而location里就需要填写URI,那什么是URI呢?
URL:统一资源定位符
URI:同一资源标识符
举个例子:www.yahoo.com/nba/GoldenWarriors/players-curry.html,这一大串就是一个url,而uri指的是后面nba/GoldenWarriors/players-curry.html这一段。
location这个参数可以根据uri的不同需求进行配置,可以使用字符串和正则表达式匹配,使用字符串的话没啥说的,写啥就是对应啥;如果要使用正则表达式的话,语法是这样的:location [=|~|~*|^~] /uri/ {……},说一下中括号里各个东西的意思:
~:区分大小写;
~*:不区分大小写;
^~:禁止精确匹配;
=:精确匹配。下面举几个例子
1、location =/ {
里面就是各个的详细信息
}
这个使用了"=",所以采用的是精确匹配“/”,即只能访问nginx安装文件夹里的第一层所有文件,第二层的乃至更深的文件都无法访问。同理,当拒绝某ip访问的时候,也是仅仅拒绝这个ip地址访问“/”这个文件夹。
2、location /{
里面是各种配置信息
}
这里没有采用"=",也就是说只要是nginx安装文件夹下的所有文件,不管是第几层,只要在这个文件夹下都可以访问。
3、location ^~/images/{
里面是各种配置信息
}
首先这里先确定范围是nginx安装目录下的images文件下的所有子文件(包括其子文件夹),但是前面使用了^~,意思是禁止表达式匹配。
4、location ~* \.(gif|jpg|jpeg)${
里面是各种配置信息
}
不区分大小的匹配所有以.gif/.jpg/.jpeg结尾的文件夹,但是要注意,如果这个4号式子与上面那个3号式子一起写,无论是3上4下,还是4上3下,/images/下的文件会优先被3号式子选出。
比如,在nginx安装文件夹下有这样一个文件/images/1.gif。虽然它也是gif结尾,但是由于3式子先写,而且对文件夹的范围更精确,所以被3先挑出来,但是由于后面的^~,就脱离了正则的范围。不进入4的控制里。而如果有/AAA/1.jpg。这个文件就会被4挑选出来。
本文出自 “生活就是等待戈多” 博客,请务必保留此出处http://chenx1242.blog.51cto.com/10430133/1749737
以上是关于nginx正则表达式的主要内容,如果未能解决你的问题,请参考以下文章