nginx 日志分析
Posted 程序员之圈
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了nginx 日志分析相关的知识,希望对你有一定的参考价值。
日志配置项
access_log /var/log/access.log access;
日志格式
log_format main '$remote_addr - $remote_user [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
192.168.0.89 - - [25/Mar/2018:23:40:32 -0700] "GET / HTTP/1.1" 200 396 "-" "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/58.0.3029.110 Safari/537.36"
具体可设置的参数格式及说明如下:
参数 |
说明 |
示例 |
$remote_addr |
211.28.65.253 |
|
$remote_user |
客户端用户名称 |
-- |
$time_local |
访问时间和时区 |
18/Jul/2012:17:00:01 +0800 |
$request |
请求的URI和HTTP协议 |
"GET /article-10000.html HTTP/1.1" |
$status |
HTTP请求状态 |
200 |
$upstream_status |
upstream状态 |
200 |
$body_bytes_sent |
发送给客户端文件内容大小 |
1547 |
$http_referer |
url跳转来源 |
- |
$http_user_agent |
用户终端浏览器等信息 |
"Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; SV1; GTB7.0; .NET4.0C; |
$ssl_protocol |
SSL协议版本 |
TLSv1 |
$ssl_cipher |
交换数据中的算法 |
RC4-SHA |
$upstream_addr |
10.10.10.100:80 |
|
$request_time |
整个请求的总时间 |
0.205 |
$upstream_response_time |
请求过程中,upstream响应时间 |
0.002 |
#监控日志
tail -n 30 -f access.log
tail -n 30 -f error.log
#IP相关统计
#统计IP访问量(独立ip访问数量)
awk '{print $1}' access.log | sort -n | uniq | wc -l
#查看某一时间段的IP访问量(4-5点)
grep "07/Apr/2017:0[4-5]" access.log | awk '{print $1}' | sort | uniq -c| sort -nr | wc -l
#查看访问最频繁的前100个IP
awk '{print $1}' access.log | sort -n |uniq -c | sort -rn | head -n 100
#查看访问100次以上的IP
awk '{print $1}' access.log | sort -n |uniq -c |awk '{if($1 >100) print $0}'|sort -rn
#查询某个IP的详细访问情况,按访问频率排序
grep '127.0.01' access.log |awk '{print $7}'|sort |uniq -c |sort -rn |head -n 100
#页面访问统计
#查看访问最频的页面(TOP100)
awk '{print $7}' access.log | sort |uniq -c | sort -rn | head -n 100
#查看访问最频的页面([排除php页面】(TOP100)
grep -v ".php" access.log | awk '{print $7}' | sort |uniq -c | sort -rn | head -n 100
#查看页面访问次数超过100次的页面
cat access.log | cut -d ' ' -f 7 | sort |uniq -c | awk '{if ($1 > 100) print $0}' | less
#查看最近1000条记录,访问量最高的页面
tail -1000 access.log |awk '{print $7}'|sort|uniq -c|sort -nr|less
#每秒请求量统计
#统计每秒的请求数,top100的时间点(精确到秒)
awk '{print $4}' access.log |cut -c 14-21|sort|uniq -c|sort -nr|head -n 100
#每分钟请求量统计
#统计每分钟的请求数,top100的时间点(精确到分钟)
awk '{print $4}' access.log |cut -c 14-18|sort|uniq -c|sort -nr|head -n 100
#每小时请求量统计
#统计每小时的请求数,top100的时间点(精确到小时)
awk '{print $4}' access.log |cut -c 14-15|sort|uniq -c|sort -nr|head -n 100
#性能分析
#在nginx log中最后一个字段加入$request_time
#列出传输时间超过 3 秒的页面,显示前20条
cat access.log|awk '($NF > 3){print $7}'|sort -n|uniq -c|sort -nr|head -20
#列出php页面请求时间超过3秒的页面,并统计其出现的次数,显示前100条
cat access.log|awk '($NF > 1 && $7~/\.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100
#蜘蛛抓取统计
#统计蜘蛛抓取次数
grep 'Baiduspider' access.log |wc -l
#统计蜘蛛抓取404的次数
grep 'Baiduspider' access.log |grep '404' | wc -l
#TCP连接统计
#查看当前TCP连接数
netstat -tan | grep "ESTABLISHED" | grep ":80" | wc -l
#用tcpdump嗅探80端口的访问看看谁最高
tcpdump -i eth0 -tnn dst port 80 -c 1000 | awk -F"." '{print $1"."$2"."$3"."$4}' | sort | uniq -c | sort -nr
以上是关于nginx 日志分析的主要内容,如果未能解决你的问题,请参考以下文章