python分析nginx日志
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python分析nginx日志相关的知识,希望对你有一定的参考价值。
问题:分析nginx日志并找出访问最多10个IP地址的来源以及次数
使用python模块IP
使用方法以及下载地址:https://pypi.python.org/pypi/17MonIP
相关python脚本:
#!/usr/bin/env python #coding:utf8 #Auth: lad #date:2016-12-05 #desc:parser the nginx‘s log,the head of 10 import sys reload(sys) sys.setdefaultencoding( "utf-8" ) import IP import os cnt=10 fd = open("/tmp/IP.txt","w") ipStr = os.popen("cat /tmp/access.log|awk ‘{print $6}‘|sort | uniq -c | sort -nr | head -10 ") fd.write(ipStr.read()) fd.close() fd1 = open("/tmp/IP.txt","r") fd2 = open("/tmp/nginx_IP.txt","w+") for i in range(1,cnt+1): d = fd1.readline() print >> fd2,"访问次数:%8s 访问IP:%16s IP地址来源:%20s"%(d.split()[0],d.split()[1],IP.find(d.split()[1])) fd1.close() fd2.close() print "OK"
具体使用awk分割的时候需要考虑自己日志的格式,根据格式切割。
本文出自 “share,open source” 博客,请务必保留此出处http://liqilong2010.blog.51cto.com/3029053/1882398
以上是关于python分析nginx日志的主要内容,如果未能解决你的问题,请参考以下文章