NGINX 中文日志十六进制编码问题

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NGINX 中文日志十六进制编码问题相关的知识,希望对你有一定的参考价值。

nginx访问日志在处理中文时,默认使用16进制编码处理。使我们对访问日志进行分析处理时,带来很大不便。含有中文字符的请求,日志记录如下:

171.43.238.62 - - [05/Dec/2017:21:40:57 +0800] "GET /xD6xD0xCExC4 HTTP/1.1" 404 171 "-" "curl/7.56.0"

问题解决方案:

  1. nginx版本需大于1.11.8
  2. 在定义 access log 格式时,加上 escape=json

日志格式示例:

log_format  main escape=json ‘$remote_addr - $remote_user [$time_local] "$request" ‘
                            ‘$status $body_bytes_sent "$http_referer" ‘
                            ‘"$http_user_agent" "$http_x_forwarded_for"‘;

结果:

47.52.167.143 -  [05/Dec/2017:21:55:59 +0800] "GET /中文 HTTP/1.1" 404 171 "" "curl/7.19.7 (x86_64-redhat-linux-gnu) libcurl/7.19.7 NSS/3.27.1 zlib/1.2.3 libidn/1.18 libssh2/1.4.2" ""

以上是关于NGINX 中文日志十六进制编码问题的主要内容,如果未能解决你的问题,请参考以下文章

NGINX 中文日志十六进制编码问题

nginx日志编码突然变成十六进制

C#解码base64编码的二进制数据的代码

nginx日志中$request_body 十六进制字符(\x22) 引号问题处理记录

在nginx日志access log可以记录POST请求的参数值

python分析apache和nginx日志文件输出访客ip列表的代码