首页 > 其他 > 详细

nginx筛选字段+excel统计

时间:2021-06-01 00:37:11      阅读:46      评论:0      收藏:0      [点我收藏+]

nginx筛选字段+excel统计

  今天临下班的时候,领导叫我统计下即将举行的xx活动中,所有接口url在整天测试过程中,平均访问时间分别是多少,然后降序排序列出来,好让分析性能瓶颈。

  第一次遇到这样的需求,以为要搞很久,领导也比较体贴,知道我没弄过之后,竟然帮我问开发是否了解,linux是否有现成的统计函数,我都猜只能从nginx日志去分析的了~~~果不其然。

  幸好领导帮我化繁为简:叫我先筛选nginx中两列数据:url ,upstream_response_time,然后再导出来放到excel ,作进一步统计分析。

一、nginx筛选字段

1、先查看nginx中对日志格式定义

   log_format json {"@timestamp":"$time_iso8601",
  "host":"$server_addr",
  "clientip":"$remote_addr",
  "size":$body_bytes_sent,
  "responsetime":$request_time,
  "upstreamtime":$upstream_response_time,
  "upstreamhost":"$upstream_addr",
  "http_host":"$host",
  "url":"$uri",
  "xff":"$http_x_forwarded_for",
  "referer":"$http_referer",
  "agent":"$http_user_agent",
  "status":"$status"};  

2、顺带观察日志输出 ——》非必须

摘录一条具体日志,如下(为了保密,一些字段信息我改了下)

{"@timestamp":"2021-05-31T09:10:02+08:00","host":"123.14.16.8","clientip":"119.129.123.213","size":8097,"responsetime":0.007,"upstreamtime":0.007,"upstreamhost":"172.12.11.14:8291","http_host":"act.ljysai.cn","url":"/gyp/gyp/images/logo_defaultHead.png","xff":"-","referer":"https://act.ljysai.cn/gyp/gyp/manage/index.html","agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36","status":"200"}

3、最终核心处理命令:

 cat  活动.access.log | awk -F " {print $30"\t"$19} | tr -d :  | tr -d , > /tmp/活动_20210531.log

为啥要用 tr 命令呢,因为响应时间筛选完之后,实际上长这种样子

技术分享图片

 

然后我导出完之后,就不知道怎么进行excel处理了,还是我们的领导厉害呀,简直是excel小能力,请收下我的膝盖。。。。

二、excel统计

1、原始数据长这样:

技术分享图片

 

2、最终成品

技术分享图片

 

具体过程,我都是凭记忆敲的,可能有误导成分。。。为了不影响我领导伟大的杰作,俺自己复制一个玩

(1)选中“数据透视表”

技术分享图片

 

 

(2)

nginx筛选字段+excel统计

原文:https://www.cnblogs.com/windysai/p/14833625.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!