美文网首页
Linux Awk使用案例总结-nginx日志统计

Linux Awk使用案例总结-nginx日志统计

作者: FrancisSoung | 来源:发表于2018-03-12 10:44 被阅读153次

Nginx日志分析(截图和文字日志格式不同)

日志格式:'$remote_addr - $remote_user [$time_local] "$request" $status $body_bytes_sent "$http_referer" "$http_user_agent" "$http_x_forwarded_for"'

日志记录:27.189.231.39 - - [09/Apr/2016:17:21:23 +0800] "GET /Public/index/images/icon_pre.png HTTP/1.1" 200 44668 "http://www.test.com/Public/index/css/global.css" "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36" “-“

image.png

1)统计日志中访问最多的10个IP

思路:对第一列进行去重,并输出出现的次数

方法1:$ awk '{a[$1]++}END{for(i in a)print a[i],i|"sort -k1 -nr|head -n10"}' access.log

方法2:$ awk '{print $1}' access.log |sort |uniq -c |sort -k1 -nr |head -n10

说明:a[$1]++ 创建数组a,以第一列作为下标,使用运算符++作为数组元素,元素初始值为0。处理一个IP时,下标是IP,元素加1,处理第二个IP时,下标是IP,元素加1,如果这个IP已经存在,则元素再加1,也就是这个IP出现了两次,元素结果是2,以此类推。因此可以实现去重,统计出现次数。

image.png

2)统计日志中访问大于100次的IP

方法1:$ awk '{a[$1]++}END{for(i in a){if(a[i]>100)print i,a[i]}}' access.log

方法2:$ awk '{a[$1]++;if(a[$1]>100){b[$1]++}}END{for(i in b){print i,a[i]}}' access.log

说明:方法1是将结果保存a数组后,输出时判断符合要求的IP。方法2是将结果保存a数组时,并判断符合要求的IP放到b数组,最后打印b数组的IP。

image.png

3)统计2017年11月15日一天内访问最多的10个IP

思路:先过滤出这个时间段的日志,然后去重,统计出现次数

方法1:$ awk '$4>="[9/Apr/2016:00:00:01" && $4<="[9/Apr/2016:23:59:59" {a[$1]++}END{for(i in a)print a[i],i|"sort -k1 -nr|head -n10"}' access.log

方法2:$ sed -n '/\[9\/Apr\/2016:00:00:01/,/\[9\/Apr\/2016:23:59:59/p' access.log |sort |uniq -c |sort -k1 -nr |head -n10 #前提开始时间与结束时间日志中必须存在

image.png

4)统计当前时间前一分钟的访问数

思路:先获取当前时间前一分钟对应日志格式的时间,再匹配统计

$ date=$(date -d '-1 minute' +%d/%b/%Y:%H:%M);awk -vdate=$date '$0~date{c++}END{print c}' access.log

$ date=$(date -d '-1 minute' +%d/%b/%Y:%H:%M);awk -vdate=$date '$4>="["date":00" && $4<="["date":59"{c++}END{print c}' access.log

$ grep -c $(date -d '-1 minute' +%d/%b/%Y:%H:%M) access.log

说明:date +%d/%b/%Y:%H:%M --> 09/Apr/2016:01:55

image.png

5)统计访问最多的前10个页面($request)

$ awk '{a[$7]++}END{for(i in a)print a[i],i|"sort -k1 -nr|head -n10"}' access.log

image.png

6)统计每个URL访问内容的总大小($body_bytes_sent)

$ awk '{a[$7]++;size[$7]+=$10}END{for(i in a)print a[i],size[i],i}’ access.log

image.png

7)统计每个IP访问状态码数量($status)

$ awk '{a[$1" "$9]++}END{for(i in a)print i,a[i]}’ access.log

image.png

8)统计访问状态码为404的IP及出现次数

$ awk '{if($9~/404/)a[$1" "$9]++}END{for(i in a)print i,a[i]}' access.log

image.png

相关文章

  • Linux Awk使用案例总结-nginx日志统计

    Nginx日志分析(截图和文字日志格式不同) 日志格式:'$remote_addr - $remote_user ...

  • 通过nginx日志统计qps

    统计awk 当天的qps 解释:$4 = 就是取nginx日志的第四个内容(nginx是以空格区分)uniq -c...

  • 使用awk解析url参数

    使用awk解析url参数 问题描述:线上nginx日志格式如下:"60.10.97.182 - - [23/Nov...

  • 打印文件中指定的内容

    如题所示,常常用于筛选出nginx日志中指定的内容需要结合cat,sort,awk,uniq关于linux用法,大...

  • 19.实战 - 日志分析

    参考 利用Shell进行Web日志分析 nginx或者apache日志统计前十访问的URI Linux比赛 - 实...

  • linux常用脚本

    统计linux链接状态 ``` netstat -an | awk '/^tcp/ {++S[$NF]} END ...

  • 心得-2017/5/9

    一、关于nginx日志统计分析的心得总结 第一步:对nginx日志进行垃圾过滤 一般共性需要考虑过滤的内容包括: ...

  • nginx (转载)

    nginx访问量统计 1.根据访问IP统计UV awk '{print $1}' access.log|sort ...

  • awk日志统计

    Nginx Access Log日志统计分析常用命令 IP相关统计 1、统计IP访问量 2、查看某一时间段的IP访...

  • 了解如何配置Nginx日志!

    了解如何配置Nginx日志! 前言 Nginx日志对于统计、系统服务排错很有用。 Nginx日志主要分为两种:ac...

网友评论

      本文标题:Linux Awk使用案例总结-nginx日志统计

      本文链接:https://www.haomeiwen.com/subject/yeqnfftx.html