当前位置: 首页 > news >正文

Linux文本文件管理003

★排序、去重、统计★

1)排序

sort -n按照数值排序
-r降序排列

2)去重

uniq 过滤相邻、重复的行
-c 对重复行计数

3)统计

wc 统计文件中的字节数、单词数、行数
-l 显示行数

今天通过使用grep、awk、cut指令和上面几个选项提取文本文件的信息

方法1:

[root@localhost nginx]# cat access.log | awk '{print $1}'| sort -rn | uniq -c | sort -rn | head 
Cat 查看文本文件
| awk '{print $1}' 通过管道| 将cat信息传输给awk
{print $1}限制每一行的第一个字段
| sort -rn 将之前的提取数排序
| uniq -c 去重 -c对于重复的数进行计数
| sort -rn 对于之前去重的数再次进行排序
| head 显示前10行

方法2:

[root@localhost nginx]# awk '{print $1}' access.log | sort -rn | uniq -c | sort -rn | head 
 awk '{print $1}' access.log 通过awk指令打印每一行的第一字符
| sort -rn 将之前的提取数排序
| uniq -c 去重 -c对于重复的数进行计数
| sort -rn 对于之前去重的数再次进行排序
| head 显示前10行

方法3:

[root@local-host nginx]# cut -d' ' -f1 access.log | sort -rn | uniq -c | sort -rn | head 
# cut -d' ' -f1 access.log  -d’ ’指定字符分隔符为单个空格
-f1 每行提取第一个字符
| sort -rn 将之前的提取数排序
| uniq -c 去重 -c对于重复的数进行计数
| sort -rn 对于之前去重的数再次进行排序
| head 显示前10行

方法4:

[root@localhost nginx]# grep -oP '^\S+' access.log | sort | uniq -c | sort -nr | head 
grep -oP '^\S+' access.log 
-P开启perl正则表达式    
-o 只输出匹配的内容
'^\S+'   ^字符串定位行首     \S 匹配任何非空白字符 包括字母、数字、标点符号。 除了空格、制表符、换行符等空白字符之外的任何字符     +  一个量词  \S+匹配一个或者多个非空白字符
| sort -rn 将之前的提取数排序
| uniq -c 去重 -c对于重复的数进行计数
| sort -rn 对于之前去重的数再次进行排序
| head 显示前10行

方法5:

[root@localhost nginx]# awk '{ip[$1]++} END {for (i in ip) print ip[i], i | "sort -rn | head" }' access.log 
awk '{ip[$1]++}     awk  读取每一行    
{ip[$1]++}   ip[] 关联数组名为ip
$1限定第一个字段
++ 检查第一字段 若已存在会自动加1 ,若不存在,会自动创建初始化为1
print ip[i], i打印出每个IP地址及其出现次数。注意,这里先打印次数再打印IP地址,以匹配最终排序的需求,代表每一行ip出现的次数
sort -rn | head先将awk传输的数据排序再将数据前10打印出来

在这里插入图片描述
今天先分享到这里,希望能够帮助到大家……

相关文章:

  • 保存ssh的资讯,快速访问linux server的sshpass
  • Docker 基础使用 (1)
  • Docker安装MySQL的详细教程
  • AI日报:百度发布文心大模型学习机;Open-Sora 1.1可生成21秒视频;Canva可以自动剪辑视频了;超牛ComfyUI节点AnyNode来了
  • Java-Stream流-概述、创建、使用:遍历/匹配、筛选、聚合、映射、归约、排序、提取/组合
  • 面向可复用性和可维护性的设计模式 课程学习总结
  • Go 语言中的 Viper 库来读取 YAML 配置文件
  • 面试八-存泄漏是什么,有哪几种,怎么解决?
  • vue实现图片懒加载
  • 网络编程——大端序小端序
  • 力扣爆刷第141天之二叉树十连刷(翻转、对称、深度、平衡、路径)
  • 解密Prompt系列15. LLM Agent之数据库应用设计:DIN C3 SQL-Palm BIRD
  • 上海汇正财经官网怎么样?客户好评如潮,口碑赞誉之声不绝于耳
  • 机器学习-6-对随机梯度下降算法SGD的理解
  • R可视化:可直接发表的柱状图
  • 前端面试问题:子组件的某一个方法调用执行逻辑由父组件的属性状态变化来决定
  • 【Godot4.2】Godot中的继承与组合
  • 832. 翻转图像 - 力扣
  • 数码论坛|基于SprinBoot+vue的数码论坛系统(源码+数据库+文档)
  • web自动化的断言和日志封装
  • 赛力斯拟赴港上市:去年扭亏为盈净利59亿元,三年内实现百万销量目标
  • 深圳一季度GDP为8950.49亿元,同比增长5.2%
  • 媒体:每一个“被偷走的人生”,都该得到公道和正义
  • 银川市长信箱被指“已读乱回”,官方通报:对相关责任人问责处理
  • 中国海警局新闻发言人就菲律宾非法登临铁线礁发表谈话
  • 辽宁省信访局副局长于江调任辽宁省监狱管理局局长