百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分析 > 正文

35个参数13个案例,全面解析Linux三剑客之grep命令

liebian365 2024-10-19 08:00 25 浏览 0 评论

正则表达式

前言

为什么要介绍正则表达式,是因为下面的介绍到grep命令会用到正则表达式,所以,放在最前面来进行说明

1.什么是正则表达式 ?

一个正则表达式就是描述了一个字符串集合的方式。正则表达式的表示就是一些特殊符号的组合,而每个符号代表着一些具体的意思。符合的组合就定义了一套规则和方法,其主要作用就是从大量文本从匹配出符合条件行。

2.正则表达式的使用场景

在Linux中,正则表达式的主要使用场景就是文本处理三剑客。grep,sed,awk .除此之外,vi指令也支持正则表达式。

3.正则表达式字符表示

在正则表达式中,又可以分为基本正则表达式和扩展正则表达式 。其主要区别在于:

  • 基本正则表达式只认识元字符,其元字符主要包括:^ $ . [] * ,具体含义见下表格
  • 扩展正则表达式又添加了() {} ? + | 等符号

以下为各个元字符的含义

扩展正则中支持的字符


预定义字符类

4.它们之间的区别

在上面我们提到正则包括基础正则和扩展正则,但是它们有什么区别呢?在什么地方使用呢 ? 接下来我们主要说明在Linux 三剑客中的不同(grep,sed,awk)

  • grep : 在grep中,如果只是使用grep命令 ,可使用原字符的正则或者预定义字符类,而若想使用扩展正则中包含的字符,就必须在grep后加参数-E 。

grep命令

作用:

  • 用于打印匹配给定模式的行

语法:

grep [options] PATTERN [FILE...]

grep [options] [-e PATTERN | -f FILE] [FILE...]

说明:

grep指令用于搜索所给定的模式(PATTERN )的FILE 文件里的内容 ,如果从文件内容里找到了该模式的文件内容,grep会把匹配的该行显示出来。若不指定任何文件,或给的文件名为- , 则grep会从标准输入读取内容。

 另外,也可以使用两个变种程序 egrep 和 fgrep 。 Egrep 与 grep -E 相同。 Fgrep 与 grep -F 相同。

选项:options

说明: 以下的NUM代表的是一个数字,代表的是行数
-A NUM 或者 --after-context=NUM
除了显示符合条件的那一行之外,并显示该行之后NUM行的内容
-a 或者--text
将一个二进制文件视为一个文本文件来处理;它与--binary-files=text 选项等价。

-B NUM 或者--before-context=NUM
除了显示符合条件的那一行之外,并显示该行之前NUM行的内容。

-C NUM 或者--context=NUM
除了显示符合条件的那一行之外,并显示该行之前和之后的NUM行的内容

-b 或者--byte-offset
在输出的每行前面同时打印出当前行在输入文件中的字节偏移量。

--colour[=WHEN] 或者 --color[=WHEN]
在匹配的行中,已匹配到字符串进行着色显示。WHEN可以是never,always,或是auto。

-c 或者--count
计算符合条件的行数

-d ACTION 或者 --directories=ACTION
如果输入文件是一个目录,使用动作ACTION来处理它。
默认情况下,动作ACTION是read,意味着目录将视为普通文件那样来读。
如果动作 ACTION是skip ,将不处理而直接跳过目录。
如果动作ACTION是recurse,grep 将递归地读每一目录下的所有文件。这样做和-r选项等价。

-E 或者 --extended-regexp
将E后面的模式作为一个正则表达式来使用。

-e PATTERN 或者 --regexp=PATTERN
使用PATTERN作为查找文件内容的模式(支持正则),但是在单条命令中可使用多个-e选项

-F 或者 --fixed-strings
将模式 PATTERN 视为一个固定的字符串的列表,用新行 (newlines) 分隔,只要匹配其中之一即可。

-f FILE 或者--file=FILE
从文件 FILE 中获取模式,每行一个。空文件含有0个模式,因此不匹配任何东西。

-G 或者--basic-regexp
将模式 PATTERN 作为一个基本的正则表达式这是默认值。

-H 或者 --with-filename
为每个匹配打印文件名。

-h 或者 --no-filename
当搜索多个文件时,禁止在输出的前面加上文件名前缀。

-i 或者 --ignore-case
忽略大小写的区别

-L 或者 --files-without-match
打印在文件内容中无法找到匹配后的文件名称

-l 或者 --files-with-matches
打印出在文件内容中找到匹配后的文件名

-m NUM 或者 --max-count=NUM
在找到NUM个匹配的行之后,不再读这个文件。

-n 或者 --line-number
在输出的每行前面加上它所在的文件中它的行号。

-o 或者 --only-matching
只显示匹配的行中与 PATTERN 相匹配的部分。

--label=LABEL
将来自标准输入的匹配输出视为来自输入文件LABEL的值

--line-buffering
使用行缓冲,it can be a performance penality.

-q, --quiet, --silent
不显示任何信息。

-R, -r, --recursive
递归地读每一目录下的所有文件。这样做和 -d recurse选项等价。

--include=PATTERN
仅仅在搜索匹配 PATTERN 的文件时在目录中递归搜索。

--exclude=PATTERN
在目录中递归搜索,但是跳过匹配 PATTERN 的文件。

-s 或者 --no-messages
禁止输出关于文件不存在或不可读的错误信息。

-u 或者 --unix-byte-offsets
报告Unix风格的字节偏移量。这个开关使得grep报告字节偏移量时,将文件作为Unix
风格的文本文件看待,也就是说将CR字符去掉。这将产生与在一台Unix主机上运行grep完全相同的结果。除非同时使用-b选项,否则这个选项无效。这个选项在MS-DOS和MS-Windows之外的系统中无效。

-V 或者 --version
向标准错误输出打印 grep 的版本号。

-v 或者 invert-match
显示不包含匹配模式的所有行。

-w 或者 --word-regexp
只选择含有能组成完整的词的匹配的行。判断方法是匹配的子字符串必须是一行的开始,或者是在一个不可能

-x 或者 --line-regexp
完全匹配。

-Z, --null
文件内容全部显示,不同字体通过颜色加以标注

重点

虽然在上面我们可以看到,grep中有很多选项,但是在工作中,大多数的选项是用不到的,这里我们划一下重点。

常用参数


实例

使用到文件info,通过grep来进行过滤,info的文件内容如下:

  1. 1.查找文件info中包含ccc的内容并打印行数
grep -n "ccc" info
  1. 2.查找文件info中包含ggg且忽略大小写的字符并打印,
grep -i "ggg" info
  1. 3.过滤掉含有ccc的行
grep -v "ccc" info
  1. 4.查找包含ddd,eee,fff的行(注意:以下匹配用到正则)
grep -E "ddd|eee|fff" info
  1. 5.查找以c开头的行
grep ^c info

  1. 6.查找以ccx开头且结尾的行
grep ^ccx$ info
  1. 7.查找d字符前可以是任意字符的行
grep .d info
  1. 8.查找包含一个或多个d字符的行
grep -E d{1} info
  1. 9.显示包含a,b,c的字符的行 ; 显示不包含a,b,c字符的行
包含:grep -i ^[abc] info
不包含: grep -i [^abc] info (是全部字符不包含a或b或c)


  1. 10.显示包含一个或多个含有a字符的行
grep -E a+ info
  1. 11.查找以cc开头且包含c,x,ld字符的行
grep -E "cc(c|x|ld)" info
  1. 12.查找文件中所有的大写字符
grep [[:upper:]] info
  1. 13.匹配任意一个字母和数字字符
grep [[:alnum:]] info

文本未完待续,后续持续更新sed,awk命令,希望大家关注转发。

相关推荐

“版本末期”了?下周平衡补丁!国服最强5套牌!上分首选

明天,酒馆战棋就将迎来大更新,也聊了很多天战棋相关的内容了,趁此机会,给兄弟们穿插一篇构筑模式的卡组推荐!老规矩,我们先来看10职业胜率。目前10职业胜率排名与一周前基本类似,没有太多的变化。平衡补丁...

VS2017 C++ 程序报错“error C2065:“M_PI”: 未声明的标识符"

首先,程序中头文件的选择,要选择头文件,在文件中是没有对M_PI的定义的。选择:项目——>”XXX属性"——>配置属性——>C/C++——>预处理器——>预处理器定义,...

东营交警实名曝光一批酒驾人员名单 88人受处罚

齐鲁网·闪电新闻5月24日讯酒后驾驶是对自己和他人生命安全极不负责的行为,为守护大家的平安出行路,东营交警一直将酒驾作为重点打击对象。5月23日,东营交警公布最新一批饮酒、醉酒名单。对以下驾驶人醉酒...

Qt界面——搭配QCustomPlot(qt platform)

这是我第一个使用QCustomPlot控件的上位机,通过串口精确的5ms发送一次数据,再将读取的数据绘制到图表中。界面方面,尝试卡片式设计,外加QSS简单的配了个色。QCustomPlot官网:Qt...

大话西游2分享赢取种族坐骑手办!PK趣闻录由你书写

老友相聚,仗剑江湖!《大话西游2》2021全民PK季4月激燃打响,各PK玩法鏖战齐开,零门槛参与热情高涨。PK季期间,不仅各种玩法奖励丰厚,参与PK趣闻录活动,投稿自己在PK季遇到的趣事,还有机会带走...

测试谷歌VS Code AI 编程插件 Gemini Code Assist

用ClaudeSonnet3.7的天气测试编码,让谷歌VSCodeAI编程插件GeminiCodeAssist自动编程。生成的文件在浏览器中的效果如下:(附源代码)VSCode...

顾爷想知道第4.5期 国服便利性到底需优化啥?

前段时间DNF国服推出了名为“阿拉德B计划”的系列改版计划,截至目前我们已经看到了两项实装。不过关于便利性上,国服似乎还有很多路要走。自从顾爷回归DNF以来,几乎每天都在跟我抱怨关于DNF里面各种各样...

掌握Visual Studio项目配置【基础篇】

1.前言VisualStudio是Windows上最常用的C++集成开发环境之一,简称VS。VS功能十分强大,对应的,其配置系统较为复杂。不管是对于初学者还是有一定开发经验的开发者来说,捋清楚VS...

还嫌LED驱动设计套路深?那就来看看这篇文章吧

随着LED在各个领域的不同应用需求,LED驱动电路也在不断进步和发展。本文从LED的特性入手,推导出适合LED的电源驱动类型,再进一步介绍各类LED驱动设计。设计必读:LED四个关键特性特性一:非线...

Visual Studio Community 2022(VS2022)安装图文方法

直接上步骤:1,首先可以下载安装一个VisualStudio安装器,叫做VisualStudioinstaller。这个安装文件很小,很快就安装完成了。2,打开VisualStudioins...

Qt添加MSVC构建套件的方法(qt添加c++11)

前言有些时候,在Windows下因为某些需求需要使用MSVC编译器对程序进行编译,假设我们安装Qt的时候又只是安装了MingW构建套件,那么此时我们该如何给现有的Qt添加一个MSVC构建套件呢?本文以...

Qt为什么站稳c++GUI的top1(qt c)

为什么现在QT越来越成为c++界面编程的第一选择,从事QT编程多年,在这之前做C++界面都是基于MFC。当时为什么会从MFC转到QT?主要原因是MFC开发界面想做得好看一些十分困难,引用第三方基于MF...

qt开发IDE应该选择VS还是qt creator

如果一个公司选择了qt来开发自己的产品,在面临IDE的选择时会出现vs或者qtcreator,选择qt的IDE需要结合产品需求、部署平台、项目定位、程序猿本身和公司战略,因为大的软件产品需要明确IDE...

Qt 5.14.2超详细安装教程,不会来打我

Qt简介Qt(官方发音[kju:t],音同cute)是一个跨平台的C++开库,主要用来开发图形用户界面(GraphicalUserInterface,GUI)程序。Qt是纯C++开...

Cygwin配置与使用(四)——VI字体和颜色的配置

简介:VI的操作模式,基本上VI可以分为三种状态,分别是命令模式(commandmode)、插入模式(Insertmode)和底行模式(lastlinemode),各模式的功能区分如下:1)...

取消回复欢迎 发表评论: