Linux 学习笔记 4:Shell 编程

易管家 提交于 2019-12-03 10:17:10

1.简单过滤器

a. pr [OPTION] [FILE]

功能:改变文件打印格式

选项

功能

-l n

设定页面长度为n行

-w n

设定页面总宽度为n个字符(不够会被砍掉)

-h str

设定页眉为str

-n

对行进行编号

-k

分k列输出

-t

不显示页眉、页脚和边距

b.head [OPTION] [FILE] 默认10行

选项

功能

-n k

显示前k行内容

tail [OPTION] [FILE]

选项

功能

-n k

显示后k行内容

-f

监控文件内容增长(进程相关)

c.cut OPTION [FILE]

功能:垂直划分文件

选项

功能

-cn-m

剪切n-m列,每列宽度为一个字符

-fn-m

剪切n-m个字段,字段分隔符由-d选项指定

-fn,m

剪切第n和m个字段,字段分隔符由-d选项指定

-d

指定字段分隔符,默认制表符

d.paste [OPTION] [FILE]

功能:垂直黏贴文件

选项

功能

-s

合并行

-d

指定字段分隔符

e.sort [OPTION] [FILE]

功能:对文件内容排序

选项

功能

-tchar

用char作为分隔符识别字段

-k m,n

对第m个字段开始到第n个字段进行排序

-k m.n

对第m个字段的第n个字符进行排序

-u

删除重复行

-n

数值排序(不指定则为字典序)

-r

逆序

-f

不区分大小写

-c

查看文件是否有序

-o file

将输出存入file,可以和源文件同名(会覆盖)

f.uniq [OPTION] [INPUT [OUTPUT]]

选项

功能

-d

选择并显示输入中的重复行

-u

选择并显示输入中的非重复行

-c

显示每行出现的次数(连续的)

g.tr [OPTION] SET1 [SET2] 只接受标准输入

功能:将SET1中的字符替换为SET2中的相应字符(位置一一对应)

选项

功能

-d

删除字符(无需指定SET2)

-s

压缩连续字符

h.cmp [OPTION FILE1 FILE2] [OPTION SKIP1 [SKIP2]]

功能:逐字对比两个文件的内容,遇到差异时终止

选项

功能

-b

输出第一个差异字节数、行数、字符

-l

输出所有差异字节数

-i

忽略文件1起始SKIP1字节和文件2起始SKIP2字节

i.comm [OPTION] FILE1 FILE2

功能:逐行对比两个文件的内容,显示相同行和不同行(需要文件有序)

输出结果共三列:FILE1中独有的行;FILE2中独有的行;共有行

选项

功能

-n

隐藏第n列

?j.diff [OPTION] FILES

功能:显示两个文件的差别

选项

功能

-q

只在文件不同时显示

-s

只在文件相同时显示

-c

显示相同内容

-u

显示不同内容

-i

忽略大小写

-b

忽略重复空白

实例a:以从大到小的顺序列出当前目录中的文件

实例b:统计一个文件中每个单词出现的次数

格式化文件:把空格、制表符、冒号都换成换行符,每行一个单词

对文件进行排序,之后标注每个单词出现的次数

不显示页眉、页脚、边距,一页三列输出



2. 正则表达式 RE 过滤器

模式语句

匹配含义

基本 BRE

[pqr]

p, q, r中的单个字符

[a-z]

a到z中的单个字符

.

任意单个字符

a*

0个或任意多个a字符

.*

任意多个任意字符

a\{m,n\}

a字符出现m到n次

[^pqr]

不是p,q,r的单个字符

^exp

exp模式位于行首

exp$

exp模式位于行尾

��չERE(-E)

a+

1个或任意多个匹配a字符

a?

0个或1个a字符

exp1|exp2

匹配exp1或exp2

(a1|a2)a3

匹配a1a3或a2a3



a.grep [OPTIONS] PATTERN [FILE…]

功能:在文件中查找指定模式,单/双引号可加可不加

选项

功能

-G

匹配基本正则表达式(默认)BRE

-E

匹配扩展正则表达式ERE

-n

显示匹配行的行号

-c

显示出现次数

-e

匹配以连字符开头的表达式

-x

以整行匹配模式

-i

忽略大小写

-v

列出不匹配的行

-l

只给出匹配模式的文件名


练习:

精确匹配名字叫.c的文件,并对这些文件执行查找内容#include<class1.h>的操作,输出符合条件的文件名

ind -name “表达式” 没有问题

find -name 表达式 只能匹配出单一结果的情况

我咋知道为什么鸭 - =


b. sed [OPTION] ‘ADDRESS ACTION’ FILES

功能:对数据流进行定位操作;ADDRESS 定位指定行;ACTION 执行指定的编辑操作

选项

功能

-e

使用多条指令

-f

从文件中获取指令

-n

只打印模式匹配的行

定位方式:

指定行号:k 第k行;m,n 从m到n的连续行

指定模式:/pattern/ 模式匹配的行

ACTION

功能

i a c

插入、追加、修改文本

d

删除行

p

在标准输出上打印结果

q

读取到指定行后退出

r fname

将文件fname的内容放到行后

w fname

将指定行写入文件fname

=

打印指定行号

s/str1/str2

用str2替换指定行中出现的第一个str1

s/str1/str2/g

用str2替换所有的str1


示例:


    标记正则表达式(TRE)

&

在目标中指代源模式

\(pattern\)

标记源模式中的pattern,在目标中使用\k引用


示例:


c. awk [OPTIONS] ‘SLECTION_CRITERIA {ACTION}’ FILES

SLECTION_CRITERIA:决定程序作用的对象

ACTION:决定了程序操作的行为

功能:

将每一行分成多个字段,默认分隔符为空格和制表符,分隔符可以由-F选项自定义

用$1,$2等来引用每个字段,类似于shell中的命令行位置参数($0表示整行)

可以对各个字段进行正则表达式匹配、比较、条件判断、数值计算等


示例:


・ 标准输出ACTION

print和printf都可以用>和|重定向,目标文件/命令要加引号

格式符号

含义

%

格式起始符(必)

-

左对齐(默认右对齐)

0

空位补0

m.n

m为输出宽度,n为输出精度(默认为6)

l

长整形或双精度数

h

short型

类型符号

含义

d

十进制

o

八进制

x

十六进制

u

无符号十进制


类型符号

含义

c

单个字符

s

字符串

f

浮点数

e

指数形式输出实数


・ 数值操作

数值运算符:+ - * / % ^

赋值运算:+= -= ++ -- ...


・ 变量和表达式

变量:第一次使用时自动声明,默认初始值为0或null;名称区分大小写;根据上下文解释成字符串或数字,并自动转换;直接引用,不需要加$

表达式:由字符串、数字、变量、运算符组合而成;字符串总是加双引号,可以用转义符,八进制加\,十六进制加\x;字符串作为操作数参与数字计算时自动转换成0

比较与逻辑运算符

含义

~/rexp/

匹配正则表达式rexp

!~/rexp/

不匹配正则表达式rexp

i in array

数组元素array[i]是否存在


示例:


・ 写在文件内的awk(-f)

awk -F: -f awk_scipt file

awk_script写单引号里的内容


BEGIN和END程序段:

BEGIN{

在awk之前执行

}

  普通awk语句

END{

}


・shell脚本中的awk

位置参数:可以引用shell的命令行参数,需要多套一层单引号


・内置变量

内置变量:会自动赋值,也可以重新赋值,引用:变量名

变量名

功能

默认值

备注

NR

当前读取行的记录数

-

FS

输入字段分隔符

空格

FS的赋值放在BEGIN中

OFS

输出字段分隔符

空格

print语句中参数的分隔符

OFMT

默认浮点数格式

%.6f

RS

记录分隔符

换行符

可将多行合并成一条记录

NF

当前行的字段数

-

FILENAME

当前输入文件

-

ARGC

命令行中的参数个数

-

ARGV

包含参数列表的数组

-

ENVIRON

包含所有环境变量的数组

-

函数

说明

int(x)

返回x的整数值

sqrt(x)

返回x的平方根

length()

返回整个行的长度

length(x)

返回x的长度

tolower(s)

将字符串s变为小写

toupper(s)

将字符串s变为大写

substr(str,m)

从str的第m个位置开始截取剩余子串

substr(str,m,n)

从str的第m个位置开始截取长度为n的子串

index(s1,s2)

返回字符串s2在s1中的位置

split(str,arr,ch)

以ch为分隔符,将str划分到数组arr中,返回字段数

system(“cmd”)

运行命令cmd,并返回其退出状态 eg.date


・ 控制流语句

if(条件){语句}else{语句}

while(条件){语句}

for(i=1;1<=10;i++){语句}

for(x in array){语句}


示例:

为每一行薪资计算税款:


if ($6 <= 30000) tax=0
else { if ($6 > 30000 && $6 <=50000) tax=($6-30000)*0.15 }
}’ lst

将每一行的字段逆向输出:


for (i=NF-1;i>0;i--)


}’ lst

输出所有环境变量的值:

awk ‘BEGIN {
for (key in ENVIRON)

}’

根据职位分组,统计每个职位的员工数量($3是职位名):


END { for (pos in count)

}’ lst

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!