1.Linux文件系统基础知识
inode:节点;记录文件的属性,一个文件占用一个inode,同时记录此档案的资料所在的block号码。
block:文件内容存放地,实际记录文件的内容,有时占用多个block。
superblock:记录文件系统的整体信息,包括inode、block总量,使用量,剩余量,以及文件系统格式等相关信息。
2.Linux文件系统删除原理
硬链接 :具有相同INode节点号的文件互为硬链接文件。
删除硬链接文件或者删除源文件任意一个,文件数据实际并未删除。
只有删除源文件以及所对应的所有硬链接文件,文件数据才被删除,同时释放磁盘空间。
硬链接文件是文件的另一个入口。
可以通过设置硬链接文件防止误删。
软链接 : 符号链接
类似于windows上的快捷方式。
软连接文件类似一个文本文件,存放的是源文件的路径。
删除源文件,链接文件依然存在,但是无法指向源文件。
软连接文件和源文件是不同类型的文件,也是不同的文件,inode号也不同。
rm可以直接删除。
目录链接:
对于目录来说,只能创建软连接
每一个目录下都有硬链接 . …
对于父目录来说,子目录都会有指向父目录的链接 父目录链接数+1
每一个文件链接计数器:
i_count:当前文件被调用的次数 内存引用计数器
i_nlink:链接的数量 硬链接的数量 磁盘引用计数器
文件删除:i_count和i_nlink同时为0时,代表删除
3. linux文件处理工具
1.cut命令用法:
cut:数据切割
-b | 以字节为单位进行分割 |
---|---|
-c | 以字符为单位进行分割 |
-d | 指定分隔符 默认是tab |
-f | 配合-d使用 指定显示那个区域 |
2.sort命令用法:
sort:用于字段排序
选项 | 用法 |
---|---|
-f | 忽略大小写 |
-b | 忽略最前面的空白字符 |
-M | 以月份名字排序 |
-n | 以纯数字排序 |
-u | 相邻数据去重 |
-r | 反向排序 |
-t | 指定排序分隔符 |
-k | 执行区间 |
3.uniq命令用法:
uniq:去除排序过的文件中重复的行
选项 | 用法 |
---|---|
-c | 标注出现的次数 |
-d | 只输出重复的行 |
-D | 显示所有重复行 |
-f | 跳过前N列 列是通过空白分割 |
-i | 忽略大小写 |
-s N | 跳过前N个字符 |
-u | 只显示唯一的行 |
-w N | 每行的第N个字符之后不做对照 |
4、wc命令用法:
wc: word count (字数统计)
选项 | 用法 |
---|---|
-c | 统计字节数 |
-l | 统计行数 |
-m | 统计字符 |
-w | 统计字数 |
-L | 打印最长行的长度 |
5.grep用法:
grep:文本过滤工具 正则表达式引擎。基于用户指定的“模式”,对目标文件逐行进行匹配检查,打印匹配到的行,默认打印到终端窗口。
用法1: grep [选项] 模式 [文件…]
用法2:grep [选项] [-e 模式 | -f 文件] [文件…]
选项 | 用法 |
---|---|
–color=auto | 高亮显示匹配到的文本 |
-i | 忽略字符大小写 |
-n | 显示行号 |
-E | 支持使用扩展正则表达式 |
-o | 打印匹配到的行 |
-v | 显示不能被匹配到的行 |
—A # | 后几行 |
-B # | 前几行 |
-C | 前后各几行 |
模式(PATTERN):正则表达式元字符编写出来的过滤条件。
正则表达式:由一类特殊的字符以及文本字符所编写的模式,并不代表字面含义,表达控制或者通配的功能
元字符:
1.字符匹配:
. | 匹配任意单个字符 |
---|---|
[ ] | 匹配任意范围内的单个字符 |
[^] | 匹配指定范围外的单个字符 |
[[:upper:]] | 所有的大写字母 |
[[:lower:]] | 所有的小写字母 |
[[:alpha:]] | 匹配所有的字母 |
… | … |
2.匹配字数:
概念:用在要指定出现的次数的字符的后面,用来限制其前面字符出现的次数
* | 匹配其前面的字符任意次。0次,1次或者多次 |
---|---|
.* | 匹配任意长度的任意字符 |
? | 匹配其掐面的字符0次或者1次,最多一次 |
+ | 匹配其前面的字符1次或者多次,至少一次 |
{m} | 匹配其前面的字符m次 |
{m,n} | 匹配其前面的字符至少m次,至多n次 |
{0,n} | 至多n次 |
{m,} | 至少m次 |
3.位置锚定:
^ | 行首锚定,用于模式的最左侧 |
---|---|
$ | 行尾锚定,用于模式的最右侧 |
^$ | 空白行 |
^pattern$ | 用pattern来匹配整行 |
<或者\b | 词首锚定,用于单词的左侧 |
>或者\b | 词尾锚定,用于单词的右侧 |
4.分组和引用:
分组:():将一个或者多个字符捆绑在一起当作一个整体处理
引用:分组括号内匹配的模式,会被正则表达式引擎记录在内部变量中,通过变量进行应用
\1:模式从左侧起,第一个左括号与之匹配的右括号之间模式所匹配到的字符
\2: 模式从左侧起,第二个左括号与之匹配的右括号之间模式所匹配到的字符
…
显示etc/fstab文件中有"UUID"的行:
高亮显示etc/fstab文件中有"UUID"的行:
显示/etc/passwd文件中以"root"开头的行:
显示/etc/passwd文件中以"root"结尾的行:
显示/etc/passwd中的两位数或者三位数
显示/etc/passwd文件中不以/bin/bash结尾的行:
找出 netstat -tan 命令结果中以LISTEN后跟一个或者多个空白字符结尾的行:
来源:CSDN
作者:m0_45318174
链接:https://blog.csdn.net/m0_45318174/article/details/104667765