分隔符

Python常用操作

孤者浪人 提交于 2019-12-19 09:58:27
1.当前日期格式化: time.strftime('%Y-%m-%d',time.localtime(time.time())) 例子:输出当前日期: import timeprint(time.strftime('%Y-%m-%d',time.localtime(time.time()))) 2.pprint: pprint模块 提供了打印出任何python数据结构类和方法。print()和pprint()都是python的打印模块,功能基本一样,唯一的区别就是pprint()模块打印出来的数据结构更加完整,每行为一个数据结构,更加方便阅读打印输出结果。特别是对于特别长的数据打印,print()输出结果都在一行,不方便查看,而pprint()采用分行打印输出,所以对于数据结构比较复杂、数据长度较长的数据,适合采用pprint()打印方式。使用如下: import pprint pp = pprint.PrettyPrinter(indent=4) pp.pprint(stuff) 或(较常见) import pprint pprint.pprint(stuff) 3.django 模板遍历dict: {% for k,v in item.items %} {{k}}{{v}} {% endfor %} 4.编码: \x ascii编码 \u unicode编码 decode(

常用文本分析命令(cut、awk、sort、uniq)

我只是一个虾纸丫 提交于 2019-12-19 07:37:00
一、cut   cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的。 (1)其语法格式为:   cut [-bn] [file] 或 cut [-c] [file] 或 cut [-df] [file] 使用说明 cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。 如果不指定 File 参数,cut 命令将读取标准输入。必须指定 -b、-c 或 -f 标志之一。 主要参数 -b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。 -c :以字符为单位进行分割。 -d :自定义分隔符,默认为制表符。 -f :与-d一起使用,指定显示哪个区域。 -n :取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的<br />范围之内,该字符将被写出;否则,该字符将被排除。 (2)cut一般以什么为依据呢? 也就是说,我怎么告诉cut我想定位到的剪切内容呢? cut命令主要是接受三个定位方法: 第一,字节(bytes),用选项-b 第二,字符(characters),用选项-c 第三,域(fields),用选项-f 例子: less access.log |cut -b 3-6,8

linux awk命令详解

谁说我不能喝 提交于 2019-12-19 01:17:24
原文链接 : http://blog.chinaunix.net/uid-23302288-id-3785105.html awk是行处理器 : 相比较屏幕处理的优点,在处理庞大文件时不会出现内存溢出或是处理缓慢的问题,通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理,然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v] 大参数,-F指定分隔符,-f调用脚本,-v定义变量 var=value ' ' 引用代码块 BEGIN 初始化代码块,在对每一行进行处理之前,初始化代码,主要是引用全局变量,设置FS分隔符 // 匹配代码块,可以是字符串或正则表达式 {} 命令代码块,包含一条或多条命令 ; 多条命令使用分号分隔 END 结尾代码块,在对每一行进行处理之后再执行的代码块,主要是进行最终计算或输出结尾摘要信息 特殊要点: $0 表示整个当前行 $1 每行第一个字段 NF 字段数量变量 NR 每行的记录号,多文件记录递增 FNR 与NR类似,不过多文件记录不递增,每个文件都从1开始 \t 制表符 \n 换行符 FS BEGIN时定义分隔符 RS 输入的记录分隔符, 默认为换行符(即文本是按一行一行输入) ~ 匹配,与==相比不是精确比较 !~ 不匹配

PSR规范 (psr-0,psr-1,psr-2,psr-3,psr-4)

自古美人都是妖i 提交于 2019-12-18 13:29:21
04是自动加载的规范, 12是代码规范, 3是日志规范,后面的数字就是升级版 PSR 是 PHP Standard Recommendations 的简写,由 PHP FIG 组织制定的 PHP 规范,是 PHP 开发的实践标准。 项目的目的在于:通过框架作者或者框架的代表之间讨论,以最低程度的限制,制定一个协作标准,各个框架遵循统一的编码规范,避免各家自行发展的风格阻碍了 PHP 的发展,解决这个程序设计师由来已久的困扰。 目前已表决通过了 6 套标准,已经得到大部分 PHP 框架的支持和认可。 1.PSR-0 自动加载规范,此规范已被启用-本规范已于2014年10月21日被标记为弃用,目前新的替代规范为【PSR-4】 本文是为自动加载器实现通用自动加载所需要遵循的编码规范 一个标准的命名空间与类名称的定义必须符合以下结构:\<Vendor Name><Namespace>*(ClassName) 其中Vendor Name 为每个命名空间都必须要有的一个顶级命名空间名 需要的话,每个命名空间下可以拥有多个子命名空间 当根据完整的命名空间名从文件系统中载入类文件时,每个命名空间之间的分隔符都会被转换成文件夹路径分隔符 类命名中的每个_字符也会被转换成文件夹路径分隔符,而命名空间中的_字符则是无特殊含义的。 当从文件系统中载入标准的命名空间或类时,都将添加.php为目标文件后缀

Sql语句

最后都变了- 提交于 2019-12-18 09:27:50
常用的sql:1、SELECT uid,email,REVERSE( left(REVERSE(email),LOCATE('.', REVERSE(email))-1) ) as t FROM `tb_user_profile` 对与email,111111@qq.com,截取为com (1)length用法 length 计算长度字段 SELECT * FROM admin WHERE LENGTH(username) < 6 (2)DATE_FORMAT、DISTINCT 用法 1、DATE_FORMAT:以不同的格式显示日期/时间数据; 2、DISTINCT:去重复 SELECT DATE_FORMAT(trade_time,'%Y%m') as mon, sum(order_amount) as rmb, count(*) as totalRecharge , count(DISTINCT(uid)) as totalUser FROM tb_pay WHERE trade_status=1 GROUP BY mon (3)FROM_UNIXTIME、IF、UNIX_TIMESTAMP用法 1、FROM_UNIXTIME:时间戳时间以"YYYY-MM-DD H:i:s"格式来示。 2、IF: 格式:IF(Condition,A,B) 结果:当Condition为TRUE时

awk 用法(使用入门)

浪尽此生 提交于 2019-12-18 09:07:15
awk 用法:awk ' pattern {action} ' 变量名 含义 ARGC 命令行变元个数 ARGV 命令行变元数组 FILENAME 当前输入文件名 FNR 当前文件中的记录号 FS 输入域分隔符,默认为一个空格 RS 输入记录分隔符 NF 当前记录里域个数 NR 到目前为止记录数 OFS 输出域分隔符 ORS 输出记录分隔符 1、awk '/101/' file 显示文件file中包含101的匹配行。 awk '/101/,/105/' file awk '$1 == 5' file awk '$1 == "CT"' file 注意必须带双引号 awk '$1 * $2 >100 ' file awk '$2 >5 && $2<=15' file 2、awk '{print NR,NF,$1,$NF,}' file 显示文件file的当前记录号、域数和每一行的第一个和最后一个域。 awk '/101/ {print $1,$2 + 10}' file 显示文件file的匹配行的第一、二个域加10。 awk '/101/ {print $1$2}' file awk '/101/ {print $1 $2}' file 显示文件file的匹配行的第一、二个域,但显示时域中间没有分隔符。 3、df | awk '$4>1000000 ' 通过管道符获得输入,如

三剑客之sed,awk,grep,egrep

喜夏-厌秋 提交于 2019-12-18 04:44:55
Sed是文本处理工具,依赖于正则表达式,可以读取文本内容,根据指定条件对数据进行添加、删除、替换等操作,广泛应用于shell脚本,以完成自动化处理任务。 Sed在处理数据时默认不直接修改源文件,而是把当前处理的行存储在临时缓冲区中,所有指令都在缓冲区中操作,处理完成后,把缓冲区内容默认输出到屏幕,接着处理下一行内容,这样不断重复,直到文件末尾,文件本身内容并没有做任何改变。 一、Sed三大功能: (1)读取:sed 从输入流(文件、管道、标准输入)中读取一行内容并存储到临时的缓冲区中; (2)执行:默认情况下,所有的 sed 命令都在模式空间中顺序地执行,除非指定了行的地址,否则 sed 命令将会在所有的行上依次执行; (3)显示:发送修改后的内容到输出流,再发送数据后,模式空间将会被清空。 ***注意:默认情况下,所有的 sed 命令都是在模式空间内执行的,因此输入的文件并不会发生任何变化,除非是用重定向存储输出。 二、Sed命令两种格式: 其中,“参数”是指操作的目标文件,当存在多个操作对象时用,文件之间用逗号“,”分隔;而 scriptfile 表示脚本文件,需要用“-f”选项指定,当脚本文件出现在目标文件之前时,表示通过指定的脚本文件来处理输入的目标文件。 sed [选项] ‘操作’ 参数 sed [选项] -f scriptfile 参数 (1)常见的 sed命令选项:

linux Shell学习笔记第一天

偶尔善良 提交于 2019-12-17 02:47:26
以下是Shell学习1-2天学习笔记 ————————-我是分隔符————————— 硬件去执行, 内核与硬件之间进行操作。 命令解析器。 shell脚本的组成元素 系统命令 文本处理工具(sort、grep、sed、awk…) 变量 条件判断 环循结构 函数 Shell Scripts Center(SSC) ———————————————————————————- 非负Grep / awk 几天。 统计Wc Sort 排序 sort|head / sed 字段处理 awk 数据区域判断 awk |wc 显示文本: echo [选项] 文本 -n 不要自动换行 -e 解析转义符 a 发出警告音 c 最后不加上换行符号 f 换行 r 回车 彩色文本 Echo –e “33[40;35m….]” echo “Hello,world” echo –e “33[40;35mHell,world33[0m" sort [选项]输入文件 -o 输出文件 -d 按字典顺序排序 a-z -n 按数字大小输出 0-9 -r 逆序输出 z-a 9-0 -k 指定分类是域上的数字分类 -t 域分割符;用非空格或tab键分割域 more /etc/passwd 分页显示 sort –d /etc/passwd|more 中间的|是反倒符号。 将前面处理的交给后面处理 先排序。后分页显示 sort –k3

linux中awk工具

无人久伴 提交于 2019-12-17 01:04:49
awk sed以行为单位处理文件,awk比sed强的地方在于 不仅能以行为单位还能以列为单位处理文件 。awk缺省的行分隔符是换行,缺省的列分隔符是连续的空格和Tab,但是行分隔符和列分隔符都可以自定义,比如/etc/passwd文件的每一行有若干个字段,字段之间以:分隔,就可以重新定义awk的列分隔符为:并以列为单位处理这个文件。awk实际上是一门很复杂的脚本语言,还有像C语言一样的分支和循环结构,但是基本用法和sed类似,awk命令行的基本形式为: awk option 'script' file1 file2 ... awk option -f scriptfile file1 file2 ... 和sed一样,awk处理的文件既可以由标准输入重定向得到,也可以当命令行参数传入,编辑命令可以直接当命令行参数传入,也可以用-f参数指定一个脚本文件,编辑命令的格式为: /pattern/{actions} condition{actions} 和sed类似,pattern是正则表达式,actions是一系列操作。awk程序一行一行读出待处理文件,如果某一行与pattern匹配,或者满足condition条件,则执行相应的actions,如果一条awk命令只有actions部分,则actions作用于待处理文件的每一行。比如文件testfile的内容表示某商店的库存量:

语言基础补充小知识点

两盒软妹~` 提交于 2019-12-15 04:04:32
一.字符 1.字符集:ASCII字符集,128个字符(包括32个不能打印出来的控制符号,只占用一个字节后7位)CB2312字符集,Unicode字符集,将所有语言的编码放在一起,每一个符号都有独一无二的编码,无乱码问题,缺点为只规定了二进制代码,没有规定存储方式,浪费存储空间。 UTF8是Unicode的一种,应用最为广泛,使用1~6个字节表示一个符号,根据不同长度变换字节长度。 2.分隔符:空白符,包括空格,回车,换行和制表符(tab)。普通分隔符,拥有确定含义。 3.程序:代码段{}相当于函数,最小基本单位为类→语句→符号 4.注意‼️任意两个相邻的标识符之间至少有一个分隔符,便于程序理解;空白符的数量多少没有区别,使用一个和多个空白符实现相同的分隔作用,分隔符不能相互替换,比如该使用逗号的地方不能使用空白符。 二.标识符 1.对象和类起的名字作为标记,以便通过名字作为标记,通过名字进行访问,java中标识符由字母、数字、下划线或美元符号组成,且必须以字母,下划线,或美元符号开头。 2.‼️不可以使用关键字和保留字,但能包括关键字和保留字。严格区分大小写。数字不可以开头,长度不限制。标识符中不能有空格。 三.命名规范 1.包名:所有都小写 xxxyyyzzz 2.类名接口名:所有单词首字母大写XxxYyyZzz 3.变量名,方法名:多单词组成,第一个单词首字母小写