字符统计

字符串的常用操作和方法(Python入门教程)

流过昼夜 提交于 2020-03-27 20:58:52
字符串的常用操作 很好理解 字符串可以用 ' + ' 连接,或者乘一个常数重复输出字符串 字符串的索引操作 通过一对中括号可以找到字符串中的某个字符 可以通过正负数双向操作噢 用一个中括号来实现 为什么没有-0??去清醒脑子想想 -0 和 0 有差吗? 还有一个切片操作 就像切菜那样简单,同样是中括号 接上面那个图 这个中括号有三个参数 [ 开始 : 结束 : 长度] 这三个参数是可以省略的,默认是 [ 从头 : 到尾 : 1] 友情提示:开始结束是左闭右开的区间,也就是不包含右边的数 最后再介绍一个函数:len() 可以用来统计字符串中字符的个数 字符串的常用方法 使用 in 来判断子串是否在字符串中存在 返回的是布尔值 或者想要判断字符串中的字符 str.isupper() 判断字符是否大写 str.islower() 判断小写 以此类推 str.isdigit() 判断数字 str.isspace() 判断空白字符 等等等等 大小写转换?没问题 str.upper() 转换大写 str.lower() 转换小写 什么?只要首字母? 试试 str.capitalize() 需要拆分字符串? 来个 str.split() 参数是字符串,表示分割的符号 会返回一个字符串构成的列表 替换字符串 str.replace() 是非常可的 第一个参数是旧字符,第二个参数是新字符

Python学习笔记五:字符串常用操作,字典,三级菜单实例

旧巷老猫 提交于 2020-03-17 05:37:26
字符串常用操作 7 月19 日,7 月20 日 ,7 月22 日,7 月29 日,8 月29 日,2 月29 日 首字母大写:a_str.capitalize() 统计字符串个数:a_str.count(“x”) 输出字符,不够的使用指定的字符补上,字符居中:a_str.center(50,”-“) 判断字符串以什么结尾:a_str.endwith(“xx”) 将字符串中的tab转换为指定数目的空格:a_str.expandtabs(tabsize=30) 查找指定字符串在字符串中的位置:a_str.find(“xx”) 字符串也可以切片:a_str[a_str.find(“xx”):] 格式化输出:a_str.format(xx=”x”,xxx=”xxx”) 字典格式输出:a_str.format_map({‘name’:’alex’, ’year’:12}) 判断是否为阿拉伯数字(所有英文字符+0-9):a_str.isalnum() 判断是否为英文字符:a_str.isalpha() 判断是否为十进制数:a_str.isdecimal()??? 判断是否为整数:a_str.isdigit() 判断是否为合法的标识符(合法的变量名):a_str.isidentifier() 判断是否为小写:a_str.islower() 判断是否只有数字(不能有小数点):a_str

Java API ——Character类

自古美人都是妖i 提交于 2020-03-17 00:39:49
1、 Character类的概述   · Character 类在对象中包装一个基本类型 char 的值   · 此外,该类提供了几种方法,以确定字符的类别(小写字母,数字,等等),并将字符从大写转换成小写,反之亦然 2、构造方法 public class CharacterDemo01 { public static void main(String[] args) { //创建对象 Character ch = new Character('a'); System.out.println("ch:"+ch); } } 3、 Character类成员方法 · public static boolean isUpperCase(char ch):判断给定的字符是否是大写字符    · public static boolean isLowerCase(char ch):判断给定的字符是否是小写字符    · public static boolean isDigit(char ch):判断给定的字符是否是数字字符    · public static char toUpperCase(char ch):把给定的字符转换为大写字符    · public static char toLowerCase(char ch):把给定的字符转换成小写字符 public class

字符串

↘锁芯ラ 提交于 2020-03-08 22:25:15
1. 概述 字符串是指包含若干字符的容器结构。在python中,字符串属于不可变有序序列。使用单引号、双引号或三双引号作为定界符,并且不同的定界符之间可以互相嵌套。 2. 字符串编码格式 ASCII 仅对10个数字、26个大小写英文字母及一些其他符号进行了编码。采用1个字节进行编码,最多只能表示256个符号 UTF-8对全世界所有国家需要用到的字符进行了编码,以一个字节表示英语字符,以3个字节表示中文。 GB2312是我国定制的中文编码,使用1个字节表示英语,2个字节表示中文 GBK是GB2312的扩充,而CP936是微软在GBK的基础上开发的编码方式 不同的编码格式之间相差很大,采用不同的编码格式意味着不同的表示和存储形式。 python 3.x 默认使用UTF8编码格式,完全支持中文。在统计字符串长度时,无论是一个数字、英文字母,还是一个汉字,都按一个字符对待和处理。 encode() 方法表示使用指定的字符串编码格式编码 decode() 方法表示使用指定编码格式解码 3. 转义字符与原始字符串 转义字符是指,在字符串中某些特定的符号前加一个斜线之后,该字符将被解释为另一种含义,不再表示本来的字符。 在字符串前面加上字母R或r表示原始字符串。 4. 字符串格式化 python的字符串格式化有两种方式: % 和 format % [-] [+] [0] [m] [n] 格式字符

Linux文件系统及文件处理工具

荒凉一梦 提交于 2020-03-08 09:46:49
1.Linux文件系统基础知识 inode :节点;记录文件的属性,一个文件占用一个inode,同时记录此档案的资料所在的block号码。 block :文件内容存放地,实际记录文件的内容,有时占用多个block。 superblock :记录文件系统的整体信息,包括inode、block总量,使用量,剩余量,以及文件系统格式等相关信息。 2.Linux文件系统删除原理 硬链接 :具有相同INode节点号的文件互为硬链接文件。 删除硬链接文件或者删除源文件任意一个,文件数据实际并未删除。 只有删除源文件以及所对应的所有硬链接文件,文件数据才被删除,同时释放磁盘空间。 硬链接文件是文件的另一个入口。 可以通过设置硬链接文件防止误删。 软链接 : 符号链接 类似于windows上的快捷方式。 软连接文件类似一个文本文件,存放的是源文件的路径。 删除源文件,链接文件依然存在,但是无法指向源文件。 软连接文件和源文件是不同类型的文件,也是不同的文件,inode号也不同。 rm可以直接删除。 目录链接 : 对于目录来说,只能创建软连接 每一个目录下都有硬链接 . … 对于父目录来说,子目录都会有指向父目录的链接 父目录链接数+1 每一个文件链接计数器 : i_count:当前文件被调用的次数 内存引用计数器 i_nlink:链接的数量 硬链接的数量 磁盘引用计数器 文件删除:i

Python入门练习: 练习实例七

白昼怎懂夜的黑 提交于 2020-03-01 20:19:13
目录 Python入门练习 Python入门练习 题目: 输入一行字符,分别统计出其中英文字母、空格、数字和其它字符的个数。 程序分析: 利用 while 或 for 语句,条件为输入的字符不为 '\n'。 str1=input('请输入 :') list1=[] num=0 letter=0 space=0 other=0 for i in str1: if i.isalpha(): #函数字母 num=num+1 elif i.isspace(): #判断空格 space=space+1 elif i.isdigit(): #判断数字 letter=letter+1 else: other=other+1 print('数字有',letter,'个') print('字母有',num,'个') print('空格有',space,'个') print('其他字符有',other,'个') 来源: CSDN 作者: Thinklov 链接: https://blog.csdn.net/u010244992/article/details/104591565

java021.io流 字符流

谁都会走 提交于 2020-03-01 09:56:58
注意: 字节流可以操作任意数据,但是字符流只能操作纯文本文件,一般用于文本文件的只读或只写! 字符流是什么 * 字符流是可以直接读写字符的IO流 * 字符流读取字符, 就要先读取到字节数据, 然后转为字符. 如果要写出字符, 需要把字符转为字节再写出. FileReader类的read()方法可以按照字符大小读取 FileWriter类的write()方法可以自动把字符转为字节写出 字符流用处和特点: * 字符流也可以拷贝文本文件, 但不推荐使用. 因为读取时会把字节转为字符, 写出时还要把字符转回字节. * 程序需要读取一段文本, 或者需要写出一段文本的时候可以使用字符流 * 读取的时候是按照字符的大小读取的,不会出现半个中文 * 写出的时候可以直接将字符串写出,不用转换为字节数组 字符流不可以拷贝非纯文本的文件,因为在读的时候会将字节转换为字符,在转换过程中,可能找不到对应的字符,就会用?代替,写出的时候会将字符转换成字节写出去,如果是?,直接写出,这样写出之后的文件就乱了,看不了了 * BufferedReader的read()方法读取字符时会一次读取若干字符到缓冲区, 然后逐个返回给程序, 降低读取文件的次数, 提高效率 * BufferedWriter的write()方法写出字符时会先写到缓冲区, 缓冲区写满时才会写到文件, 降低写文件的次数, 提高效率 *

输入一行字符,分别统计出其中英文字母、空格、数字和其它字符的个数

可紊 提交于 2020-03-01 08:29:51
输入一行字符,分别统计出其中英文字母、空格、数字和其它字符的个数 "" " name: wzl date: 2020/2/27 task: 输入一行字符,分别统计出其中英文字母、空格、数字和其它字符的个数 " "" x = str ( input ( 'please enter whatever you want: ' )) alpha = 0 digit = 0 space = 0 others = 0 for i in x: if i.isdigit ( ) : digit + = 1 elif i.isalpha ( ) : alpha + = 1 elif i.isspace ( ) : space + = 1 else: others + = 1 print ( f 'alpha:{alpha} digit:{digit} space:{space} others:{others}' ) please enter whatever you want: 321 ! ! abbc cc alpha:6 digit:3 space:1 others:2 来源: CSDN 作者: secx=1_cosx 链接: https://blog.csdn.net/ziluuu/article/details/104575012

31.每日一个Linux命令----wc

﹥>﹥吖頭↗ 提交于 2020-02-29 16:41:38
描述:Word Count 命令的功能为统计指定文件中的字节数、字数、行数,并将统计结果显示输出 用法: wc [option] 文件 选项: -c 统计字节数。 -l 统计行数。 -m 统计字符数。这个标志不能与 -c 标志一起使用。 -w 统计字数。一个字被定义为由空白、跳格或换行字符分隔的字符串。 -L 打印最长行的长度。 -help 显示帮助信息 --version 显示版本信息 实例: 统计test.txt的行数、字符数、字节数: [root@localhost ~]# wc test.txt 2 8 18 test.txt 统计字节数、字符数、字数: [root@localhost ~]# wc -c test.txt 18 test.txt [root@localhost ~]# wc -m test.txt 18 test.txt [root@localhost ~]# wc -w test.txt 8 test.txt 来源: oschina 链接: https://my.oschina.net/u/2711763/blog/704518

shell特殊符号、cut/sort/wc/uniq/tee/tr/split命令

二次信任 提交于 2020-02-29 02:17:53
特殊符号 * 代表零个或多个任意字符 ? 代表一个任意字符 #注释符号,后面的内容会被忽略 \脱义字符会把后面的特殊符号还原为普通字符 | 管道符 用作将前面的命令输出作为后面命令的输入 命令cut用来截取某一个字段 格式:cut -d '分隔字符' [-cf] n 。这里n是数字 -d后面跟分隔字符,分隔字符用单引号括起来 -f 后面接的是第几个区段 -c 后面接的是第几个字符,可以是一个数字,也可以是一个区间,还可以是多个数字。 命令 sort 用作排序 格式:sort [-t 分隔符] [-kn1,n2] [-nru] ,n1和n2是数字。 sort不加任何选项,就会从首字符向后一些按ASCII码值进行比较,最后将它们按升序排序 -t 后面跟分隔字符,作用跟cut的-d选项一样,-k后面可以跟单个数字表示对第几个区域的字符串排序 -n 使用纯数字排序 -r反向排序 -u 表示去重复 -kn1,n2 表示有n1区间排序到n2区间 wc 命令用于统计文档的行数,字符数或词数 不加任何选项直接跟文档 ,会把行数、词数、字符数依次输出。 -l 统计行数 -m 统计字符数 -w 统计词数 uniq删除重复行 -c 统计重复行出现的行数 从上面的图片中可以看到还有相同的行,所以在使用uniq命令前,要先排序 tee命令后面跟文件名,作用类似于重定向>,但它比重定向多一个功能