python字符串

学习python第二天

拥有回忆 提交于 2020-02-08 12:35:21
Python中raw字符串与多行字符串 如果一个字符串包含很多需要转义的字符,我们可以在字符串前面加个前缀 r ,表示这是一个 raw 字符串,里面的字符就不需要转义了。如r’( _ )/ ( _ )/’ 但是 r’…’ 表示法不能表示多行字符串,也不能表示包含’和 "的字符串 如果要表示多行字符串,可以用’’’…’’‘表示 ‘’‘Line 1 Line 2 Line 3’’’ 和’Line 1\nLine 2\nLine 3’是一样的 一个字节能表示的最大的整数就是255(二进制11111111=十进制255) 0 - 255被用来表示大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母 A 的编码是65,小写字母 z 的编码是122。 Python在后来添加了对Unicode的支持,以Unicode表示的字符串用u’…'表示,比如: print u’中文’ 但在python3中,只需在开头加上 # - - coding: utf-8 - - ,不需要u demo.py 文件存储和编码声明都是utf-8,但是 cmd 显示编码是 GBK,所以要在cmd中正常显示中文,还需要在需要输出的中文后面加上 .encode(‘gbk’),这个 .很关键,不能漏 总结 1.文件存储为utf-8格式,编码声明为utf-8,# encoding:utf-8 2

Python创建字符串

房东的猫 提交于 2020-02-08 10:02:11
Python创建字符串:   一般情况下可以使用 ' 或 " 创建字符串 或 使用引用字符串变量 或 字符串表达式。 # 字符串的创建 # 使用 ' 或 “ 进行创建 strs = 'ABCDEFG' print(strs) # ABCDEFG strs = "ABCDEFG" print(strs) # ABCDEFG # 使用变量进行赋值 strs_two = strs print(strs_two) # ABCDEFG # 使用字符串表达式进行赋值 a = 'ABCD' b = 'EFG' c = a + b print(c) 2020-02-08 来源: https://www.cnblogs.com/hany-postq473111315/p/12275504.html

2019.2.7

元气小坏坏 提交于 2020-02-08 02:59:14
python基础: 1.print函数 字符串 整数运算 2.三个数据类型 string number float 3.if else语句 if if else if else 4.input input的输入是字符串 input可以强制转换成int 来源: https://www.cnblogs.com/Chamberlain/p/12275396.html

python中的字符串和字节串

微笑、不失礼 提交于 2020-02-08 02:30:44
字节概念:   字节(Byte )是计算机信息技术用于计量存储容量的一种计量单位,作为一个单位来处理的一个二进制数字串,是构成信息的一个小单位。最常用的字节是八位的字节,即它包含八位的二进制数。   位:(bit):是计算机 内部数据 储存的最小单位,11001100是一个八位二进制数。   字节:(byte):是计算机中 数据处理 的基本单位,习惯上用大写 B 来表示,1B(byte,字节)= 8bit(位)。 字符概念    字符 是指计算机中使用的字母、数字、字和符号,包括:1、2、3、A、B、C、~!·#¥%……—*()——+等等。在UTF-8编码 中,一个英文字母字符存储需要1个字节,一个汉字字符储存需要3个字节。    一个英文就用八位二进制数表示,一个汉字就用3个八位二进制表示 字符串概念   字符串是字符序列,它是一种抽象的概念,不能直接存储在硬盘。 字节串概念   字节串是字节序列,它可以直接存储在硬盘。它们之间的映射被称为 编码/解码 。 在Python中,程序中的文本都用字符串表示。 python字节串和字符串代码介绍 >>> s = '中文' >>> s.encode() # 编码,默认的是UTF-8 b'\xe4\xb8\xad\xe6\x96\x87' # 字节串 >>> type(s.encode()) <class 'bytes'> # 字节串 >>

bcolz 包

夙愿已清 提交于 2020-02-08 01:25:15
安装: ‎bcolz 依赖于 NumPy,也可以选择 Numexpr。此外,如果要从源安装,并且 C 编译器(Python 2 的 Clang、GCC 和 MSVC 2008 和 Python 3 的 MSVC 2010)。‎ 也就是先要安装numpy和Numexpr,再装这个大哥。 Do: $ easy_install -U bcolz or: $ pip install -U bcolz bcolz 是一个高压缩率,读写效率高的python库 官网 http://bcolz.blosc.org/en/latest/ 分ctable carray 两种存储类型 ctable类 class bcolz.ctable.ctable(columns = None,names = None,** kwargs ) 参数: columns:元组或列对象列表 用于构建ctable对象的列数据列表。这些通常是carrays,但也可以是NumPy数组列表或纯NumPy结构化数组。列表或元组列表也是有效的,只要它们可以转换为carray对象即可。 names:字符串或字符串列表 列的名称列表。此列表中的名称必须是有效的Python标识符,不能以下划线开头,并且必须以与cols相同的顺序指定。如果没有通过,名称将被选为第一列的'f0',第二列的'f1',依此类推(NumPy约定)。 kwargs

python字符串删除首尾特定字符

微笑、不失礼 提交于 2020-02-07 16:06:07
想要移除字符串头尾的特定字符或者字符序列,我们需要用到 .strip() 和它的左臂 .lstrip() 右膀 .rstrip() 。接下来通过例子来详细说明。 ()里面什么都不放时,默认去除空格或换行符 str0 = " python " print ( str0 . strip ( ) ) print ( str0 . lstrip ( ) ) print ( str0 . rstrip ( ) ) # 结果如下 : "python" "python " " python" ()里面放特定字符时,去除该字符 str1 = "0000000python0000000" print ( str1 . strip ( '0' ) ) print ( str1 . lstrip ( '0' ) ) print ( str1 . rstrip ( '0' ) ) # 结果如下: "python" "python0000000" "0000000python" ()里面放特定字符序列时,去除该字符序列 str2 = "123python321" print ( str2 . strip ( '12' ) ) print ( str2 . lstrip ( '12' ) ) print ( str2 . rstrip ( '12' ) ) # 结果如下: "3python3"

正则和相关知识

我与影子孤独终老i 提交于 2020-02-07 15:27:52
认识正则 正则表达式:是由一些字符和特殊符号组成的字符串,用来约束或描述一个有相似特征的字符串的集合。 功能: 正则捕获:按照正则表达式的规则从一个字符串 findall 中找到符合正则表达式格式的字符串 正则匹配:根据正则表达式的规则判断一个字符 match 串是否符合该表达式格式 正则表达式模块 python中通过re模块来使用正则表达式。 re模块介绍: python中的re模块是内置模块,因此可直接通过import关键字导入,通常我们使用该模块中的match()方法判断一个字符串是否符合正则表达式定义的规则,使用findall()方法从指定字符串中找到符合正则表达式规定的字符串 正则步骤 #导入re模块 import re #定义正则表达式 p = re.compile(正则表达式) #通过定义的正则来判断字符串是否匹配该字符串,如果匹配则显示匹配信息,否则显示None m= p.match(字符串) #通过定义的正则表达式从字符串中查找符合规则的字符串并将它们存放在列表中 f = p.findall(字符串) #从指定字符串中查找符合正则的字符串,返回匹配信息(match对象)或None f = p.search(字符串) 4正则中常用方法 (1)compile 作用:用于定义正则表达式 格式: compile(pattern, flags=0) 参数说明: 参数说明:

常用模块

邮差的信 提交于 2020-02-07 12:00:16
为何使用模块? 随着程序的发展,功能越来越多,为了方便管理,我们通常将程序分成一个个的文件,这样做程序的结构更清晰,方便管理。这时我们不仅仅可以把这些文件当做脚本去执行,还可以把他们当做模块来导入到其他的模块中,实现了功能的重复利用 常用模块 collections模块 在内置数据类型(dict, list, set, tuple)的基础上,collection模块提供了几个额外的数据类型; Counter, deque, defaultdict, namedtuple, OrderedDict 1. namedtuple:生成可以使用名字来访问元素内容的tuple 2. deque:双端队列,可以快速的从另外一侧追加和推出对象 3. Counter:计数器,主要用来计数 4. OrderedDict:有序字典 5. defaultdict:带有默认值的字典 namedtuple View Code 类似的表示牌的花色和数字,也可以用namedtuple定义 1 Card = namedtuple('card', ['suits', 'num']) 2 c1 = Card('红桃', 2) 3 print(c1) # card(suits= '红桃', num = 2) View Code # nametupled('名称', [属性list]) deque 使用list存储数据时

Python字符串

我们两清 提交于 2020-02-07 05:59:00
print ( ord ( 'c' ) ) #获取c的位置 print ( chr ( 99 ) ) #获取99对应的字符 运行结果: 99 c 编码与解码过程、 s1 = '可口可乐' print ( s1 . encode ( 'utf-8' ) ) #编码过程 s1_encode = b '\xe5\x8f\xaf\xe5\x8f\xa3\xe5\x8f\xaf\xe4\xb9\x90' print ( s1_encode . decode ( 'utf-8' ) ) #解码过程 运行结果: b '\xe5\x8f\xaf\xe5\x8f\xa3\xe5\x8f\xaf\xe4\xb9\x90' 可口可乐 print ( bytes ( '百' , 'utf-8' ) ) #把百字用utf-8的形式 转换成字节 print ( bytes ( 'a' , 'ascii' ) ) #把a字母用ascii的形式 转换成字节 运行结果: b '\xe7\x99\xbe' b 'a' 二、str bytes bytearray str是字符数据,bytes和bytearray是字节数据。它们都是序列,可以进行迭代遍历。 str和bytes是不可变序列,bytearray是可变序列,可以原处修改字节。 b = bytearray ( '白' , 'utf-8' )

NextFlow-进程(一):输入

泄露秘密 提交于 2020-02-07 02:12:25
在Nextflow中,进程是执行用户脚本的基本处理原语。 进程定义以关键字开头 process ,其后是进程名称,最后是 由括号括起来的进程主体。进程主体必须包含一个表示命令的字符串,或更一般地,该字符串代表由该命令执行的脚本。基本过程如下例所示: process sayHello { """ echo 'Hello world!' > file """ } 一个流程可能分别包含五个定义块:指令,输入,输出,when子句以及最后一个流程脚本。语法定义如下: process < name > { [ directives ] input : < process inputs > output : < process outputs > when : < condition > [ script | shell | exec ] : < user script to be executed > } 1 脚本 该脚本块是一个字符串声明,它定义了由过程执行到执行任务的命令。 一个进程仅包含一个脚本块,并且当该进程包含输入和输出声明时,它必须是最后一个语句。 输入的字符串在主机系统中作为Bash脚本 执行。它可以是通常在终端外壳程序或通用Bash脚本中使用的任何命令,脚本或它们的组合。 可以在脚本语句中使用的命令的唯一限制是目标执行系统中这些程序的可用性。 脚本块可以是简单字符串或多行字符串