python字符串

re模块

倾然丶 夕夏残阳落幕 提交于 2020-02-07 00:23:54
正则表达式 ​ 一组特殊符号组成的表达式,用于描述某种规则。该应用场景生活中随处可见。 ​ 例如:让有志青年过上体面的生活,这里面就由规则,即有志青年。 正则表达式的作用,以及使用场景 ​ 1.用于从字符串中匹配满足某种规则的内容,多数用于爬虫应用程序 ​ 2.判断字符串串内容是否满足某种规则,多用于严重用户输入。例如密码是否规范,手机号是否正确等 学习重点 ​ 正则是一堆特殊符号组成的,我们主要学习的就是这些特殊符号 元字符 描述 \ 将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如,“\n”匹配\n。“\n”匹配换行符。序列“\”匹配“”而“(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。 ^ 匹配输入字行首。如果设置了RegExp对象的Multiline属性,^也匹配“\n”或“\r”之后的位置。 $ 匹配输入行尾。如果设置了RegExp对象的Multiline属性,$也匹配“\n”或“\r”之前的位置。 * 匹配前面的子表达式任意次。例如,zo 能匹配“z”,也能匹配“zo”以及“zoo”。 等价于{0,}。 + 匹配前面的子表达式一次或多次(大于等于1次)。例如,“zo+”能匹配“zo”以及“zoo”,但不能匹配“z”。+等价于{1,}。 { n } n 是一个非负整数。匹配确定的 n 次。例如,“o{2}”不能匹配“Bob”中的“o”

正则表达式学习笔记

笑着哭i 提交于 2020-02-06 23:55:38
1. 引言 以前我们用 grep 在一个文件中找出包含某些字符串的行,比如在头文件中找出一个宏定义。其实 grep 还可以找出 符合某个模式(Pattern) 的一类字符串。例如找出所有符合 xxxxx@xxxx.xxx 模式的字符串(也就是email地址),要求x字符可以是字母、数字、下划线、小数点或减号,email地址的每一部分可以有一个或多个x字符,例如 abc.d@ef.com 、 1_2@987-6.54 ,当然符合这个模式的不全是合法的email地址,但至少可以做一次初步筛选,筛掉 a.b 、 c@d 等肯定不是email地址的字符串。再比如,找出所有符合 yyy.yyy.yyy.yyy 模式的字符串(也就是IP地址),要求y是0-9的数字,IP地址的每一部分可以有1-3个y字符。 如果要用 grep 查找一个模式,如何表示这个模式,这一类字符串,而不是一个特定的字符串呢?从这两个简单的例子可以看出,要表示一个模式至少应该包含以下信息: 字符类(Character Class) :如上例的x和y,它们在模式中表示一个字符,但是取值范围是一类字符中的任意一个。 数量限定符(Quantifier) : 邮件地址的每一部分可以有 一个或多个x字符,IP地址的每一部分可以有 1-3个y字符 各种字符类以及普通字符之间的位置关系:例如邮件地址分三部分,用普通字符 @ 和 . 隔开

009.Python字符串相关函数

萝らか妹 提交于 2020-02-06 21:34:20
字符串相关函数 1 capitalize 字符串首字母大写 strvar = "this is a dog" res = strvar.capitalize() print(res) 执行 [root@node10 python]# python3 test.py This is a dog 2 title 每个单词的首字母大写 非字母隔开的单词 strvar = "this is123a dog" res = strvar.title() print(res) 执行 [root@node10 python]# python3 test.py This Is123A Dog 3 upper 将所有字母变成大写 strvar = "A C c d" res = strvar.upper() print(res) 执行 [root@node10 python]# python3 test.py A C C D 4 lower 将所有字母变成小写 strvar = "A C c d" res = strvar.lower() print(res) 执行 [root@node10 python]# python3 test.py a c c d 5 swapcase 大小写互换 strvar = "A C c d" res = strvar.swapcase() print(res) 执行

web框架之environment处理

試著忘記壹切 提交于 2020-02-06 16:59:36
从现在开始,我们将一步步完成一个WSGI的WEB框架,从而了解WEB框架的内部机制。 WSGI请求environ处理 WSGI服务器程序会帮我们处理HTTP请求报文,但是提供的environ还是一个用起来不方便的字典。 http://127.0.0.1:9999/python/index.html?id=1234&name=tom ('SERVER_PROTOCOL', 'HTTP/1.1') ('wsgi.url_scheme', 'http') ('HTTP_HOST', '127.0.0.1:9999') ('SERVER_PORT', '9999') ('REMOTE_ADDR', '127.0.0.1') ('REQUEST_METHOD', 'GET') ('CONTENT_TYPE', 'text/plain') ('PATH_INFO', '/python/index.html') ('QUERY_STRING', 'id=1234&name=tom') ('HTTP_USER_AGENT', 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Maxthon/5.0 Chrome/55.0.2883.75 Safari/537.36') QUERY_STRING 查询字符串的解析

python学习笔记第十六天------------网络编程之正则表达式概述

点点圈 提交于 2020-02-06 15:19:19
文章目录 1. 正则表达式概述 2. re模块操作 2.1 re模块的使用过程 2.2 re模块示例 3. 匹配单个字符 4. 匹配多个字符 5. 匹配开头结尾 6. 匹配分组 7. re模块的高级用法 7.1 search 7.2 findall 7.3 sub 将匹配到的数据进行替换 7.4 split 根据匹配进行切割字符串,并返回一个列表 8. 贪婪和非贪婪 9. r的作用 1. 正则表达式概述 场景1:在一个文件中,查找出itcast开头的语句 测试文件 itcast hello python itcast c++ itheima ios itheima php 场景:在一个文件中,找到含有itcast的语句 测试文件 hello itcast python www.itcast.cn c++ itheima ios itheima php 2. re模块操作 在Python中需要通过正则表达式对字符串进行匹配的时候,可以使用一个模块,名字为re 2.1 re模块的使用过程 #coding=utf-8 # 导入re模块 import re # 使用match方法进行匹配操作 result = re . match ( 正则表达式 , 要匹配的字符串 ) # 如果上一步匹配到数据的话,可以使用group方法来提取数据 result . group ( ) 2.2

蓝桥杯Python组——字符串

坚强是说给别人听的谎言 提交于 2020-02-06 08:00:20
蓝桥杯Python组——字符串 例1: 题目链接 n = int ( input ( ) ) # 这个for循环用来原封不动输出前n行字符串 for i in range ( n ) : print ( input ( ) + "\n" ) #以空格作为分片标准依次输出 while True : try : a = input ( ) . split ( ) for s in a : print ( s + "\n" ) except : break 解析: 此题分为两个部分,将前n行字符串原封不动输出后就可以将之后的简化为简单的分片输出了。 例2: 题目链接 # 生成字符串的函数 def ABC ( n ) : if n == 1 : return "A" else : return ABC ( n - 1 ) + chr ( 64 + n ) + ABC ( n - 1 ) while True : try : a = int ( input ( ) ) print ( ABC ( a ) ) except : break 解析: 这个串的特点是把上一级的串放在首尾,然后中间夹一个新的字母。这里用到递归函数来操作。chr()是根据ASCII码输出数字对应的字符。 来源: CSDN 作者: 梦里一声何处鸿 链接: https://blog.csdn.net/Deam_swan

python f-string

扶醉桌前 提交于 2020-02-06 01:23:00
python3.6及以后的版本支持f-string f-string提供了一种使用最少的语法将表达式嵌入到字符串文本中的方法。应该注意,f-string实际上是在运行时计算的表达式,而不是常量。在Python源代码中,f-string是一个文字字符串,以“f”为前缀,其中包含大括号内的表达式。表达式被它们的值替换。 用法: >>> x = 1 >>> print(f'{x}', f"{x}", f"""{x}""") 1 1 1 >>> print(f'{x}', f'{{x}}' , f'{{{x}}}') 1 {x} {1} 来源: https://www.cnblogs.com/edhg/p/12267469.html

JavaScript

懵懂的女人 提交于 2020-02-05 19:38:52
JavaScript JavaScript引入方式 script标签内写代码 <script>在这里写JS代码</script> 引入额外的JS文件 <script src="myscript.js"></script> JavaScript语言规范 注释 // 单行注释 /* 多行注释 */ JavaScript语言基础 变量声明 JavaScript的变量名可以使用数字、字母、_、$组成,但是不能以数字开头。 声明变量使用 var 变量名; 的格式来声明。 var name="xiaowu"; var age=18; 注意 变量名是区分大小写的。 推荐使用驼峰式命名规则。 保留字(关键字)不能用做变量名。 JavaScript数据类型 JavaScript拥有动态类型 var x; // 此时x是underfined var x=1; // 此时x是数字 var x="xiaowu"; // 此时x是字符串 数值(Number) JavaScript不区分整型和浮点型,只有一种数字类型。 var a=18; var b=18.18; var c=123e3; // 123000 var d=123e-3 // 0.123 还有一种NaN,表示不是一个数字(Not a Number)。 常用方法: parseInt("123") // 返回123 parseInt("abc")

Python 方法总结

懵懂的女人 提交于 2020-02-05 09:23:16
Python 3 strip()方法 描述: Python strip()方法用于移除字符串头尾指定得字符(默认是空格)胡或字符列。 注意: 该方法只能删除 开头或是结尾 的字符,不能删除中间部分的字符。 用法: strip()方法用法: str.strip([chars]) 参数: chars -- 移除字符串头尾指定的字符序列 返回值: 返回移除字符串头尾得指定字符序列生成的新字符串。 str = "123dfnfdkg212" print (str.strip('12')) # 只要头尾包含指定得字符串序列中的字符就能删除,不管有多少个 # 3dfnfdkg 总结: 声明:s为字符串,rm为要删除的字符序列 s.strip(rm) 删除s字符串中开头、结尾处,位于 rm删除序列的字符 s.lstrip(rm) 删除s字符串中开头处,位于 rm删除序列的字符 s.rstrip(rm) 删除s字符串中结尾处,位于 rm删除序列的字符 1. strip()处理时,如果不带参数,默认是清楚两边的空白符(例如包括 '\n', '\r', '\t', ' ' )。 2.strip()带有参数时,这个参数可以理解为一个要删除的字符串,删除的原则是字符串 最开头或者最结尾 是否包含要删除的字符串 addr = '123@163.com' addr1 = addr.strip('12') #

Unicode字符串

戏子无情 提交于 2020-02-04 23:45:49
字符串还有一个编码问题。 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),0 - 255被用来表示大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母 A 的编码是65,小写字母 z 的编码是122。 如果要表示中文,显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编码冲突,所以,中国制定了GB2312编码,用来把中文编进去。 类似的,日文和韩文等其他语言也有这个问题。为了统一所有文字的编码,Unicode应运而生。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。 Unicode通常用两个字节表示一个字符,原有的英文编码从单字节变成双字节,只需要把高字节全部填为0就可以。 因为Python的诞生比Unicode标准发布的时间还要早,所以最早的Python只支持ASCII编码,普通的字符串'ABC'在Python内部都是ASCII编码的。 Python在后来添加了对Unicode的支持,以Unicode表示的字符串用u'...'表示,其中的转义依然起作用,比如: print(u'中文') 运行结果 中文 转义: u'中文\n日文\n韩文' 多行: u