正则表达式-贪婪与懒惰
事故: 今天写vpnbook.py的时候(参见 vpnbook.py ),遇到一个问题,匹配到太多的数据,而且是我不需要的。 我要对某个html进行解析,又为了跨平台和快速使用,就没有使用第三方库(比如BeautifulSoup) 获得的html如下 1 <!DOCTYPE html> 2 3 <!--[if lt IE 7 ]><html class="ie ie6 no-js" lang="en"> <![endif]--> 4 5 <!--[if IE 7 ]><html class="ie ie7 no-js" lang="en"> <![endif]--> 6 7 <!--[if IE 8 ]><html class="ie ie8 no-js" lang="en"> <![endif]--> 8 9 <!--[if IE 9 ]><html class="ie ie9 no-js" lang="en"> <![endif]--> 10 11 <!--[if (gte IE 9)|!(IE)]><!--><html class="no-js" lang="en"> <!--<![endif]--> 12 13 <head> 14 15 <meta charset="utf-8"> 16 17 <meta http-equiv="X-UA-Compatible"