正则表达式在Python中通过import re模块使用,最早在python 1.5版本已经加入.下文主要通过实例介绍正则表达式用法.
(01)正则表达式常用的元字符如下所示:.:匹配任何一个字符;^:匹配除去所列首个字符外的所有字符;$:匹配字符串的尾部字符
(02)*:表示匹配0个或者多个字符+:表示匹配1个或者多个字符?:表示匹配0个或者1个字符,如图中用例所示:
(03)*?,+?,??:匹配满足要求的最短字符串;{m}:匹配m个相同的字符;{m,n}:匹配m到n个相同的字符;
(04){m,n}?:匹配m到n个相同的字符(非贪婪算法,匹配最短字符);:转义字符,如果字符串不用r限定,遇到特殊字符需要进行转义;[]:满足匹配字符串的集合;|:如A|B,或的关系,满足A或者B,表达式都为真;
(05)(?=...):如果字符串后面的字符和...相匹配,则整个表达式返回真,否则失败;(?!...):和前者相反,如果字符串后面的字符和...不匹配,则整个表达式返回真
(06)(?<=...):如果在字符串找到和()后面相同的字符,继续回退字符看是否和<=后面的字符是否一样,如是则表达式返回真.(?!=...):如果在字符串找到和()后面相同的字符,继续回退字符看是否和<=后面的字符是否一样,如是则表达式返回失败.
(07)number:反斜杠后面加数据,匹配number个字符串个数.A:匹配字符串开始;b:匹配空格字符;B:匹配除了空格字符以外的字符;
(08)d:匹配任意数字;D:匹配除了数字以外的字符;w:匹配字符和下划线;W:匹配除了字符和下划线以外的字符.
反斜杠后面的字符大小写含义相反
转义字符表示符号需要用r""或者""