正则表达式入门-findall()函数
findall()函数
例子
import re a = '123abc' re=re.findall('\d\d\d',a) print(re)
导入用于完成正则表达式操作的re库
使用re库中的findall()函数提取文本
'\d'表示匹配1个数字,那么'\d\d\d'就表示匹配连续的3个数字
语法为
re.findall(匹配规则,原始文档)
注意:findall()函数返回的是一个包含提取结果的列表
import re a = '456qwe789rty123abc' re=re.findall('\d\d\d',a) print(re) print(re[0])
符号 | 含义 |
---|---|
\d | 匹配1个数字字符 |
\w | 匹配1个字母、数字或下划线字符 |
\s | 匹配1个空白字符(换行符、制表符、普通空格等) |
\S | 匹配1个非空白字符 |
\n | 匹配1个换行符“In”(相当于按1次【Enter】键) |
\t | 匹配1个制表符“\t”(相当于按1次【Tab】键或按8次空格键) |
. | 匹配1个任意字符,换行符除外 |
* | 匹配0个或多个表达式 |
+ | 匹配1个或多个表达式 |
? | 常与“.”和“*”配合使用,组成非贪婪匹配 |
() | 匹配括号内的表达式,也表示一个组 |
举例
import re a = '456qwe789rty123abc' re=re.findall('\d\d\d\w',a) print(re)
import re a = '456qwe789rty123abc' re=re.findall('\d\d\d\w.',a) print(re)