正则表达式量词与贪婪的使用详解_正则表达式-免费资源网

来自：网络

时间：2021-11-07

阅读：

0.写在前面

在上一篇文章中，我们学习了正则的一些基础元字符，相信大家都已经忘却的差不多了，可以点击上面的链接再温习下。

今天我们一起来学习下正则中量词的三种匹配模式，贪婪模式、非贪婪模式、独占模式，这些模式会改变正则中量词的匹配行为，是每次贪婪的匹配到更多呢，还是不贪婪见好就收呢，如果不了解这些，我们写出的正则很可能是错误的，甚至会引发严重的线上性能问题。

1.量词

本篇文章所讲的内容和量词关系比较密切，先回顾下：

正则表达式量词与贪婪的使用详解

我们还可以用 {m,n} 的方式来表示 * + ? 这3种元字符：

元字符	同义表示方法	示例
*	{0,}	ab* 可以匹配 a 或者 abb
+	{1,}	ab+ 可以匹配 ab 或者 abb 但不能匹配 a
?	{0,1}	ab? 可以匹配 a 或者 ab 但不能匹配 abb

2.贪婪模式前传

在正则中，表示次数的量词默认是贪婪的，在贪婪模式下，会尽可能最大长度的去匹配目标字符串，我们用正则 a+ 和 a* 来匹配字符串 aaabb 测试一下。

2.1 使用 a+ 进行匹配

可以看到只匹配到了1个结果 aaa

正则表达式量词与贪婪的使用详解

对应的 Python 代码如下：

import re

print(re.findall(r'a+', 'aaabb'))

输出：['aaa']

2.2 使用 a* 进行匹配

可以看到匹配到了4个结果，其中还有3个是空字符串

正则表达式量词与贪婪的使用详解

对应的 Python 代码如下：

import re

print(re.findall(r'a*', 'aaabb'))

输出：['aaa', '', '', '']

为什么会匹配到空字符串呢？因为星号（*）代表匹配0到多次，匹配0次就是空字符串，那前面还有个 aaa 呢，为什么 aaa 之间的空字符串没有被匹配到？

这就引入到了我们今天要讲的，贪婪模式与非贪婪模式，从字面上很好理解，贪婪模式就是尽可能多的匹配，非贪婪模式就是尽可能少的匹配。

3.贪婪模式

一起来分析下上面正则 a* 的匹配过程：

字符串	a	a	a	b	b	空字符串
下标	0	1	2	3	4	5

匹配	开始	结束	说明	匹配内容
第一次	0	3	到第一个字母b发现不匹配，输出aaa	aaa
第二次	3	3	匹配剩下的bb，发现匹配不上，输出空字符串	空字符串
第三次	4	4	匹配剩下的b，发现匹配不上，输出空字符串	空字符串
第四次	5	5	匹配剩下的空字符串，输出空字符串	空字符串

a* 在匹配字符串 aaabb 时，会尽可能多的把前面的 a 都匹配上，直到第一个字母 b 不满足要求为止，匹配上3个 a，后面每次匹配的都是空字符串。

看到这里，相信你已经对贪婪模式有了更深的印象，贪婪模式的特点就是尽可能进行最大长度匹配，就是有多少要多少，下面我们在一起来看下与它完全相反的匹配模式。

4.非贪婪模式

上面讲完了贪婪模式，贪婪模式是尽可能最大长度匹配，非贪婪模式就是尽可能最小长度匹配，在量词的后面加一个问号（?），就成了非贪婪模式，比如 a*?

正则表达式量词与贪婪的使用详解

对应的 Python 代码如下：

import re

// 贪婪匹配
print(re.findall(r'a*', 'aaabb'))

输出：['aaa', '', '', '']

// 非贪婪匹配
print(re.findall(r'a*?', 'aaabb'))

输出：['', 'a', '', 'a', '', 'a', '', '', '']

学完了贪婪模式与非贪婪模式，你可能会问，我什么情况下会用到呢，下面举个栗子感受下：

正则表达式量词与贪婪的使用详解

需求是查找一段字符串中，所有双引号括起来的内容，上面使用贪婪匹配与非贪婪匹配的对比，差别很明显对吧。

5.独占模式

不管是贪婪模式，还是非贪婪模式，匹配过程中都需要发生回溯才能完成想要的功能，但是在有一些场景，我们不需要回溯，匹配不上直接返回失败就可以了，因此正则匹配中还有另外一种模式，独占模式，它和贪婪模式很像，但匹配过程中不会发生回溯，在一些使用场景中性能会更好。

先来讲讲什么是回溯，再举个栗子，有一个正则表达式和目标字符串,我们分别看下在三种匹配模式下都发生了什么：

5.1 贪婪匹配过程

正则表达式：ab{1,3}c

目标字符串：abbc

在匹配时，b{1,3} 会尽可能长的去匹配目标字符串，匹配完 abb 之后，因为要尽可能长的匹配（3个 b），目标字符串中的c就会匹配不上，这个时候会发生向前回溯，吐出当前字符 c，用正则中的 c 去匹配，匹配成功。

正则表达式量词与贪婪的使用详解

import regex

print(regex.findall(r'ab{1,3}c', 'abbc'))

输出：['abbc']

5.2 非贪婪匹配过程

正则表达式：ab{1,3}?c

目标字符串：abbc

在匹配时，b{1,3} 会尽可能短的去匹配目标字符串，匹配完 ab 之后，会直接用正则 c 去匹配目标字符串剩下的 b，匹配不上，发生向前回溯，重新用正则 b{1,3} 匹配目标字符串剩下的 b，然后正则 c 匹配目标字符串剩下的 c，匹配成功。

正则表达式量词与贪婪的使用详解

import regex

print(regex.findall(r'ab{1,3}?c', 'abbc'))

输出：['abbc']

5.3 独占匹配过程

在量词后面加上 + 就是独占模式。

正则表达式：ab{1,2}+bc

目标字符串：abbc

在匹配时，b{1,2} 会尽可能长的去匹配目标字符串，匹配完 abb 之后，会用正则 b 匹配目标字符串剩下的 c，匹配不上，不回溯，匹配失败。

正则表达式量词与贪婪的使用详解

import regex

print(regex.findall(r'ab{1,2}+bc', 'abbc'))

输出：[]

6.写在最后

最后在总结下上面讲到的内容：

正则表达式量词与贪婪的使用详解

到这里，正则表达式的量词与贪婪就讲完了，如果有问题可以给我留言评论，谢谢。

正则表达式在线校验工具：https://regex101.com/

php正则怎么去掉href?问题描述：php 正则表达式去除href及数据要把这段<a target="_blank" href="./Itemxteal_8000-0000_1.htm">8000-0000</a>替换为<a target="_blank" >80

2021-11-24 11:40:14

php 正则函数怎么实现匹配替换？php正则表达式的匹配与替换只介绍两个与Perl兼容的正则表达式函数：1.preg_match_all 函数执行正则表达式匹配与搜索；2.preg_replace 函数执行正

2021-11-15 15:29:25

本文是小编参考其他有关js正则表达式资料整理的，主要目的有两个：一：自我复习归纳总结。二：共享方便大家搜索
。js正则表达式感兴趣的朋友可以一起学习，没有写的知识点，欢迎大家补

2021-11-07 22:30:22

在JavaScript代码中使用正则表达式进行模式匹配经常会用到String对象和RegExp对象的一些方法，例如replace、match、search等方法，下面所述是对相关方法使用的总结，需要的朋友参

2021-11-07 22:30:21

熟练地掌握正则表达式的话，能够使你的开发效率得到极大的提升。正则表达式经常被用于字段或任意字符串的校验，如下面这段校验基本日期格式的JavaScript代码：var reg = /^(\\d{1

2021-11-07 22:30:19

一、贪婪与非贪婪什么叫贪婪，比如说要从字符串中<td>面包一</td><td>面包二</td>吃面包，本来你只可以吃面包一，可是你贪心，于是就把第一个<td>到最后一个</td>里面的两个面包取

2021-11-07 22:30:17

正则表达式对象的方法1、test,返回一个 Boolean 值，它指出在被查找的字符串中是否存在模式。如果存在则返回 true，否则就返回 false。
2、exec,用正则表达式模式在字符串中运

2021-11-07 22:30:15

许多语言，包括Perl、PHP、Python、JavaScript和JScript，都支持用正则表达式处理文本，一些文本编辑器用正则表达式实现高级“搜索-替换”功能。所以JAVA语言也不例外。正则表达

2021-11-07 22:30:13

我有以下几行：d:\Projects\qqq\Development\qqq.MySol1.sln
d:\Projects\qqq\qqqDevelopment\qqqMySol2.sln
d:\Projects\qqq\Development\MyInstaller.sln
d:\Projects\q

2021-11-07 22:30:11

Extjs的Regex的验证属性分两种情况,一种是只有红色提示框；另一种是在提示框边会出现一个类似批注的提示信息，不过在页面加载时要加上Ext.QuickTips.init();提示框才能正常显示

2021-11-07 22:30:10

正则表达式是做文本解析工作必不可少的技能。如Web服务器日志分析，网页前端开发等。很多高级文本编辑器都支持正则表达式的一个子集，熟练掌握正则表达式，经常能够使你的一些工

2021-11-07 22:30:08

密码形式可以根据开发需求自己设定，下面是几个匹配密码的例子：正则表达式 ^[a-zA-Z]\w{5,17}$
匹配以字母开头，长度在6~18之间，只能包含字符、数字和下划线
不匹配
正则表达式

2021-11-07 22:30:07

正则表达式也称为模式表达式，自身具有一套非常完整的、可以编写模式的语法体系，提供了一种灵活且直观的字符串处理方法。正则表达式通过构建具有特定规则的模式，与输入的字符串

2021-11-07 22:30:05

相关阅读：IOS开发常用的正则表达式Java正则表达式过滤出字母、数字和中文正则表达式(regular expression)描述了一种字符串匹配的模式，可以用来检查一个串是否含有某种子串、

2021-11-07 22:30:04

　　"^/d+$"　　 //非负整数(正整数 + 0)　　"^[0-9]*[1-9][0-9]*$"　　 //正整数　　"^((-/d+)|(0+))$"　　 //非正整数(负整数 + 0)　　"^-[0-9]*[1-9][0-9]*$"　　 //负

2021-11-07 22:30:02

虽然以前发不过不少的正则表达式教程，但这篇文章还是不错的，无废话都是比较实际的，前提就是需要你之前懂点正则表达式，要不还是先看些基本的正则表达式教程比较好。------------

2021-11-07 22:30:00

正则表达式：对字符串中的信息实现查找、替换和提取操作。（不支持注释和空白，必须写在一行内）
正则表达式的创建：包含在一对斜杠之间的字符（直接量语法）
例如：
var pattern = /s$/;

2021-11-07 22:29:58

正则表达式的语法就不多说了，大家可以自己搜索查阅相关资料学习。本文所举例子是在《JavaScript语言精粹》上看到的，看完之后对正则表达式有了进一步的理解，故分享之。例子
//

2021-11-07 22:29:56

本教程旨在帮助你驾驭Java正则表达式，同时也帮助我复习正则表达式。什么是正则表达式?正则表达式定义了字符串的模式。正则表达式可以用来搜索、编辑或处理文本。正则表

2021-11-07 22:29:54

在javascript中，使用正则表达式匹配换行可能会遇到各种问题，下面就通过实例介绍一下如何实现此功能。<div id=”main”> <div id=”left”> </div> <div id=”right”> </div>

2021-11-07 22:29:52

正则表达式是用于处理字符串的强大工具，它并不是Python的一部分。其他编程语言中也有正则表达式的概念，区别只在于不同的编程语言实现支持的语法数量不同。它拥有自己独特的语

2021-11-07 22:29:50

正则表达式，又称正规表示法、常规表示法（英语：Regular Expression，在代码中常简写为regex、regexp或RE），计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合

2021-11-07 22:29:48

as3代码：var str = ""; var reg = /(\d{}) \/gx; // \ 即为反向分组，代表前一个分组相同的匹配结果字符。如\d{} 匹配了，那么\也只能为匹配， var first=str.match(reg); //match

2021-11-07 22:29:45

常用正则表达式大全！（例如：匹配中文、匹配html）
匹配中文字符的正则表达式： [u4e00-u9fa5] 　　
评注：匹配中文还真是个头疼的事，有了这个表达式就好办了　
　匹配双字节字符(包

2021-11-07 22:29:43

在php中preg_match()函数是用来执行正则表达式的一个常用的函数。正则表达式几乎在所有编程语言里面都会用到，本实例介绍php中正则表达式preg_match函数的应用。preg_match()

2021-11-07 22:29:42

第一：限制只能是整数<input type = "text" name= "number" id = 'number' onkeyup= "if(! /^d+$/.test(this.value)){alert('只能整数');this.value='';}" />如果不是整数就

2021-11-07 22:29:40

var reCat = new RegExp("cat", "gi"); //RegExp构造函数可以带一个或两个参数，第一个参数描述需要进行匹配的模式字符串，第二个参数指定了额外的处理命令 var reCat = /cat/g

2021-11-07 22:29:38

一、js正则表达式之replace函数用法：函数功能：replace函数返回根据正则表达式进行文字替换后的字符串的复制。
函数格式：stringObj.replace(rgExp, replaceText)
参数：字符串s

2021-11-07 22:29:37

js中的正则表达式使用function myValid() { var errorMsg = ""; var res = true; //拿到要验证的值. var receiveName = $("#receiveName").val();//姓名 var receiveM

2021-11-07 22:29:35

正则表达式是一个描述字符模式的对象。首先，此片文章并不是直接告诉你，url的正则表达式是什么，以及怎么使用这个正则表达式去解析一个URL地址，相信这种问题在网络上已经能找到很

2021-11-07 22:29:34

2020-04-15

2021-01-27

2019-08-06

2019-08-11

2019-08-07

2020-04-19

2019-08-06

2019-10-05

正则表达式量词与贪婪的使用详解

目录

0.写在前面

1.量词

2.贪婪模式前传

2.1 使用 a+ 进行匹配

2.2 使用 a* 进行匹配

3.贪婪模式

4.非贪婪模式

5.独占模式

5.1 贪婪匹配过程

5.2 非贪婪匹配过程

5.3 独占匹配过程

6.写在最后

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道