正则表达式教程之重复匹配详解_正则表达式-免费资源网

来自：网络

时间：2021-11-07

阅读：

本文实例讲述了正则表达式教程之重复匹配。分享给大家供大家参考，具体如下：

注：在所有例子中正则表达式匹配结果包含在源文本中的【和】之间，有的例子会使用Java来实现，如果是java本身正则表达式的用法，会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。

一、有多少个匹配

前面几篇讲的都是匹配一个字符，但是一个字符或字符集合要匹配多次，应该怎么做呢？比如要匹配一个电子邮件地址，用之前说到的方法，可能有人会写出像\w@\w\.\w这样的正则表达式，但这个只能匹配到像a@b.c这样的地址，明显是不正确的，接下来就来看看如何匹配电子邮件地址。

首先要知道电子邮件地址的组成：以字母数字或下划线开头的一组字符，后面跟@符号，再后面是域名，即用户名@域名地址。不过这也跟具体的邮箱服务提供商有关，有的在用户名中也允许.字符。

1、匹配一个或多个字符

要想匹配同一个字符（或字符集合）的多次重复，只要简单地给这个字符（或字符集合）加上一个+字符作为后缀就可以了。+匹配一个或多个字符（至少一个）。如：a匹配a本身，a+将匹配一个或多个连续出现的a；[0-9]+匹配多个连续的数字。

注意：在给一个字符集合加上+后缀的时候，必须把+放在字符集合的外面，否则就不是重复匹配了。如[0-9+]这样就表示数字或+号了，虽然语法上正确，但不是我们想要的了。

文本：Hello, mhmyqn@qq.com or mhmyqn@126.com is my email.

正则表达式：\w+@(\w+\.)+\w+

结果：Hello, 【mhmyqn@qq.com】 or 【mhmyqn@126.com】 is my email.

分析：\w+可以匹配一个或多个字符，而子表达式(\w+\.)+可匹配像xxxx.edu.这样的字符串，而最后不会是.字符结尾，所以后面还会有一个\w+。像mhmyqn@xxxx.edu.cn这样的邮件地址也会匹配到。

2、匹配零个或多个字符

匹配零个或多个字符使用元符*，它的用法和+完全一样，只要把它放在一下字符或字符集合的后面，就可以匹配该字符（或字符集合）连续出现零次或多次。如正则表达式ab*c可以匹配ac、abc、abbbbbc等。

3、匹配零个或一个字符

匹配零个或一个字符使用元字符?。像上一篇说到的匹配一个空白行使用正则表达式\r\n\r\n，但在Unix和Linux中不需要\r，就可以使用元字符?，\r?\n\r?\n这样既可匹配windows中的空白行，也可匹配Unix和Linux中的空白行。下面来看一个匹配http或https协议的URL的例子：

文本：The URL is http://www.mikan.com, to connect securely use https://www.mikan.cominstead.

正则表达式：https?://(\w+\.)+\w+

结果：The URL is 【http://www.mikan.com】, to connect securely use 【https://www.mikan.com】 instead.

分析：这个模式以https?开头，表示?之前的一个字符可以有，也可以没有，所以它能匹配http或https，后面部分和前一个例子一样。

二、匹配的重复次数

正则表达式里的+、*和?解决了很多问题，但是：

1）+和*匹配的字符个数没有上限。我们无法为它们将匹配的字符个数设定一个最大值。

2）+、*和?至少匹配一个或零个字符。我们无法为它们将匹配的字符个数另行设定一个最小值。

3）如果只使用*和+，我们无法把它们将匹配的字符个数设定为一个精确的数字。

正则表达式里提供了一个用来设定重复次数的语法，重复次数要用{和}字符来给出，把数值写在它们中间。

1、为重复匹配次数设定一个精确值

如果想为重复匹配次数设定一个精确的值，把那个数字写在{和}之间即可。如{4}表示它前面的那个字符（或字符集合）必须在原始文本中连续重复出现4次才算是一个匹配，如果只出现了3次，也不算是一个匹配。

如前面几篇中说到的匹配页面中颜色的例子，就可以用重复次数来匹配：#[[:xdigit:]]{6}或#[0-9a-fA-F]{6}，POSIX字符在java中是#\\p{XDigit}{6}。

2、为重复匹配次数设定一个区间

{}语法还可以用来为重复匹配次数设定一个区间，也就是为重复匹配次数设定一个最小值和最大值。这种区间必须以{n, m}这样的形式给出，其中n>=m>=0。如检查日期格式是否正确（不检查日期的有效性）的正则表达式（如日期2012-08-12或2012-8-12）：\d{4}-\d{1,2}-\d{1,2}。

3、匹配至少重复多少次

{}语法的最后一种用法是给出一个最小的重复次数（但不必给出最大重复次数），如{3,}表示至少重复3次。注意：{3,}中一定要有逗号，而且逗号后不能有空格。否则会出错。

来看一个例子，使用正则表达式把所有金额大于$100的金额找出来：

文本：

$25.36

$125.36

$205.0

$2500.44

$44.30

正则表达式：$\d{3,}\.\d{2}

结果：

$25.36

【$125.36】

【$205.0】

【$2500.44】

$44.30

+、*、?可以表示成重复次数：

+等价于{1,}

*等价于{0,}

?等价于{0,1}

三、防止过度匹配

?只能匹配零个或一个字符，{n}和{n,m}也有匹配重复次数的上限，但是像*、+、{n,}都没有上限值，这样有时会导致过度匹配的现象。

来看匹配一个html标签的例子

文本：

Yesterday is <b>history</b>,tomorrow is a <B>mystery</B>, but today is a <b>gift</b>.

正则表达式：<[Bb]>.*</[Bb]>

结果：

Yesterday is 【<b>history</b>,tomorrow is a <B>mystery</B>, but today is a <b>gift</b>】.

分析：<[Bb]>匹配<b>标签（不区分大小写），</[Bb]>匹配</b>标签（不区分大小写）。但结果却不是预期的那样有三个，第一个</b>标签之后，一直到最后一个</b>之间的东西全部匹配出来了。

为什么会这样呢？因为*和+都是贪婪型的元字符，它们在匹配时的行为模式是多多益善，它们会尽可能从一段文本的开头一直匹配到这段文本的末尾，而不是从这段文本的开头匹配到碰到第一个匹配时为止。

当不需要这种贪婪行为时，可以使用这些元字符的懒惰型版本。懒惰意思是匹配尽可能少的字符，与贪婪型相反。懒惰型元字符只需要给贪婪型元字符加上一个?后缀即可。下面是贪婪型元字符的对应懒惰型版本：

* *?

+ +?

{n,} {n,}?

所以上面的例子中，正则表达式只需要改成<[Bb]>.*?</[Bb]>即可，结果如下：

<b>history</b>

<B>mystery</B>

四、总结

正则表达式的真下威力体现在重复次数匹配方面。这里介绍了+、*、?几种元字符的用法，如果要精确的确定匹配次数，使用{}。元字符分贪婪型和懒惰型两种，在需要防止过度匹配的场合下，请使用懒惰型元字符来构造正则表达式。在下一篇中将会介绍位置匹配。

PS：这里再为大家提供2款非常方便的正则表达式工具供大家参考使用：

JavaScript正则表达式在线测试工具：
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具：
http://tools.jb51.net/regex/create_reg

希望本文所述对大家正则表达式学习有所帮助。

php正则怎么去掉href?问题描述：php 正则表达式去除href及数据要把这段<a target="_blank" href="./Itemxteal_8000-0000_1.htm">8000-0000</a>替换为<a target="_blank" >80

2021-11-24 11:40:14

php 正则函数怎么实现匹配替换？php正则表达式的匹配与替换只介绍两个与Perl兼容的正则表达式函数：1.preg_match_all 函数执行正则表达式匹配与搜索；2.preg_replace 函数执行正

2021-11-15 15:29:25

本文是小编参考其他有关js正则表达式资料整理的，主要目的有两个：一：自我复习归纳总结。二：共享方便大家搜索
。js正则表达式感兴趣的朋友可以一起学习，没有写的知识点，欢迎大家补

2021-11-07 22:30:22

在JavaScript代码中使用正则表达式进行模式匹配经常会用到String对象和RegExp对象的一些方法，例如replace、match、search等方法，下面所述是对相关方法使用的总结，需要的朋友参

2021-11-07 22:30:21

熟练地掌握正则表达式的话，能够使你的开发效率得到极大的提升。正则表达式经常被用于字段或任意字符串的校验，如下面这段校验基本日期格式的JavaScript代码：var reg = /^(\\d{1

2021-11-07 22:30:19

一、贪婪与非贪婪什么叫贪婪，比如说要从字符串中<td>面包一</td><td>面包二</td>吃面包，本来你只可以吃面包一，可是你贪心，于是就把第一个<td>到最后一个</td>里面的两个面包取

2021-11-07 22:30:17

正则表达式对象的方法1、test,返回一个 Boolean 值，它指出在被查找的字符串中是否存在模式。如果存在则返回 true，否则就返回 false。
2、exec,用正则表达式模式在字符串中运

2021-11-07 22:30:15

许多语言，包括Perl、PHP、Python、JavaScript和JScript，都支持用正则表达式处理文本，一些文本编辑器用正则表达式实现高级“搜索-替换”功能。所以JAVA语言也不例外。正则表达

2021-11-07 22:30:13

我有以下几行：d:\Projects\qqq\Development\qqq.MySol1.sln
d:\Projects\qqq\qqqDevelopment\qqqMySol2.sln
d:\Projects\qqq\Development\MyInstaller.sln
d:\Projects\q

2021-11-07 22:30:11

Extjs的Regex的验证属性分两种情况,一种是只有红色提示框；另一种是在提示框边会出现一个类似批注的提示信息，不过在页面加载时要加上Ext.QuickTips.init();提示框才能正常显示

2021-11-07 22:30:10

正则表达式是做文本解析工作必不可少的技能。如Web服务器日志分析，网页前端开发等。很多高级文本编辑器都支持正则表达式的一个子集，熟练掌握正则表达式，经常能够使你的一些工

2021-11-07 22:30:08

密码形式可以根据开发需求自己设定，下面是几个匹配密码的例子：正则表达式 ^[a-zA-Z]\w{5,17}$
匹配以字母开头，长度在6~18之间，只能包含字符、数字和下划线
不匹配
正则表达式

2021-11-07 22:30:07

正则表达式也称为模式表达式，自身具有一套非常完整的、可以编写模式的语法体系，提供了一种灵活且直观的字符串处理方法。正则表达式通过构建具有特定规则的模式，与输入的字符串

2021-11-07 22:30:05

相关阅读：IOS开发常用的正则表达式Java正则表达式过滤出字母、数字和中文正则表达式(regular expression)描述了一种字符串匹配的模式，可以用来检查一个串是否含有某种子串、

2021-11-07 22:30:04

　　"^/d+$"　　 //非负整数(正整数 + 0)　　"^[0-9]*[1-9][0-9]*$"　　 //正整数　　"^((-/d+)|(0+))$"　　 //非正整数(负整数 + 0)　　"^-[0-9]*[1-9][0-9]*$"　　 //负

2021-11-07 22:30:02

虽然以前发不过不少的正则表达式教程，但这篇文章还是不错的，无废话都是比较实际的，前提就是需要你之前懂点正则表达式，要不还是先看些基本的正则表达式教程比较好。------------

2021-11-07 22:30:00

正则表达式：对字符串中的信息实现查找、替换和提取操作。（不支持注释和空白，必须写在一行内）
正则表达式的创建：包含在一对斜杠之间的字符（直接量语法）
例如：
var pattern = /s$/;

2021-11-07 22:29:58

正则表达式的语法就不多说了，大家可以自己搜索查阅相关资料学习。本文所举例子是在《JavaScript语言精粹》上看到的，看完之后对正则表达式有了进一步的理解，故分享之。例子
//

2021-11-07 22:29:56

本教程旨在帮助你驾驭Java正则表达式，同时也帮助我复习正则表达式。什么是正则表达式?正则表达式定义了字符串的模式。正则表达式可以用来搜索、编辑或处理文本。正则表

2021-11-07 22:29:54

在javascript中，使用正则表达式匹配换行可能会遇到各种问题，下面就通过实例介绍一下如何实现此功能。<div id=”main”> <div id=”left”> </div> <div id=”right”> </div>

2021-11-07 22:29:52

正则表达式是用于处理字符串的强大工具，它并不是Python的一部分。其他编程语言中也有正则表达式的概念，区别只在于不同的编程语言实现支持的语法数量不同。它拥有自己独特的语

2021-11-07 22:29:50

正则表达式，又称正规表示法、常规表示法（英语：Regular Expression，在代码中常简写为regex、regexp或RE），计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合

2021-11-07 22:29:48

as3代码：var str = ""; var reg = /(\d{}) \/gx; // \ 即为反向分组，代表前一个分组相同的匹配结果字符。如\d{} 匹配了，那么\也只能为匹配， var first=str.match(reg); //match

2021-11-07 22:29:45

常用正则表达式大全！（例如：匹配中文、匹配html）
匹配中文字符的正则表达式： [u4e00-u9fa5] 　　
评注：匹配中文还真是个头疼的事，有了这个表达式就好办了　
　匹配双字节字符(包

2021-11-07 22:29:43

在php中preg_match()函数是用来执行正则表达式的一个常用的函数。正则表达式几乎在所有编程语言里面都会用到，本实例介绍php中正则表达式preg_match函数的应用。preg_match()

2021-11-07 22:29:42

第一：限制只能是整数<input type = "text" name= "number" id = 'number' onkeyup= "if(! /^d+$/.test(this.value)){alert('只能整数');this.value='';}" />如果不是整数就

2021-11-07 22:29:40

var reCat = new RegExp("cat", "gi"); //RegExp构造函数可以带一个或两个参数，第一个参数描述需要进行匹配的模式字符串，第二个参数指定了额外的处理命令 var reCat = /cat/g

2021-11-07 22:29:38

一、js正则表达式之replace函数用法：函数功能：replace函数返回根据正则表达式进行文字替换后的字符串的复制。
函数格式：stringObj.replace(rgExp, replaceText)
参数：字符串s

2021-11-07 22:29:37

js中的正则表达式使用function myValid() { var errorMsg = ""; var res = true; //拿到要验证的值. var receiveName = $("#receiveName").val();//姓名 var receiveM

2021-11-07 22:29:35

正则表达式是一个描述字符模式的对象。首先，此片文章并不是直接告诉你，url的正则表达式是什么，以及怎么使用这个正则表达式去解析一个URL地址，相信这种问题在网络上已经能找到很

2021-11-07 22:29:34

2020-04-15

2021-01-27

2019-08-06

2019-08-11

2019-08-07

2020-04-19

2019-08-06

2019-10-05

正则表达式教程之重复匹配详解

php正则怎么去掉href

php 正则函数怎么实现匹配替换

JavaScript正则表达式(总结篇）

String字符串匹配javascript 正则表达式

可以少写1000行代码的正则表达式

php正则表达式中贪婪与非贪婪介绍

js正则表达式常用函数详解（续）

Java正则表达式入门学习

正则表达式的字符串替换方法

ExtJS4的文本框(textField)使用正则表达式进行验证(Regex)的方法

正值表达式匹配html标签的属性值

正则表达式匹配用户密码

正则表达式如何在PHP里灵活的应用

常用的正则表达式大全(数字、字符、固定格式)

java常用正则表达式

半小时精通正则表达式-精华版

js正则表达式学习笔记

仅1个例子轻松学习正则表达式

Java正则表达式学习教程

实例代码详解正则表达式匹配换行

Python正则表达式之基础篇

去掉字符串前后所有空格的正则表达式

AS3 js正则表达式反向引用(backreference)

日常收集整理正则表达式验证大全

PHP preg match正则表达式函数的操作实例

JS通过正则限制 input 输入框只能输入整数、小数(金额或者现金) 两位小数

超全的js正则表达式整理笔记

js正则表达式常用函数详解

学习正则表达式（js、C#）

JavaScript正则表达式解析URL的技巧

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道