非贪婪匹配
给定一个字符串表示的数字,判断该数字末尾的个数。例如:
"123000"
:3个0
"1001"
:0个0
可以很容易地写出该正则表达式:(\d+)(0*)
,Java代码如下:
然而打印的第二个子串是空字符串""
。
但实际的分组匹配结果是这样的:
input | \d+ | |
---|---|---|
123000 | "123000" | "" |
10100 | "10100" | "" |
1001 | "1001" | "" |
仔细观察上述实际匹配结果,实际上它是完全合理的,因为\d+
确实可以匹配后面任意个0
。
这是因为正则表达式默认使用贪婪匹配:任何一个规则,它总是尽可能多地向后匹配,因此,\d+
总是会把后面的0
包含进来。
要让\d+
尽量少匹配,让0*
尽量多匹配,我们就必须让\d+
使用非贪婪匹配。在规则\d+
后面加个?
即可表示非贪婪匹配。我们改写正则表达式如下:
因此,给定一个匹配规则,加上?
后就变成了非贪婪匹配。
我们再来看这个正则表达式(\d??)(9*)
,注意表示匹配0个或1个数字,后面第二个?
表示非贪婪匹配,因此,给定字符串"9999"
,匹配到的两个子串分别是""
和"9999"
,因为对于\d?
来说,可以匹配1个9
,也可以匹配0个9
,但是因为后面的?
表示非贪婪匹配,它就会尽可能少的匹配,结果是匹配了0个9
。
正则表达式匹配默认使用贪婪匹配,可以使用?
表示对某一规则进行非贪婪匹配。
注意区分?
的含义:。