15. 负向零宽断言
匹配包含
后面不是字母u的字母q
的单词
。但是如果多做测试(或者你思维足够敏锐,直接就观察出来了),你会发现,如果q出现在单词的结尾的话,像Iraq,Benq,这个表达式就会出错。这是因为[^u]
总要匹配一个字符,所以如果q是单词的最后一个字符的话,后面的[^u]
将会匹配q后面的单词分隔符(可能是空格,或者是句号或其它的什么),后面的\w*\b
将会匹配下一个单词,于是\b\w*q[^u]\w*\b
就能匹配整个Iraq fighting
。负向零宽断言能解决这样的问题,因为它只匹配一个位置,并不消费任何字符。现在,我们可以这样来解决这个问题:\b\w*q(?!u)\w*\b
。
同理,我们可以用(?<!exp)
,零宽度负回顾后发断言来断言此位置的前面不能匹配表达式exp
:(?<![a-z])\d{7}
匹配前面不是小写字母的七位数字
。