1. 分组(grouping)
- 括号(…)
1.2 匹配身份证
从1999年10月1日起,全国实行公民身份证号码制度,居民身份证编号由原15位升至18位
正则表达式 [1-9]\d{13,16}[0-9x]
首位是数字(0除外)
中间都是数字
末位是数字或x (15位末位没有x)
| 描述 | 正则 |
|---|---|
| 15位身份证号 | [1-9]\d{14} |
| 18位身份证号 | [1-9]\d{14}\d{2}[0-9x] |
| 正则表达式 | [1-9]\d{14}(\d{2}[0-9x])? |
| 正则 - 多选结构 | ^([1-9]\d{14}|[1-9]\d{14}\d{2}[0-9x])$ |
1.2 用括号改变量词的作用元素
- 用一个括号将可选出现的部分分组,再用量词?限定
-
ab+与(ab)+-
ab+受+限定的就只有b - 字符串ab重复出现一次以上,就应该写作(ab)+,此时(ab)成为一个整体,由量词+来限定
-
2. 多选结构
多选结构的形式是(…|…),在括号内以竖线|分隔开多个子表达式,这些子表达式也叫多选分支(option)
没有括号的多选结构
^ab|cd$ 表示“字符串开头的ab或者字符串结尾的cd”
因为竖线|的优先级很低,所以 ^ab|cd$ 其实是(^ab|cd
2.1 匹配数字
示例一:
\d{15}|\d{18} 匹配结果不准确,因为18 位数字也会匹配上前 15 位
示例二:
改为 \d{18}|\d{15} 或 ^(\d{15}|\d{18)$
image.png
2.2 非贪婪模式(量词 + ?)
示例一:
\d{15}\d{3}? 由于 \d{3} 表示三次,加问号非贪婪还是 3 次
示例二:
\d{15}(\d{3})? 在 \d{3} 整体后加问号,表示后面三位有或无
image.png
2.3 匹配IP地址
- IP 地址
(0~255).(0~255).(0~255).(0~255)
匹配一段数值在0~255之间的文本,正则 ([0-9]|[0-9]{2}|1[0-9][0-9]|2[0-4][0-9]|25[0-5])
| 情况分析 | 正则 |
|---|---|
| 如果是 1 位数,则对数字无限制 | [0-9] |
| 如果是 2 位数,则对数字无限制 | [0-9]{2} |
| 如果是 3 位数 | |
| 若第 1 位数字是 1,则第 2、3 位数字无限制 | 1[0-9][0-9] |
| 若第 1 位数字是 2 | |
| 第 2 位数字是 0~4,则第 3 位数字无限制 | 2[0-4][0-9] |
| 第 2 位数字是 5,则第 3 位数字只能是 0~5 | 25[0-5] |
3. 捕获分组(capturing group)
-
()分组捕获 -
(?:express)非分组捕获,括号只用于归组,把某个部分当成“单个元素”,不分配编号,后面不会再进行这部分的引用 -
?:express匹配但不获取结果 -
(\d{3})-(\d{5})分组提取数据,\d{3}-\d{5}只是匹配 -
(.mp4|.avi|.wmv)匹配多个,[Uu] 匹配单个字符
3.1 分组编号
- 分组编号只取决于开括号出现的顺序
- group(num), num表示对应括号的编号,括号分组的编号规则是从左向右计数,从1开始
- num的编号从1开始,
- group()方法,不给出参数num,默认就等于调用group(0)
不保存子组
在括号里面使用 ?: (?:...)
3.2 分组回溯引用
- 引用分组捕获的文本,不仅仅用于数据提取,也可以用于替换
- 分组引用的编号用
\number表示
示例1:
\1 表示匹配第一个分组
image.png
示例2:
正则 ((a)b)(c)\3,按左括号出现的顺序编号 \3 匹配 c
image.png
示例3:连续重复单词的匹配
image.png
image.png
3.3 分组引用替换
- 分组 一个括号是一组,可以把指定的组暂时先缓存起来 $1
# 数据:3334444-55555
regex: (\d{3})(\d{4})(-)
replace: ($1) $2 # $1 表示第一个表达式
# 结果:(333) 444455555
image.png
3.2 非捕获分组(non-capturing group)
-
(\w{2,})\1匹配重复数据 -
aba#ababcc-(?:(?:a)b)(c)\1
数据:aba#ababcab
示例1:((a)b)(c)\1
image.png
示例2:((?:a)b)(c)\1
image.png
示例3:(?:(a)b)(c)\1
image.png
示例4:(?:(?:a)b)(c)\1
数据 aba#ababcc
image.png






网友评论