3.正则表达式

作者: KaelQ | 来源:发表于2016-07-20 14:08 被阅读594次

1.普通字符

  • 就是普通的a-z,A-z,0-9等等字符。

2.元字符

  • 有一些特殊含义的字符。

每一个语言或平台都可能会有不同的元字符,具体情况具体分析

元字符 含义
. 匹配一个字符(除了换行符\n)
[] 匹配里面一个可选字符
^ 匹配词首
$ 匹配词尾

注:[a-z],[A-Z],[0-9]对应小写字符,大写字母,数字。

这是最基本的四个元字符,有了这四个,几乎所有的正则表达式都能写出来了。比如:
手机号码的正则表达式为:

[1][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9]
  • 但是这样写太不方便了,而且显的很蠢0.0,所以有更多的元字符诞生了。
元字符 含义
{n} 前面的字符重复n次
{n,m} 前面的字符重复从n次到m次
{n,} 前面的字符重复n次到无限次

这样,手机号码的正则表达式为:

[1][0-9]{10}
  • 但是这时候要对字符串'abc'和'ac'进行匹配,这时候正则表达式为:
a[b]{0,1}c

这样觉得又有点不划算,0到1还要用{},所以又有了新的元字符

元字符 含义
* {0,}
+ {1,}
? {0,1}

这样子上述正则表达式就可以很开心的写成:

ab?c

是不是感觉好很多呢?

然而新的问题来了,我想匹配一个不是abc三个字母的字母,正则应该是这样:

[d-z]

但是与我表达的意思就是毫无关系了,这个正则将否定变成了肯定,这时候引入一个新的元字符:

元字符 含义
[^] 不包含里面内容

上述正则就变成了

[^a-c]
  • 又来一个新问题,有个程序员矫情了,觉的输入[0-9],[A-Za-z0-9]就是浪费生命,于是又引入了新的元字符:
元字符 含义
\d [0-9]
\w [A-Za-z0-9]

这样手机号正则就可以更简便了:

[1]\d{10}
  • 最后一个问题来了,我想匹配java6中的java,并不想匹配java7中的java,该怎么办?哈哈,于是又引入了新的元字符:
元字符 含义
(?:pattern) 正向预查的正向匹配,等效于
(?=pattern) 正向预查的正向匹配,匹配后面跟着pattern的字符串
(?!pattern 正向预查的正向不匹配,匹配后面不跟着pattern的字符串
(?<=pattern) 反向预查的反向匹配,匹配前面是pattern的字符串
(?<!pattern) 反向预查的反向不匹配,匹配前面不是pattern的字符串

文本如下:

java6 java7

正则表达式如下:

java(?:6|7)
java(?=6)
java(?!6)

(?<=j)a
(?<!j)a

查找结果如下:

java6 java7
java(java6前的java)
java(java7前的java)

a a(java6和java7 j后面的a)
a a(java6和java7 v后面的a)
  • 哈哈,认为是最后一个了吧,我又发现了一个有用的东西,贪婪模式和非贪婪模式!这次没有新的元符号引入,但是主角是 ?,有了它就是非贪婪模式,没有它就是贪婪模式啦,具体如下~

文本:

hadkfaldafxxlxxjlkjasldfjaslkxxlovexxalfjlkxxyouxxkla

正则表达式如下:

xx.*xx
xx.*?xx

查找结果如下:

xxlxxjlkjasldfjaslkxxlovexxalfjlkxxyouxx
xxlxx xxlovexx xxyouxx

量词默认是贪婪模式,但是当?出现在量词后面时,量词变成了非贪婪模式,能认出自己人了,哈哈~

量词即{},包括?,+,*

3.总结速查表

元字符 含义
. 匹配一个字符(除了换行符\n)
[] 匹配里面一个可选字符
^ 匹配词首
$ 匹配词尾
{n} 前面的字符重复n次
{n,m} 前面的字符重复从n次到m次
{n,} 前面的字符重复n次到无限次
* {0,}
+ {1,}
? {0,1}
[^] 不包含里面内容
\d [0-9]
\w [A-Za-z0-9]
(?:pattern) 正向预查的正向匹配,等效于
(?=pattern) 正向预查的正向匹配,匹配后面跟着pattern的字符串
(?!pattern 正向预查的正向不匹配,匹配后面不跟着pattern的字符串
(?<=pattern) 反向预查的反向匹配,匹配前面是pattern的字符串
(?<!pattern) 反向预查的反向不匹配,匹配前面不是pattern的字符串
量词? 非贪婪模式

4.注意 (持续更新)

4.1 .不能匹配换行符\n

  • 使用.时不能匹配换行符,所以有时候会出现一些问题。
    python的解决方案如下:
import re
s='''xxI
xxabcxxlove
xxdefxxyouxx'''
a=re.findall('xx(.*?)xx',s)
b=re.findall('xx(.*?)xx',s,re.S)#使用re.S
print(a)
print(b)

结果为:

['abc', 'def']
['I\n', 'love\n', 'you']

5.问题

5.1 邮箱正则

  • 合法E-mail地址:
    1. 必须包含一个并且只有一个符号“@”
    2. 第一个字符不得是“@”或者“.”
    3. 不允许出现“@.”或者.@
    4. 结尾不得是字符“@”或者“.”
    5. 允许“@”前的字符中出现“+”
    6. 不允许“+”在最前面,或者“+@”
    7. @之后至少有一个.
^[^@\.].*[^\.\+]?@[^\.]?.*\..*[^@\.]$

5.2 手机号码正则

  • 合法手机号码正则:
    1、长度13位;
    2、以86的国家码打头;
    3、手机号码的每一位都是数字。
86[1]\d{10}

5.3 验证账号是否合法

  • 验证帐号是否合法
    验证规则:字母、数字、下划线组成,字母开头,4-16位。
[A-Za-z][\w_]{3,15}

相关文章

  • 正则表达式

    1.正则表达式特殊符号 2.grep命令与正则表达式 grep [options] 3.字符组匹配 pattern...

  • JS库函数~正则表达式及表单、ip验证实例

    本文内容: 1.什么是正则表达式? 2.正则表达式限定符、选择匹配符、字符匹配符 3.常用的正则表达式 4.创建R...

  • Day09 Js continue

    1. 数组 1.1 数组的构造 1.2数组的方法 2.String方法 3.正则表达式 3.1 正则表达式的构造 ...

  • Python正则表达式

    正则表达式是用来简洁表达一组字符串的表达式 1. 正则表达式的常用操作符 2. 经典正则表达式实例 3. Re库使...

  • 正则表达式

    正则表达式 1.正则表达式是一门独立的学科。 2.正则表达式是一种字符模型。专门做字符串格式匹配的。 3.正则表达...

  • 函数式编程进阶

    1.斐波那契序列 2.lambda函数 3.正则表达式

  • 3.正则表达式

    模式修正符 /i (忽略大小写)/g (全文查找出现的所有匹配字符)/m (多行查找)/gi(全文查找、忽略大小写...

  • 3.正则表达式

    1.普通字符 就是普通的a-z,A-z,0-9等等字符。 2.元字符 有一些特殊含义的字符。 每一个语言或平台都可...

  • 3.正则表达式

    正则表达式 什么叫正则表达式 preg_match 正则表达式基本语法 PCRE库函数中,正则匹配模式使用分隔符与...

  • day18-正则表达式

    1.正则表达式语法 代码示例 运行结果 2.正则表达式次数相关符号 代码示例 运行结果 3.分支和分组 1.|分支...

网友评论

本文标题:3.正则表达式

本文链接:https://www.haomeiwen.com/subject/ncpvjttx.html