Learn Regex

本文距离上次更新已过去 0 天,部分内容可能已经过时,请注意甄别。
- 什么是正则表达式?
正则表达式是一组由字母和符号组成的特殊文本,它可以用来从文本中找出满足你想要的格式的句子。
1. 基本匹配
正则表达式其实就是在执行搜索时的格式,它由一些字母和数字组合而成。 例如:一个正则表达式the
,它表示一个规则:由字母t
开始,接着是h
,再接着是e
。
eg:"the" => The fat cat sat on the mat.
2. 元字符
正则表达式主要依赖于元字符。 元字符不代表他们本身的字面意思,他们都有特殊的含义。一些元字符写在方括号中的时候有一些特殊的意思。以下是一些元字符的介绍:
元字符 | 描述 |
---|---|
. | 句号匹配任意单个字符除了换行符 |
[ ] | 字符种类, 匹配方括号内的任意字符。 |
[^ ] | 否定的字符种类, 匹配除了方括号里的任意字符 |
* | 匹配>=0个重复的在*号之前的字符 |
+ | 匹配>=1个重复的+号前的字符 |
{n,m} | 匹配num个大括号之前的字符或字符集 (n <= num <= m). |
(xyz) | 字符集,匹配与 xyz 完全相等的字符串. |
| | 或运算符,匹配符号前或后的字符. |
\ | 转义字符,用于匹配一些保留的字符 [ ] ( ) { } . * + ? ^ $ \ | |
^ | 从开始行开始匹配. |
$ | 从末端开始匹配. |
2.1 点运算符
.
是元字符中最简单的例子, .
匹配任意单个字符,但不匹配换行符.
例如,表达式.ar
匹配一个任意字符后面跟着是a
和r
的字符串。
“.ar
“ => The car
par
ked in the gar
age.
2.2 字符集
字符集也叫做字符类. 方括号用来指定一个字符集. 在方括号中使用连字符来指定字符集的范围. 在方括号中的字符集 不关心顺序 .
例如,表达式[Tt]he
匹配 the
和 The
"[Tt]he"
=> The
car parked in the
garage.
2.2.1 否定字符集
一般来说^
表示一个字符串的开头,但它用在一个方括号的开头的时候,它表示这个字符集是否定的 例如,表达式[^c]ar
匹配一个后面跟着ar
的除了c
的任意字符。
"[^c]ar"
=> The car par
ked in the gar
age.
2.3 重复次数
后面跟着元字符 +
,*
or ?
的,用来指定匹配子模式的次数 这些元字符在不同的情况下有着不同的意思.
测试!!!!!!!!!