Learn Regex
本文距离上次更新已过去 0 天,部分内容可能已经过时,请注意甄别。
- 什么是正则表达式?
正则表达式是一组由字母和符号组成的特殊文本,它可以用来从文本中找出满足你想要的格式的句子。
1. 基本匹配
正则表达式其实就是在执行搜索时的格式,它由一些字母和数字组合而成。 例如:一个正则表达式the,它表示一个规则:由字母t开始,接着是h,再接着是e。
eg:"the" => The fat cat sat on the mat.
2. 元字符
正则表达式主要依赖于元字符。 元字符不代表他们本身的字面意思,他们都有特殊的含义。一些元字符写在方括号中的时候有一些特殊的意思。以下是一些元字符的介绍:
| 元字符 | 描述 |
|---|---|
| . | 句号匹配任意单个字符除了换行符 |
| [ ] | 字符种类, 匹配方括号内的任意字符。 |
| [^ ] | 否定的字符种类, 匹配除了方括号里的任意字符 |
| * | 匹配>=0个重复的在*号之前的字符 |
| + | 匹配>=1个重复的+号前的字符 |
| {n,m} | 匹配num个大括号之前的字符或字符集 (n <= num <= m). |
| (xyz) | 字符集,匹配与 xyz 完全相等的字符串. |
| | | 或运算符,匹配符号前或后的字符. |
| \ | 转义字符,用于匹配一些保留的字符 [ ] ( ) { } . * + ? ^ $ \ | |
| ^ | 从开始行开始匹配. |
| $ | 从末端开始匹配. |
2.1 点运算符
.是元字符中最简单的例子, .匹配任意单个字符,但不匹配换行符.
例如,表达式.ar匹配一个任意字符后面跟着是a和r的字符串。
“.ar“ => The car parked in the garage.
2.2 字符集
字符集也叫做字符类. 方括号用来指定一个字符集. 在方括号中使用连字符来指定字符集的范围. 在方括号中的字符集 不关心顺序 .
例如,表达式[Tt]he 匹配 the 和 The
"[Tt]he" => The car parked in the garage.
2.2.1 否定字符集
一般来说^表示一个字符串的开头,但它用在一个方括号的开头的时候,它表示这个字符集是否定的 例如,表达式[^c]ar 匹配一个后面跟着ar的除了c的任意字符。
"[^c]ar" => The car parked in the garage.
2.3 重复次数
后面跟着元字符 +,* or ? 的,用来指定匹配子模式的次数 这些元字符在不同的情况下有着不同的意思.
测试!!!!!!!!!