一世贪欢的私域

正则表达式的简单使用

3

2023-07-27

正则表达式的简单使用

介绍

正则表达式是一种强大且灵活的文本模式匹配工具，它用于在文本中查找、匹配和替换符合特定模式的字符串。无论您是在编程、文本处理还是数据分析中，正则表达式都是一种非常有用的工具。

简单使用

字符匹配

正则表达式的最基本部分是字符匹配。您可以直接使用普通字符来进行匹配，例如：

a：匹配字符串中的字母 "a"。
123：匹配字符串中的连续 "123"。
Hello：匹配字符串中的 "Hello"。

元字符和转义字符：

除了普通字符，正则表达式还包含元字符和转义字符。元字符是具有特殊含义的字符，例如：

.：匹配任意一个字符（除了换行符）。
\d：匹配任意一个数字，等同于 [0-9]。
\w：匹配任意一个单词字符，包括字母、数字和下划线，等同于 [a-zA-Z0-9_]。
\s：匹配任意一个空白字符，包括空格、制表符和换行符。

重复符号：

使用重复符号可以指定一个模式出现的次数，例如：

*：匹配前一个模式零次或多次。
+：匹配前一个模式一次或多次。
?：匹配前一个模式零次或一次。
{n}：匹配前一个模式恰好 n 次。
{n, m}：匹配前一个模式至少 n 次，最多 m 次。

字符类和反义：

字符类用方括号 [ ] 来定义，它可以匹配其中任意一个字符，例如：

[aeiou]：匹配任意一个元音字母。
[0-9]：匹配任意一个数字。
反义用 [^ ] 来定义，它匹配除了方括号内定义的字符之外的任意一个字符。
[^aeiou]：匹配除了元音字母之外的任意一个字符。

位置匹配：

位置匹配是一种特殊的匹配，用来匹配字符串的位置而不是具体的字符。常见的位置匹配有：

^：匹配字符串的开头。
：匹配字符串的结尾。
\b：匹配单词的边界。

分组和引用：

使用小括号 ( ) 可以将一组模式组合成一个单元，例如：

(ab)+：匹配 "ab" 重复一次或多次，如 "ab", "abab", "ababab" 等。

分组还可以用于捕获，以便在后续使用引用 \1, \2, 等等。

选择符：

使用竖线 | 可以实现模式的选择，例如：

cat|dog：匹配 "cat" 或 "dog"。

修饰符：

修饰符在正则表达式中用来改变匹配行为，例如：

i：不区分大小写匹配。
g：全局匹配，而不是仅匹配第一个。
m：多行匹配，使 ^ 和分别匹配行的开头和结尾。

0
0

计算机编码

python中dict转换为json