正则表达式速查表

全方位的 Regex 语法参考手册,包含基础元字符、高级断言及实战案例

🌙
广告展示区域 (AdSense Placeholder)
结果显示区域:点击下方的模式可自动填入此处进行测试
广告展示区域 (AdSense Placeholder)

正则表达式速查表:从零到一精通文本匹配逻辑

正则表达式 (Regular Expression) 是一种极其强大的文本处理引擎,被广泛应用于 数据清洗、表单校验、日志分析、字符串转换 等核心开发场景。无论你是使用 Python 进行数据科学研究,还是使用 JavaScript 构建前端应用,熟练掌握正则都是必修课。

1. 为什么要使用本速查表?

正则的语法高度紧凑,字符密度极大。对于不经常编写正则的开发者来说,记住诸如 (?!...) (负向先行断言) 或 \b (单词边界) 这种冷门但强大的符号非常困难。本工具通过 分类呈现、实时搜索、一键复制 ,将复杂的文档简化为指尖上的参考,解决以下具体问题:

2. 核心板块深度解析:解决你的理解难题

元字符与转义: . 匹配万物,但如果你想匹配真正的“点”,必须写成 \. 。本表详细列出了所有需要转义的特殊字符,避免你的正则因语法错误而失效。

量词的贪婪与节制: *+ 默认是贪婪的。如果你在提取 HTML 标签时发现它匹配了整个页面,那是因为你没用非贪婪模式 *? 。通过速查表,你可以清晰对比两者的区别。

零宽断言的妙用: 想要匹配“后面跟着数字的单词”但又不想把数字包含在匹配结果中?你需要 正向先行断言 (?=\d) 。这是高级正则的精髓,本表提供了直观的描述和示例。

3. 实战案例:如何快速校验复杂数据?

在实际开发中,我们经常需要处理特定格式的数据。通过本速查表,你可以一键获得:

常见问题解答 (FAQ)

Q: 什么是正则回溯 (Backtracking)?
A: 当正则引擎尝试多种匹配路径但失败时,它会退回到上一个决策点。如果路径呈指数级增长,会导致 CPU 占用率飙升(ReDoS 攻击)。编写正则时应尽量避免 (a+)+ 这种结构。

Q: 为什么 \w 在我的代码里匹配不到中文?
A: 标准 \w 仅匹配 [A-Za-z0-9_] 。在 JavaScript 中,如果需要支持 Unicode(包括中文),请开启 u 标志,并结合具体的 Unicode 属性。本表提供了相应的替代方案。

已复制到剪贴板