正则表达式速查表：从零到一精通文本匹配逻辑

正则表达式 (Regular Expression) 是一种极其强大的文本处理引擎，被广泛应用于 数据清洗、表单校验、日志分析、字符串转换 等核心开发场景。无论你是使用 Python 进行数据科学研究，还是使用 JavaScript 构建前端应用，熟练掌握正则都是必修课。

正则的语法高度紧凑，字符密度极大。对于不经常编写正则的开发者来说，记住诸如 (?!...) (负向先行断言) 或 \b (单词边界) 这种冷门但强大的符号非常困难。本工具通过 分类呈现、实时搜索、一键复制 ，将复杂的文档简化为指尖上的参考，解决以下具体问题：

元字符与转义： . 匹配万物，但如果你想匹配真正的“点”，必须写成 \. 。本表详细列出了所有需要转义的特殊字符，避免你的正则因语法错误而失效。

量词的贪婪与节制： * 和 + 默认是贪婪的。如果你在提取 HTML 标签时发现它匹配了整个页面，那是因为你没用非贪婪模式 *? 。通过速查表，你可以清晰对比两者的区别。

零宽断言的妙用： 想要匹配“后面跟着数字的单词”但又不想把数字包含在匹配结果中？你需要 正向先行断言 (?=\d) 。这是高级正则的精髓，本表提供了直观的描述和示例。

在实际开发中，我们经常需要处理特定格式的数据。通过本速查表，你可以一键获得：

Q: 什么是正则回溯 (Backtracking)？
A: 当正则引擎尝试多种匹配路径但失败时，它会退回到上一个决策点。如果路径呈指数级增长，会导致 CPU 占用率飙升（ReDoS 攻击）。编写正则时应尽量避免 (a+)+ 这种结构。

Q: 为什么 \w 在我的代码里匹配不到中文？
A: 标准 \w 仅匹配 [A-Za-z0-9_] 。在 JavaScript 中，如果需要支持 Unicode（包括中文），请开启 u 标志，并结合具体的 Unicode 属性。本表提供了相应的替代方案。