正则表达式性能优化方法（高效正则表达式书写）

站长资源 2024/12/28 佚名

3 1538 3

白云岛资源网 Design By www.pvray.com

这里说的正则表达式优化，主要是针对目前常用的NFA模式正则表达式，详细可以参考：正则表达式匹配解析过程探讨分析（正则表达式匹配原理）。从上面例子，我们可以推断出，影响NFA类正则表达式（常见语言：GNU Emacs,Java,ergp,less,more,.NET语言,
PCRE library,Perl,PHP,Python,Ruby,sed,vi )其实主要是它的“回溯”，减少“回溯”次数（减少循环查找同一个字符次数），是提高性能的主要方法。我们来看个例子：

源字符串：<script type="text/javascript">adsfadfsdasfsdafdsfsadfsa</script>

匹配要求，匹配<script….>….</script>标签里面所有内容，包括改标签

常见写法(1)，因为<script后面可能出现字符、空白、特殊符号等，还有标签里面也可能出现各种js代码。我们简单方法是：

正则表达式：<script.*"_blank" href="https://www.jb51.net/softjc/466074.html">regexBuddy)

总共花费115步，回溯了：48次。因为我们使用”.”字符，匹配默认情况下除了\n之外所有字符。
方法（2），我们分析特点发现，<script…>后面，应该是除了”>”之外都可以字符，然后一对<script>标签里面js内容。可以定义为除了”<”之外。（这里面我只是举例说明优化方法，实际网页中script标签里面，常见都会出现有”<”字符了）

正则表达式：<script[^"" src="/UploadFiles/2021-04-02/20160604212535.png">

19步，0次回溯！，步骤只有原先的15%左右，性能几倍的提升了！
从上面我们看到，不同正则表达式，对通用字符配平，性能相差会很大。减少“回溯”是最好的方法，减少回溯其中最主要的方法是：”用最小范围的元字符，尽量避免用过大的元字符！”。一般规律如下：

1、使用正确的边界匹配器（^、$、\b、\B等），限定搜索字符串位置
2、使用具体的元字符、字符类（\d、\w、\s等），少用”.”字符
3、使用正确的量词（+、*、?、{n,m}），如果能够限定长度，匹配最佳
4、使用非捕获组、原子组，减少没有必要的字匹配捕获用(?:)

如：我想匹配一些英文字母，它后面接的是数字。如：abc1234,我可以写 “\w+\d+”，也可以写”[a-zA-Z]+\d+” ，其中第一个\w+会先匹配所有abc1234，然后回溯，匹配满足\d+格式。一共4步，而后面这个只需要2步，步骤减少一半了！好了，今天就先到这里，欢迎大家讨论、交流！

正则表达式性能优化

白云岛资源网 Design By www.pvray.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

白云岛资源网 Design By www.pvray.com

评论“正则表达式性能优化方法（高效正则表达式书写）”

暂无评论...

www.pvray.com 白云岛资源网

39,976影音资源

44,792技术资源

21,817软件资源

651,128站长资源

最新文章

群星《奔赴！万人现场第2期》[FLAC/分轨][5

2024/12/28

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》

2024/12/28

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》

2024/12/28

【古典音乐】詹姆斯·高威《季节》1993[WAV+

2024/12/28

贝拉芳蒂《卡里普索之王》SACD[WAV+CUE]

2024/12/28

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/12/28

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

正则表达式性能优化方法（高效正则表达式书写）

正则表达式、分组、子匹配（子模式）、非捕获子匹配（子模式）

JavaScript正则表达式验证代码(推荐)

评论“正则表达式性能优化方法（高效正则表达式书写）”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

友情链接

正则表达式性能优化方法（高效正则表达式书写）

正则表达式、分组、子匹配（子模式）、非捕获子匹配（子模式）

JavaScript正则表达式验证代码(推荐)

评论“正则表达式性能优化方法（高效正则表达式书写）”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存