admin管理员组

文章数量:1579086

公众号

更多精彩内容、活动、程序猿的小故事,欢迎扫码关注公众号

概述

本篇介绍了正则表达式引擎
正则表达式的匹配模式
优化正则表达式的三种方式

口水记

在上篇中,提到了split方法,这个方法就用到了正则表达式,而正则表达式可能会引起回溯问题。

大量的回溯是会长时间占用CPU,从而带来非常大的系统性能开销。

正则表达式引擎

正则表达式引擎正则表达式是一个用正则符号写出的公式,程序对这个公式进行语法分析,建立一个语法分析树,再根据这个分析树结合正则表达式的引擎生成执行程序(这个执行程序我们把它称作状态机,也叫状态自动机),用于字符匹配。

而这里的正则表达式引擎就是一套核心算法,用于建立状态机。

目前实现正则表达式引擎的方式有两种:DFA 自动机(Deterministic Final Automaton 确定有限状态自动机)和 NFA 自动机(Non deterministic Finite Automa

本文标签: 性能日记正则表达式