当前位置：首页 > 其他教程 >

在Java程序中如何匹配正则表达式所匹配的结果?

GG网络技术分享 2025-03-18 16:15 0

问题描述：

例如我写了一个正则,可以匹配百度上面所有的a标签

    public static void main(String[] args)
{
String baiduHtml = getUrlString();
System.out.println(baiduHtml);
Pattern pattern = Pattern.compile(\"<a(.*?)>(.*?)</a>\");  
Matcher matcher = pattern.matcher(baiduHtml);  
if (matcher.find()) {   
System.out.println(matcher.group());
}
}

输出结果

 <a href=http://news.baidu.com name=tj_trnews class=mnav>新闻</a>

网友观点：

对于这类xml格式，最好不用正则匹配，处理会很麻烦
可以用xml类库来解析
http://www.ibm.com/developerworks/cn/xml/dm-1208gub/

一般处理xml不会用正则,而是xpath

可以用matcher，参考
http://blog.csdn.net/debugingstudy/article/details/12720087

正则表达式分组命名捕获 (?(.*?))
http://blog.csdn.net/su1216/article/details/49407381

正则表达式分组命名捕获

http://blog.csdn.net/su1216/article/details/49407381

String s = \\\"2015-10-26\\\";

Pattern p = Pattern.compile(\\\"(?\\d{4})-(?\\d{2})-(?\\d{2})\\\");

Matcher m = p.matcher(s);

if (m.find()) {

System.out.println(\\\"year: \\\" + m.group(\\\"year\\\")); //年

System.out.println(\\\"month: \\\" + m.group(\\\"month\\\")); //月

System.out.println(\\\"day: \\\" + m.group(\\\"day\\\")); //日

System.out.println(\\\"year: \\\" + m.group(1)); //第一组  
System.out.println(\\\"month: \\\" + m.group(2)); //第二组  
System.out.println(\\\"day: \\\" + m.group(3)); //第三组

}

Java正则表达式详细解析

元字符

正则表达式使用一些特定的元字符来检索、匹配和替换符合规则的字符串
元字符：普通字符、标准字符、限定字符（量词）、定位字符（边界字符）

正则表达式引擎

正则表达式是一个用正则符号写出来的公式

程序对正则表达式进行语法分析，建立语法分析树
再根据语法分析树结合正则表达式引擎生成执行程序（状态机），用于字符匹配
正则表达式引擎是一套核心算法，用于建立状态机
小结
正则表达式 => 语法分析树
语法分析树 + 正则表达引擎 => 状态机 => 用于字符匹配

目前实现正则表达式引擎的方式有两种

DFA自动机（Deterministic Finite Automaton，确定有限状态自动机）
NFA自动机（Nondeterministic Finite Automaton，非确定有限状态自动机）

DFA自动机的构造代价远大于NFA自动机，但DFA自动机的执行效率高于NFA自动机

假设一个字符串的长度为n，如果采用DFA自动机作为正则表达式引擎，则匹配的时间复杂度为O(n)
如果采用NFA自动机作为正则表达式引擎，NFA自动机在匹配过程中存在大量的分支和回溯，假设NFA的状态数为s，
则匹配的时间复杂度为O(ns)

NFA自动机的优势是支持更多高级功能，但都是基于子表达式独立进行匹配

因此在编程语言里，使用的正则表达式库都是基于NFA自动机实现的

NFA自动机

匹配过程

NFA自动机会读取正则表达式的每一个字符，拿去和目标字符串匹配
匹配成功则换正则表达式的下一个字符，反之就继续就和目标字符串的下一个字符进行匹配

标签：

上一篇：正则表达式排除标题标记之间的内容
下一篇： WordPress投稿后自动邮件通知管理员, 当网站有文章发表时邮件通知管理员

其他教程

在Java程序中如何匹配正则表达式所匹配的结果?

问题描述：

网友观点：

Java正则表达式详细解析

元字符

正则表达式引擎

NFA自动机

为您推荐

提交需求或反馈

产品中心

H5单页免费源码

免费源码

联系我们

QQ在线客服

关注微信