当前位置: 首页 > news >正文

Java中正则表达式使用方法

1. 正则表达式概述

正则表达式(Regular Expression,简称 Regex)是一种用于匹配字符串的模式工具。在 Java 中,正则表达式通过 java.util.regex 包实现,主要涉及以下两个类:

  • Pattern:表示一个编译好的正则表达式模式。
  • Matcher:用于在字符串中查找与模式匹配的内容。

正则表达式可以用来验证格式、提取信息或替换文本,例如检查邮箱地址是否合法、提取字符串中的数字、按规则分割字符串等。

2. 正则表达式符号速查表

以下是正则表达式的常用符号和元字符(以正则表达式的原始形式列出)。在 Java 代码中,符号如 \d 需要写成 \\d,因为 Java 字符串需要转义反斜杠。

2.1 基本字符和元字符

符号含义示例不匹配示例
\d匹配一个数字(0-9)5a
\D匹配一个非数字a5
\w匹配字母、数字或下划线a3_!
\W匹配非字母、数字或下划线!@a
\s匹配一个空白字符(如空格、制表符、换行符)\na
\S匹配一个非空白字符a1空白字符
.匹配任意字符(除换行符外)a1.\n

2.2 字符集合

字符集合用方括号 [] 表示,用于匹配单个字符。以下是详细说明:

符号含义示例不匹配示例
[abc]匹配单个字符,且该字符是 abcabcab(多字符)、d
[^abc]匹配单个字符,且该字符不是 abcd1abc
[a-z]匹配单个小写字母(a 到 z)bA1
[A-Z]匹配单个大写字母(A 到 Z)Ba1
[a-zA-Z]匹配单个字母(大小写均可)Ab1
[0-9]匹配单个数字(0 到 9)5a
[a-z&[def]]匹配单个字符,且该字符是 a 到 z 中且是 defdefab
[a-z&&[^bc]]匹配单个字符,且该字符是 a 到 z 但不是 bcadbc
[a-z&&[^m-p]]匹配单个字符,且该字符是 a 到 z 但不是 m 到 paqmn

说明[abc] 只匹配单个字符,不会匹配连续的字符串。例如:

  • 字符串 ab[abc] 会匹配 a(第一个字符),再匹配 b(第二个字符),但不能直接匹配整个 ab
  • 如果要匹配 ab,需要写成 ab(连续字符模式),而不是 [ab]

2.3 量词

量词用于指定匹配的次数:

符号含义示例不匹配示例
+匹配 1 次或多次\d+ 匹配 123空字符串
*匹配 0 次或多次\d* 匹配 12 或空
?匹配 0 次或 1 次\d? 匹配 1 或空12(多于 1 个)
{n}匹配正好 n 次\d{2} 匹配 121123
{n,}匹配至少 n 次\d{2,} 匹配 1231
{n,m}匹配 n 到 m 次\d{2,3} 匹配 1212311234

2.4 边界匹配

符号含义示例不匹配示例
^匹配字符串的开头^a 匹配 abc 的开头bac
$匹配字符串的结尾a$ 匹配 cba 的结尾abc
\b匹配单词边界\bword\b 匹配单独的 wordkeyword

3. 使用方法

Java 提供了两种主要方式来使用正则表达式:通过 PatternMatcher 类,或者直接使用 String 类的方法。

3.1 使用 PatternMatcher

步骤

  1. 使用 Pattern.compile() 创建正则表达式模式(注意转义)。
  2. 使用 Pattern.matcher() 创建一个匹配器。
  3. 使用 Matcher.find()Matcher.group() 查找并获取匹配结果。

示例代码:提取字符串中的所有数字,并展示字符集合的匹配。

import java.util.regex.Pattern;
import java.util.regex.Matcher;public class RegexDemo {public static void main(String[] args) {// 示例 1:提取数字String input = "Order: 123, Price: 456";Pattern pattern = Pattern.compile("\\d+"); // 正则表达式 \d+(匹配 1 个或多个数字)Matcher matcher = pattern.matcher(input);System.out.println("提取的数字:");while (matcher.find()) {System.out.println(matcher.group());}// 示例 2:字符集合 [abc] 的匹配String text = "ab";Pattern pattern2 = Pattern.compile("[abc]"); // 正则表达式 [abc](匹配单个 a、b 或 c)Matcher matcher2 = pattern2.matcher(text);System.out.println("\n字符集合 [abc] 匹配结果:");while (matcher2.find()) {System.out.println("匹配到的字符:" + matcher2.group());}}
}

运行结果

提取的数字:
123
456字符集合 [abc] 匹配结果:
匹配到的字符:a
匹配到的字符:b

说明:在字符串 ab 中,[abc] 每次只匹配一个字符,先匹配到 a,再匹配到 b,但它不会将 ab 作为一个整体匹配。

3.2 使用 String 类的方法

String 类提供了几种简便的方法:

  • matches():判断整个字符串是否完全匹配正则表达式。
    String text = "12345";
    boolean isNumber = text.matches("\\d+"); // 返回 true
    System.out.println("是否全为数字:" + isNumber);
    
  • replaceAll():替换所有匹配正则表达式的部分。
    String text = "abc123def456";
    String result = text.replaceAll("\\d+", "-"); // 结果:abc-def-
    System.out.println("替换数字后的结果:" + result);
    
  • split():按正则表达式分割字符串。
    String text = "a,b,c";
    String[] parts = text.split(","); // 结果:["a", "b", "c"]
    System.out.println("分割结果:" + java.util.Arrays.toString(parts));
    

4. 应用实例

4.1 验证邮箱地址

public class EmailValidation {public static void main(String[] args) {String email = "user@example.com";String emailPattern = "^[A-Za-z0-9+_.-]+@[A-Za-z0-9.-]+$";if (email.matches(emailPattern)) {System.out.println("邮箱格式正确:" + email);} else {System.out.println("邮箱格式错误:" + email);}}
}

运行结果

邮箱格式正确:user@example.com

4.2 验证手机号码

public class PhoneValidation {public static void main(String[] args) {String phone = "13812345678";String phonePattern = "^1[3-9]\\d{9}$";if (phone.matches(phonePattern)) {System.out.println("手机号码格式正确:" + phone);} else {System.out.println("手机号码格式错误:" + phone);}}
}

运行结果

手机号码格式正确:13812345678

4.3 提取单词

public class WordExtraction {public static void main(String[] args) {String input = "Hello world, this is a test";Pattern pattern = Pattern.compile("\\b\\w+\\b"); // 正则表达式 \b\w+\b(匹配单词)Matcher matcher = pattern.matcher(input);while (matcher.find()) {System.out.println("找到的单词:" + matcher.group());}}
}

运行结果

找到的单词:Hello
找到的单词:world
找到的单词:this
找到的单词:is
找到的单词:a
找到的单词:test

4.4 验证连续字符

如果需要匹配连续的字符(如 ab),不能使用 [ab],而是直接写成 ab

public class SequenceMatch {public static void main(String[] args) {String input = "cabd";Pattern pattern = Pattern.compile("ab"); // 正则表达式 ab(匹配连续的 ab)Matcher matcher = pattern.matcher(input);while (matcher.find()) {System.out.println("找到的连续字符:" + matcher.group());}}
}

运行结果

找到的连续字符:ab

5. 注意事项

  • 性能优化:避免在循环中重复调用 Pattern.compile(),建议将 Pattern 对象定义为静态变量。
  • 转义规则:正则表达式中的特殊字符(如 .+)需要转义,在 Java 中需要双重转义,例如正则表达式 \. 要写成 \\.

相关文章:

  • docker 配置代理
  • js 的call 和apply方法用处
  • Python - 爬虫-网页解析数据-库lxml(支持XPath)
  • 真.从“零”搞 VSCode+STM32CubeMx+C <1>构建
  • 明远智睿2351开发板:重塑嵌入式开发性价比新标杆
  • NC149KMP算法详解
  • 如何彻底卸载Android Studio?
  • 深度解析 LangChain、ReAct、ReROO 架构及其在 AI Agent 中的应用
  • node.js 实战——(Http 知识点学习)
  • EasyRTC音视频实时通话在线教育解决方案:打造沉浸式互动教学新体验
  • Oracle 11g RAC手动打补丁详细步骤
  • 240424 leetcode exercises II
  • 算法训练营第二天| 209.长度最小的子数组、59.螺旋矩阵II、区间和
  • Flink 消费 Kafka 数据流的最佳实践
  • 【激光雷达3D(7)】CenterPoint两阶段细化仅使用BEV特征;PV-RCNN两阶段细化使用体素特征;M3DETRTransformer统一多表征特征
  • 机器学习(7)——K均值聚类
  • 17.第二阶段x64游戏实战-人工遍历二叉树结构
  • 精益数据分析(20/126):解析经典数据分析框架,助力创业增长
  • Ollama工具调用(Tool Calls)业务应用案例
  • 各种各样的bug合集
  • 中越海警2025年第一次北部湾联合巡逻圆满结束
  • 华夏银行青岛分行另类处置不良债权,德州近百亩土地被神奇操作抵押贷款
  • 打破“内卷”与“焦虑”怪圈,在阅读中寻找松弛感
  • 印控克什米尔恐袭引爆印巴新一轮外交摩擦,地区安全风险骤增
  • 韩国称DeepSeek未经同意将用户数据传至境外,外交部回应
  • 看展览|深濑昌久:一位超现实主义摄影者的三种意象