[原创]Java正则表达式笔记总结

您所在的位置:网站首页 玫瑰的象征意义和内涵 [原创]Java正则表达式笔记总结

[原创]Java正则表达式笔记总结

2022-07-21 04:46| 来源: 网络整理| 查看: 265

Java正则表达式学习

目录         Java正则表达式学习         一、前言         二、学习资料         三、知识总结                 1.匹配规则                         (1)单个匹配规则                                 匹配任意字符                                 匹配数字                                 匹配常用符                                 匹配空格字符                                 匹配非数字                         (2)多个字符匹配规则                                 重复匹配                 2.复杂匹配规则                         (1)匹配开头和结尾                         (2)匹配指定范围                         (3)或规则匹配                         (4)使用括号                 3.分组匹配                 4.非贪婪匹配                 5.搜索和替换                         (1)分割字符串                         (2)搜索字符串                         (3)替换字符串         四、总结

一、前言

最近做一个web探测的项目,在项目中多处用到java正则表达式,今天将回顾的正则表达式做一个梳理,本文属于看完廖大佬笔记后的梳理,仅为平时参考,详细大家可以查看下面相关网址。

二、学习资料

java正则表达式的学习参考以下学习资料即可:

 

(1)菜鸟教程:菜鸟教程的正则基础基本讲的很可以了

 

(2)廖雪峰的官方网站——Java篇:廖大佬的Java教程还是讲的非常清晰的

三、知识总结1.匹配规则(1)单个匹配规则

image-20211030193530738

匹配任意字符

我们使用.匹配一个任意字符

 

例如:正则表达式a.c可以匹配"abc","a&c",a_c等,但是它并不能匹配"ac"、"a&&c",因为.匹配一个字符且仅限一个字符

匹配数字

我们使用\d匹配0-9这样的数字

 

例如:正则表达式00\d可以匹配"007","008",它不能匹配"00A","0077",因为\d仅限单个数字字符

匹配常用符

我们使用\w匹配一个字母、数字或下划线

 

例如:正则表达式java\w可以匹配"javac","java9","java_",它不能匹配"java#","java",因为\w不能匹配#,空格等字符

匹配空格字符

我们使用\s来匹配一个空格字符,注意空格字符不但包括空格,还包括tab字符

 

例如:正则表达式a\sc可以匹配a c,但是不能匹配"ac","abc"

匹配非数字

我们使用\D来匹配一个非数字

 

例如:00\D可以匹配"00A","00#"

 

同理我们使用\W来匹配非(字母、数字或下划线)

 

我们使用\S来匹配非空格的字符

(2)多个字符匹配规则

image-20211030195304714

重复匹配

我们结合单字符匹配+多字符匹配规则就可以匹配更多的字符

 

情况一:数字

12345678(1)数字+字母混搭 例如:"AB380" 使用修饰符 * 匹配任意个数字符,正则表达式:"AB\d*"(2)数字+字母混搭 例如:"AB380" 使用修饰符 + 匹配至少一个字符,正则表达式:"AB\d+" ,无法匹配"A",修饰符 + 可以匹配至少一个字符(3)数字+字符混搭 例如:"A" "A0" 使用修饰符 ? 可以匹配0个或一个字符,正则表达式:"A\d?",这里表示只匹配一个数字,"A33"就无法匹配了(4)数字+字符混搭 例如:"A380" 使用修饰符 {n} 可以精确指定n个字符   正则表达式:"A\d{3}" : 可以匹配"A389"                "A\d{3,}":可以匹配至少3个数字                "A\d{2,3}":可以匹配2-3个数字                "A\d{0,3}":可以最多匹配3个数字

情况二:电话号码

12字符串:"010-12345678" "0755-7654321"正则表达式:"\d{3,4}-\d{7,8}"2.复杂匹配规则

image-20211030202300638

(1)匹配开头和结尾

我们进行多行匹配时,用^表示开头,$表示结束

 

例如:正则表达式:^A\d{3}$可以匹配"A001"、"A380"

(2)匹配指定范围

我们用[]可以匹配范围内的字符,例如[123456789]或[1-9]可以匹配1-9

 

情况一:电话号码(规定一个7-8数字电话号码不能从0开头)

12字符串:"1234567"正则表达式:[1-9]\d{6,7} 理解为:范围限定+正则

情况二:任意6位十六进制数

12字符串:"1A2b3c"正则表达式:[0-9a-fA-F]{6}

我们在[]中使用^可以匹配不包含指定范围的字符

 

情况三:任意字符不包括数字

12字符串:"adhkADf"正则表示式:[^0-9]{7}

情况四:非负的整数和浮点数 或 非负浮点数

12[1-9]\d*\.?\d* 非负的整数和浮点数0\.\d*[1-9]    非负浮点数 (3)或规则匹配

我们用|连接两个正则是或规则

 

例如我们可以使用AB|CD来匹配AB或CD

(4)使用括号

我们用()将子规则括起来表示

 

例如 我们可以使用 learn\s(java|PHP|python)来匹配 learn java、learn PHP、learn python

3.分组匹配

前面我们已经讲了()的好处,假如我们需要取字符串中的特定位置值,就可以用到()了,这里我们先学习一下正则匹配式的流程

12345678910111213//样例代码String str = "";String reg = "";//设置正则匹配式Pattern Pattern pattern = Pattern.compile = Pattern.compile(reg,Pattern.CASE_INSENSITIV); //Pattern.CASE_INSENSITIV不区分大小//开始匹配Matcher matcher = pattern.matcher(str)//判断是否找到if(matcher.matches()){    String whole = matcher.group(0);     String area = matcher.group(1);     String tel = matcher.group(2);}

Matcher API:

 

索引方法:

 

image-20211030204923674

 

查找方法:

 

image-20211030204945659

 

替换方法:

 

image-20211030205006434

 

我们经常使用indexOf()和substring方法来进行字符串的提取,但是这样并没有通用性,我们可以使用()解决

123456789101112(1)我们先使用()来将提取的规则分组(2)正则表达式从左到右进行匹配(3)我们将匹配的结果group提取出来即可原理解析:(1)我们预设正则表达式为:(AB (CD) (E (F) ) 我们可以看出有四个组(AB (CD) (E (F) ) (CD)(E(F))(F)这里注意一下最外面的括号可有可无(2)取值 四个组匹配的结果分别存放在:m.group(0) m.group(1) m.group(2) m.group(3) 注意:我们可以使用`groupCount()`查看group长度

情况一:复杂字符串块提取

12345678910111213public static String[] RegCheck(String str,String reg){       Pattern p = Pattern.compile(reg);       Matcher m = p.matcher(str);        String[] result=new String[m.groupCount()];       if (m.matches()) {           for(int i=0;i


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3