在Java開發(fā)中,經(jīng)常需要從文本中提取特定格式的信息。正則表達(dá)式為此提供了一種高效的解決方案。本文將演示如何使用Java正則表達(dá)式從文本中提取目標(biāo)內(nèi)容,并附帶示例代碼。
假設(shè)我們需要從html代碼中提取所有以”www.”開頭,以”.com”或”.cn”結(jié)尾的網(wǎng)址。 以下示例文本將用于演示:
www.baidu.comwww.qq.comwww.aaa.cnwww.eee.cn
立即學(xué)習(xí)“Java免費(fèi)學(xué)習(xí)筆記(深入)”;
我們可以使用正則表達(dá)式www.w+.(com|cn)來匹配這些網(wǎng)址。 表達(dá)式含義如下:
- www.: 匹配字面量”www.”。
- w+: 匹配一個或多個字母數(shù)字字符(包括下劃線)。
- .: 匹配字面量”.”。
- (com|cn): 匹配”.com”或”.cn”。
以下Java代碼演示了如何使用該正則表達(dá)式:
String html = "<a>www.baidu.com</a><a>www.qq.com</a><a>www.aaa.cn</a>www.eee.cn"; String reg = "www.w+.(com|cn)"; Pattern pattern = Pattern.compile(reg, Pattern.CASE_INSENSITIVE); Matcher matcher = pattern.matcher(html); while (matcher.find()) { System.out.println(matcher.group()); }
這段代碼首先定義包含目標(biāo)網(wǎng)址的字符串html和正則表達(dá)式reg。 Pattern.compile()編譯正則表達(dá)式,matcher()創(chuàng)建匹配器對象。 循環(huán)調(diào)用matcher.find()查找所有匹配項,matcher.group()獲取匹配的字符串并打印輸出。
運(yùn)行代碼,輸出結(jié)果為:
www.baidu.com www.qq.com www.aaa.cn www.eee.cn
通過修改正則表達(dá)式,可以靈活地匹配各種文本模式,滿足不同的數(shù)據(jù)提取需求。 掌握J(rèn)ava正則表達(dá)式,將極大提升文本處理效率。
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
THE END