日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢(xún)
選擇下列產(chǎn)品馬上在線(xiàn)溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問(wèn)題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷(xiāo)解決方案
如何使用Java正則表達(dá)式匹配、替換HTML內(nèi)容

這篇文章主要講解了“如何使用Java正則表達(dá)式匹配、替換HTML內(nèi)容”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來(lái)研究和學(xué)習(xí)“如何使用Java正則表達(dá)式匹配、替換HTML內(nèi)容”吧!

創(chuàng)新互聯(lián)建站總部坐落于成都市區(qū),致力網(wǎng)站建設(shè)服務(wù)有成都網(wǎng)站建設(shè)、做網(wǎng)站、網(wǎng)絡(luò)營(yíng)銷(xiāo)策劃、網(wǎng)頁(yè)設(shè)計(jì)、網(wǎng)站維護(hù)、公眾號(hào)搭建、小程序制作、軟件開(kāi)發(fā)等為企業(yè)提供一整套的信息化建設(shè)解決方案。創(chuàng)造真正意義上的網(wǎng)站建設(shè),為互聯(lián)網(wǎng)品牌在互動(dòng)行銷(xiāo)領(lǐng)域創(chuàng)造價(jià)值而不懈努力!

曾經(jīng)了解過(guò)JavaScript的正則表達(dá)式,知道其功能的強(qiáng)大,對(duì)于處理文本比用普通的API處理不管從效率上還是從功能上都有很大的優(yōu)勢(shì)。今天項(xiàng)目要求用到Java的正則表達(dá)式,于是在網(wǎng)上Google,找到一個(gè)Jakarta ORO的庫(kù),聽(tīng)說(shuō)是Java中功能***大的正則表達(dá)式庫(kù),確實(shí)也如此,Sun公司的JDK里自帶的正則表達(dá)式功能是遠(yuǎn)遠(yuǎn)不如ORO庫(kù),從正則表達(dá)式的角度上看,其比普通的API處理文本是復(fù)雜很多。

但如果應(yīng)用得恰當(dāng)?shù)脑?huà),會(huì)提高工程的質(zhì)量,于是項(xiàng)目中就應(yīng)用了這個(gè)ORO庫(kù),把瀏覽器請(qǐng)求得到的HTML頁(yè)面進(jìn)行解釋替換實(shí)現(xiàn)一個(gè)代理采集信息的功能。感覺(jué)自己好像是在開(kāi)發(fā)軟件,不是在設(shè)計(jì)網(wǎng)頁(yè)。正則表達(dá)式有一個(gè)很好用的工具--RegexBuddy,應(yīng)用這個(gè)工具可以調(diào)度一個(gè)匹配你需要的正則表達(dá)式串,經(jīng)過(guò)幾番調(diào)度,把一些HTML標(biāo)簽的正則表達(dá)式匹配出來(lái)。


***:像網(wǎng)頁(yè)鏈接之間的內(nèi)容中[URL[絕對(duì)地址替換成相對(duì)地址,首先要查找匹配這個(gè)鏈接,查找匹配這個(gè)串的正則表達(dá)式串為

(<]\\s*){0,})href\\s*=\\s*(\"|'|)([^\\2\\s>]*)\\2((?:\\s*[^\\s>]){0,}\\s">\\s*a\\s+(?:[^\\s>]\\s*){0,})href\\s*=\\s*(\"|'|)([^\\2\\s>]*)\\2((?:\\s*[^\\s>]){0,}\\s *>)

  1. //查找匹配的代碼如下: 

  2.     String  patternStrs="(<\\s*a\\s+(?:[^\\s>]\\s*){0,})href\\s*=\\s*
    (\"|'|)([^\\2\\s>]*)\\2((?:\\s*[^\\s>]){0,}\\s *>)";  

  3.     PatternCompiler complier = new Perl5Compiler();  

  4.     PatternMatcher matcher = new Perl5Matcher();  

  5.  

  6.     Pattern patternForLink = complier.compile(patternStrs,  

  7.                                               Perl5Compiler.  

  8.                                               CASE_INSENSITIVE_MASK);  

  9.     PatternMatcherInput input = new PatternMatcherInput(htmlContent);  

  10.     while (matcher.contains(input, patternForLink)) {  

  11.       MatchResult match = matcher.getMatch();  

  12.       //處理匹配的結(jié)果,是要替換還是要其他處理 

  13.     }  

  14.  

第二:對(duì)其他的標(biāo)簽也類(lèi)似只要把匹配的字符串改一下為要匹配的標(biāo)簽就可以了。(如IMG標(biāo)簽)

(<\s*img\s+(?:[^\s>]\s*){0,})src\s*=\s*("|'|)([^\2\s>]*)\2((?:\s*[^\s>]){0,}\s*>),這樣就可以處理

的標(biāo)簽匹配,對(duì)其他的標(biāo)簽也一樣.

總結(jié):對(duì)于大量要處理的文本,建議還是用到正則表達(dá)式,而要處理的文本比較少時(shí),用普通的字符串API處理函數(shù)就足夠了。

感謝各位的閱讀,以上就是“如何使用Java正則表達(dá)式匹配、替換HTML內(nèi)容”的內(nèi)容了,經(jīng)過(guò)本文的學(xué)習(xí)后,相信大家對(duì)如何使用Java正則表達(dá)式匹配、替換HTML內(nèi)容這一問(wèn)題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!


文章標(biāo)題:如何使用Java正則表達(dá)式匹配、替換HTML內(nèi)容
文章出自:
http://www.dlmjj.cn/article/pgodgi.html