下面給大家介紹的有關(guān)perl模式匹配參數(shù)的相關(guān)解析,你可能還不知道,下面我門一起來看看,希望對需要的朋友有所幫助! 一、簡介 模式指在字符串中尋找的特定序列的字符,由反斜線包含:/def/即模式def。其用法如結(jié)合函數(shù)split將字符串用某模式分成多個(gè)單詞:@array = split(/ /, $line);二、匹配操作符 =~、!~ =~檢驗(yàn)匹配是否成功:$result = $var =~ /abc/;若在該字符串中找到了該模式,則返回非零值,即true,不匹配則返回0,即false。!~則相反。 這兩個(gè)操作符適于條件控制中,如: if ($question =~ /please/) { print ("Thank you for being polite!\n"); } else { print ("That was not very polite!\n"); } 三、模式中的特殊字符 PERL在模式中支持一些特殊字符,可以起到一些特殊的作用。 1、字符 + +意味著一個(gè)或多個(gè)相同的字符,如:/de+f/指def、deef、deeeeef等。它盡量匹配盡可能多的相同字符,如/ab+/在字符串a(chǎn)bbc中匹配的將是abb,而不是ab。 當(dāng)一行中各單詞間的空格多于一個(gè)時(shí),可以如下分割: @array = split (/ +/, $line); 注:split函數(shù)每次遇到分割模式,總是開始一個(gè)新單詞,因此若$line以空格打頭,則@array的第一個(gè)元素即為空元素。但其可以區(qū)分是否真有單詞,如若$line中只有空格,則@array則為空數(shù)組。且上例中TAB字符被當(dāng)作一個(gè)單詞。注意修正。 2、字符 []和[^] []意味著匹配一組字符中的一個(gè),如/a[0123456789]c/將匹配a加數(shù)字加c的字符串。與+聯(lián)合使用例:/d[eE]+f/匹配def、dEf、deef、dEdf、dEEEeeeEef等。^表示除其之外的所有字符,如:/d[^deE]f/匹配d加非e字符加f的字符串。 3、字符 *和? 它們與+類似,區(qū)別在于*匹配0個(gè)、1個(gè)或多個(gè)相同字符,?匹配0個(gè)或1個(gè)該字符。如/de*f/匹配df、def、deeeef等;/de?f/匹配df或def。 4、轉(zhuǎn)義字符 如果你想在模式中包含通常被看作特殊意義的字符,須在其前加斜線"\"。如:/\*+/中\(zhòng)*即表示字符*,而不是上面提到的一個(gè)或多個(gè)字符的含義。斜線的表示為/\\/。在PERL5中可用字符對\Q和\E來轉(zhuǎn)義。 5、匹配任意字母或數(shù)字 上面提到模式/a[0123456789]c/匹配字母a加任意數(shù)字加c的字符串,另一種表示方法為:/a[0-9]c/,類似的,[a-z]表示任意小寫字母,[A-Z]表示任意大寫字母。任意大小寫字母、數(shù)字的表示方法為:/[0-9a-zA-Z]/。 6、錨模式
例1:/^def/只匹配以def打頭的字符串,/$def/只匹配以def結(jié)尾的字符串,結(jié)合起來的/^def$/只匹配字符串def(?)。\A和\Z在多行匹配時(shí)與^和$不同。
例:/[\da-z]/匹配任意數(shù)字或小寫字母。
14、指定模式定界符 缺省的,模式定界符為反斜線/,但其可用字母m自行指定,如: m!/u/jqpublic/perl/prog1! 等價(jià)于/\/u\/jqpublic\/perl\/prog1/ 注:當(dāng)用字母'作為定界符時(shí),不做變量替換;當(dāng)用特殊字符作為定界符時(shí),其轉(zhuǎn)義功能或特殊功能即不能使用。 15、模式次序變量 在模式匹配后調(diào)用重用部分的結(jié)果可用變量$n,全部的結(jié)果用變量$&。 $string = "This string contains the number 25.11."; $string =~ /-?(\d+)\.?(\d+)/; # 匹配結(jié)果為25.11 $integerpart = $1; # now $integerpart = 25 $decimalpart = $2; # now $decimalpart = 11 $totalpart = $&; # now totalpart = 25.11 四、模式匹配選項(xiàng)
1、匹配所有可能的模式(g選項(xiàng)) @matches = "balata" =~ /.a/g; # now @matches = ("ba", "la", "ta") 匹配的循環(huán): while ("balata" =~ /.a/g) { $match = $&; print ("$match\n"); } 結(jié)果為: ba la ta 當(dāng)使用了選項(xiàng)g時(shí),可用函數(shù)pos來控制下次匹配的偏移: $offset = pos($string); pos($string) = $newoffset; 2、忽略大小寫(i選項(xiàng))例 /de/i 匹配de,dE,De和DE。 3、將字符串看作多行(m選項(xiàng)) 在此情況下,^符號匹配字符串的起始或新的一行的起始;$符號匹配任意行的末尾。 4、只執(zhí)行一次變量替換例 $var = 1; $line = while ($var < 10) { $result = $line =~ /$var/o; $line = $var++; } 每次均匹配/1/。 5、將字符串看作單行例 /a.*bc/s匹配字符串a(chǎn)xxxxx \nxxxxbc,但/a.*bc/則不匹配該字符串。 6、在模式中忽略空格 /\d{2} ([\W]) \d{2} \1 \d{2}/x等價(jià)于/\d{2}([\W])\d{2}\1\d{2}/。 五、替換操作符 語法為s/pattern/replacement/,其效果為將字符串中與pattern匹配的部分換成replacement。如: $string = "abc123def"; $string =~ s/123/456/; # now $string = "abc456def"; 在替換部分可使用模式次序變量$n,如s/(\d+)/[$1]/,但在替換部分不支持模式的特殊字符,如{},*,+等,如s/abc/[def]/將把a(bǔ)bc替換為[def]。 替換操作符的選項(xiàng)如下表:
注:e選項(xiàng)把替換部分的字符串看作表達(dá)式,在替換之前先計(jì)算其值,如:
如$string =~ tr/\d/ /c;把所有非數(shù)字字符替換為空格。$string =~ tr/\t //d;刪除tab和空格; $string =~ tr/0-9/ /cs;把數(shù)字間的其它字符替換為一個(gè)空格。 |
免責(zé)聲明:本站部分文章和圖片均來自用戶投稿和網(wǎng)絡(luò)收集,旨在傳播知識,文章和圖片版權(quán)歸原作者及原出處所有,僅供學(xué)習(xí)與參考,請勿用于商業(yè)用途,如果損害了您的權(quán)利,請聯(lián)系我們及時(shí)修正或刪除。謝謝!
始終以前瞻性的眼光聚焦站長、創(chuàng)業(yè)、互聯(lián)網(wǎng)等領(lǐng)域,為您提供最新最全的互聯(lián)網(wǎng)資訊,幫助站長轉(zhuǎn)型升級,為互聯(lián)網(wǎng)創(chuàng)業(yè)者提供更加優(yōu)質(zhì)的創(chuàng)業(yè)信息和品牌營銷服務(wù),與站長一起進(jìn)步!讓互聯(lián)網(wǎng)創(chuàng)業(yè)者不再孤獨(dú)!
掃一掃,關(guān)注站長網(wǎng)微信