[ 永遠的UNIX::UNIX技術資料的寶庫 ]   GB | BIG5

首頁 > 編程技術 > Perl > 正文
Perl的經典用法:用正則表達式對文件進行操作
本文出自:www.zdnet.com.cn 作者:Nathan Torkington (2001-12-29 13:02:04)

一旦你有個包含了整個串的變量,你可以使用正則表達式,對整個文件進行操作, 而不是對文件中的某個塊進行操作。有兩個有用的正則表達式標記/s和/m。一般,Perl的 正則表達式對行進行處理,你可以這樣寫:

undef $/;

$line = ;

if ($line =~ /(b.*grass)$/) {

print "found $1\n";

}

如果把我們的文件填入如下內容: browngrass

bluegrass

則輸出為:

found bluegrass

它沒有找到“browngrass”,這是因為$ 僅在串尾尋找其匹配, (或者在串結束 前的一行)。如果在包含很多行的串中,用"^" 和"$"來匹配,, 我們可以使用 /m ("multiline") 選項:

if ($line =~ /(b.*grass)$/m) {}

現在程序會把如下的信息輸出:

found browngrass

類似地,句點可以匹配除了換行符之外的所有字符:

while () {

if (/19(.*)$/) {

if ($1 < 20) {

$year = 2000+$1;

} else {

$year = 1900+$1;

}

}

}

如果我們從文件中讀入“1981”,$_ 將包含“1981\n”。正則表達式中的句點 匹配“8”和“1”, 而不匹配“\n”。這裡正需要這樣做,因為換行符不是日期的組成部分。

對一個包含很多行的串,我們也許要提取其中的大的塊,這些塊可能會跨越行分隔符。 在這種情況下,我們可以使用 /s 選項,並用句點來匹配除了換行符以外的所有字符。

if (m{(.*?)}s) {

print "Found bold text: $1\n";

}

此處,我用了{}來表示正則表達式的起始和結束,而不用斜槓,所以,我就可以 告訴 Perl我正在匹配,起始字符為"m",結束字符為"s"。你 可以把/s 和/m 選項組合使用:

if (m{^(.*?)}sm) {

# ...

}

總結

有兩種方法打開文件:open()函數的特點是快速簡捷,而sysopen()函數功能強 大而復雜。通過 操作符,可以讀入一個記錄,$/ 變量可以讓你控制記 錄是什。如果你打算把很多行的內容讀入到一個串中,不要使用忘記/s和/m 這兩 個正則表達式標記。


(http://www.fanqiang.com)
    進入【UNIX論壇

相關文章
Perl的經典用法:用正則表達式對文件進行操作 (2001-12-29 13:02:04)
Perl的經典用法:讀入段落 (2001-12-29 13:01:25)
Perl的經典用法:讀入多個記錄 (2001-12-29 13:00:49)
Perl的經典用法:讀入單個記錄 (2001-12-29 13:00:27)
Perl的經典用法:用Sysopen()進行更多的控制 (2001-12-29 13:00:00)
Perl的經典用法:用Open()函數打開文件 (2001-12-29 12:58:44)
 

★  樊強制作 歡迎分享  ★