本篇文章我們主要為大家介紹 AWK 是如何工作的。
AWK 工作流程可分為三個部分:
- 讀輸入文件之前執(zhí)行的代碼段(由BEGIN關(guān)鍵字標(biāo)識)。
- 主循環(huán)執(zhí)行輸入文件的代碼段。
- 讀輸入文件之后的代碼段(由END關(guān)鍵字標(biāo)識)。
命令結(jié)構(gòu):
awk 'BEGIN{ commands } pattern{ commands } END{ commands }'
下面的流程圖描述出了 AWK 的工作流程:
- 1、通過關(guān)鍵字 BEGIN 執(zhí)行 BEGIN 塊的內(nèi)容,即 BEGIN 后花括號 {} 的內(nèi)容。
- 2、完成 BEGIN 塊的執(zhí)行,開始執(zhí)行body塊。
- 3、讀入有 n 換行符分割的記錄。
- 4、將記錄按指定的域分隔符劃分域,填充域,$0 則表示所有域(即一行內(nèi)容),$1 表示第一個域,$n 表示第 n 個域。
- 5、依次執(zhí)行各 BODY 塊,pattern 部分匹配該行內(nèi)容成功后,才會執(zhí)行 awk-commands 的內(nèi)容。
- 6、循環(huán)讀取并執(zhí)行各行直到文件結(jié)束,完成body塊執(zhí)行。
- 7、開始 END 塊執(zhí)行,END 塊可以輸出最終結(jié)果。
開始塊(BEGIN)
開始塊的語法格式如下:
BEGIN {awk-commands}
開始塊就是在程序啟動的時候執(zhí)行的代碼部分,并且它在整個過程中只執(zhí)行一次。
一般情況下,我們可以在開始塊中初始化一些變量。
BEGIN 是 AWK 的關(guān)鍵字,因此它必須是大寫的。
注意:開始塊部分是可選的,你的程序可以沒有開始塊部分。
主體塊(BODY)
主體部分的語法格式如下:
/pattern/ {awk-commands}
對于每一個輸入的行都會執(zhí)行一次主體部分的命令。
默認(rèn)情況下,對于輸入的每一行,AWK 都會執(zhí)行命令。但是,我們可以將其限定在指定的模式中。
注意:在主體塊部分沒有關(guān)鍵字存在。
結(jié)束塊(END)
結(jié)束塊的語法格式如下:
END {awk-commands}
結(jié)束塊是在程序結(jié)束時執(zhí)行的代碼。 END 也是 AWK 的關(guān)鍵字,它也必須大寫。 與開始塊相似,結(jié)束塊也是可選的。
實例
先創(chuàng)建一個名為 marks.txt 的文件。其中包括序列號、學(xué)生名字、課程名稱與所得分?jǐn)?shù)。
1) 張三 語文 80 2) 李四 數(shù)學(xué) 90 3) 王五 英語 87
接下來,我們將使用 AWK 腳本來顯示輸出文件中的內(nèi)容,同時輸出表頭信息。
$ awk 'BEGIN{printf "序號t名字t課程t分?jǐn)?shù)n"} {print}' marks.txt
執(zhí)行以上命令,輸出結(jié)果如下:
序號 名字 課程 分?jǐn)?shù) 1) 張三 語文 80 2) 李四 數(shù)學(xué) 90 3) 王五 英語 87
程序開始執(zhí)行時,AWK 在開始塊中輸出表頭信息。在主體塊中,AWK 每讀入一行就將讀入的內(nèi)容輸出至標(biāo)準(zhǔn)輸出流中,一直到整個文件被全部讀入為止。