AWK 內置函數主要有以下幾種:
- 算數函數
- 字符串函數
- 時間函數
- 位操作函數
- 其它函數
算數函數
函數名 | 說明 | 實例 |
---|---|---|
atan2( y, x ) | 返回 y/x 的反正切。 |
$ awk 'BEGIN { PI = 3.14159265 x = -10 y = 10 result = atan2 (y,x) * 180 / PI; printf "The arc tangent for (x=%f, y=%f) is %f degreesn", x, y, result }' 輸出結果為: The arc tangent for (x=-10.000000, y=10.000000) is 135.000000 degrees |
cos( x ) | 返回 x 的余弦;x 是弧度。 |
$ awk 'BEGIN { PI = 3.14159265 param = 60 result = cos(param * PI / 180.0); printf "The cosine of %f degrees is %f.n", param, result }' 輸出結果為: The cosine of 60.000000 degrees is 0.500000. |
sin( x ) | 返回 x 的正弦;x 是弧度。 |
$ awk 'BEGIN { PI = 3.14159265 param = 30.0 result = sin(param * PI /180) printf "The sine of %f degrees is %f.n", param, result }' 輸出結果為: The sine of 30.000000 degrees is 0.500000. |
exp( x ) | 返回 x 冪函數。 |
$ awk 'BEGIN { param = 5 result = exp(param); printf "The exponential value of %f is %f.n", param, result }' 輸出結果為: The exponential value of 5.000000 is 148.413159. |
log( x ) | 返回 x 的自然對數。 |
$ awk 'BEGIN { param = 5.5 result = log (param) printf "log(%f) = %fn", param, result }' 輸出結果為: log(5.500000) = 1.704748 |
sqrt( x ) | 返回 x 平方根。 |
$ awk 'BEGIN { param = 1024.0 result = sqrt(param) printf "sqrt(%f) = %fn", param, result }' 輸出結果為: sqrt(1024.000000) = 32.000000 |
int( x ) | 返回 x 的截斷至整數的值。 |
$ awk 'BEGIN { param = 5.12345 result = int(param) print "Truncated value =", result }' 輸出結果為: Truncated value = 5 |
rand( ) | 返回任意數字 n,其中 0 <= n < 1。 |
$ awk 'BEGIN { print "Random num1 =" , rand() print "Random num2 =" , rand() print "Random num3 =" , rand() }' 輸出結果為: Random num1 = 0.237788 Random num2 = 0.291066 Random num3 = 0.845814 |
srand( [Expr] ) | 將 rand 函數的種子值設置為 Expr 參數的值,或如果省略 Expr 參數則使用某天的時間。返回先前的種子值。 |
$ awk 'BEGIN { param = 10 printf "srand() = %dn", srand() printf "srand(%d) = %dn", param, srand(param) }' 輸出結果為: srand() = 1 srand(10) = 1417959587 |
字符串函數
函數 | 說明 | 實例 |
---|---|---|
gsub( Ere, Repl, [ In ] ) | gsub 是全局替換( global substitution )的縮寫。除了正則表達式所有具體值被替代這點,它和 sub 函數完全一樣地執(zhí)行。 |
$ awk 'BEGIN { str = "Hello, World" print "String before replacement = " str gsub("World", "Jerry", str) print "String after replacement = " str }' 輸出結果為: String before replacement = Hello, World String after replacement = Hello, Jerry |
sub(regex,sub,string) | sub 函數執(zhí)行一次子串替換。它將第一次出現的子串用 regex 替換。第三個參數是可選的,默認為 $0。 |
$ awk 'BEGIN { str = "Hello, World" print "String before replacement = " str sub("World", "Jerry", str) print "String after replacement = " str }' 輸出結果為: String before replacement = Hello, World String after replacement = Hello, Jerry |
substr(str, start, l) | substr 函數返回 str 字符串中從第 start 個字符開始長度為 l 的子串。如果沒有指定 l 的值,返回 str 從第 start 個字符開始的后綴子串。 |
$ awk 'BEGIN { str = "Hello, World !!!" subs = substr(str, 1, 5) print "Substring = " subs }' 輸出結果為: Substring = Hello |
index( String1, String2 ) | 在由 String1 參數指定的字符串(其中有出現 String2 指定的參數)中,返回位置,從 1 開始編號。如果 String2 參數不在 String1 參數中出現,則返回 0(零)。 |
$ awk 'BEGIN { str = "One Two Three" subs = "Two" ret = index(str, subs) printf "Substring "%s" found at %d location.n", subs, ret }' 輸出結果為: Substring "Two" found at 5 location. |
length [(String)] | 返回 String 參數指定的字符串的長度(字符形式)。如果未給出 String 參數,則返回整個記錄的長度($0 記錄變量)。 |
$ awk 'BEGIN { str = "Hello, World !!!" print "Length = ", length(str) }' 輸出結果為: Substring "Two" found at 5 location. |
blength [(String)] | 返回 String 參數指定的字符串的長度(以字節(jié)為單位)。如果未給出 String 參數,則返回整個記錄的長度($0 記錄變量)。 | |
substr( String, M, [ N ] ) | 返回具有 N 參數指定的字符數量子串。子串從 String 參數指定的字符串取得,其字符以 M 參數指定的位置開始。M 參數指定為將 String 參數中的第一個字符作為編號 1。如果未指定 N 參數,則子串的長度將是 M 參數指定的位置到 String 參數的末尾 的長度。 |
$ awk 'BEGIN { str = "Hello, World !!!" subs = substr(str, 1, 5) print "Substring = " subs }' 輸出結果為: Substring = Hello |
match( String, Ere ) | 在 String 參數指定的字符串(Ere 參數指定的擴展正則表達式出現在其中)中返回位置(字符形式),從 1 開始編號,或如果 Ere 參數不出現,則返回 0(零)。RSTART 特殊變量設置為返回值。RLENGTH 特殊變量設置為匹配的字符串的長度,或如果未找到任何匹配,則設置為 -1(負一)。 |
$ awk 'BEGIN { str = "One Two Three" subs = "Two" ret = match(str, subs) printf "Substring "%s" found at %d location.n", subs, ret }' 輸出結果為: Substring "Two" found at 5 location. |
split( String, A, [Ere] ) | 將 String 參數指定的參數分割為數組元素 A[1], A[2], . . ., A[n],并返回 n 變量的值。此分隔可以通過 Ere 參數指定的擴展正則表達式進行,或用當前字段分隔符(FS 特殊變量)來進行(如果沒有給出 Ere 參數)。除非上下文指明特定的元素還應具有一個數字值,否則 A 數組中的元素用字符串值來創(chuàng)建。 |
$ awk 'BEGIN { str = "One,Two,Three,Four" split(str, arr, ",") print "Array contains following values" for (i in arr) { print arr[i] } }' 輸出結果為: Array contains following values One Two Three Four |
tolower( String ) | 返回 String 參數指定的字符串,字符串中每個大寫字符將更改為小寫。大寫和小寫的映射由當前語言環(huán)境的 LC_CTYPE 范疇定義。 |
$ awk 'BEGIN { str = "HELLO, WORLD !!!" print "Lowercase string = " tolower(str) }' 輸出結果為: Lowercase string = hello, world !!! |
toupper( String ) | 返回 String 參數指定的字符串,字符串中每個小寫字符將更改為大寫。大寫和小寫的映射由當前語言環(huán)境的 LC_CTYPE 范疇定義。 |
$ awk 'BEGIN { str = "hello, world !!!" print "Uppercase string = " toupper(str) }' 輸出結果為: Uppercase string = HELLO, WORLD !!! |
sprintf(Format, Expr, Expr, . . . ) | 根據 Format 參數指定的 printf 子例程格式字符串來格式化 Expr 參數指定的表達式并返回最后生成的字符串。 |
$ awk 'BEGIN { str = sprintf("%s", "Hello, World !!!") print str }' 輸出結果為: Hello, World !!! |
strtonum(str) | strtonum 將字符串 str 轉換為數值。 如果字符串以 0 開始,則將其當作十進制數;如果字符串以 0x 或 0X 開始,則將其當作十六進制數;否則,將其當作浮點數。 |
$ awk 'BEGIN { print "Decimal num = " strtonum("123") print "Octal num = " strtonum("0123") print "Hexadecimal num = " strtonum("0x123") }' 輸出結果為: Decimal num = 123 Octal num = 83 Hexadecimal num = 291 |
注:Ere 部分可以是正則表達式。
1、gsub、sub 使用
$ awk 'BEGIN{info="this is a test2012test!";gsub(/[0-9]+/,"||",info);print info}' this is a test||test!
2、查找字符串(index 使用)
使用了三元運算符: 表達式 ? 動作1 : 動作2
$ awk 'BEGIN{info="this is a test2012test!";print index(info,"11111")?"ok":"no found";}' no found $ awk 'BEGIN{info="this is a test2012test!";print index(info,"is")?"ok":"no found";}' ok $ awk 'BEGIN{info="this is a test2012test!";print index(info,"test")?"ok":"no found";}' ok
3、正則表達式匹配查找(match 使用)
$ awk 'BEGIN{info="this is a test2012test!";print match(info,/[0-9]+/)?"ok":"no found";}' ok
4、截取字符串(substr使用)
從第 4 個 字符開始,截取 10 個長度字符串。
$ awk 'BEGIN{info="this is a test2012test!";print substr(info,4,10);}' s is a tes
5、字符串分割(split使用)
$ awk 'BEGIN{info="this is a test";split(info,tA," ");print length(tA);for(k in tA){print k,tA[k];}}' 4 2 is 3 a 4 test 1 this
分割 info,將 info 字符串使用空格切分為動態(tài)數組 tA。注意 awk for …in 循環(huán),是一個無序的循環(huán)。 并不是從數組下標 1…n ,因此使用時候需要特別注意。
6、格式化字符串輸出(sprintf使用)
其中格式化字符串包括兩部分內容: 一部分是正常字符,這些字符將按原樣輸出; 另一部分是格式化規(guī)定字符, 以 % 開始, 后跟一個或幾個規(guī)定字符,用來確定輸出內容格式。 需要特別注意的是使用 printf 時默認是不會換行的,而 print 函數默認會在每行后面加上 n 換行符。
格式符 | 說明 |
---|---|
%d | 十進制有符號整數 |
%u | 十進制無符號整數 |
%f | 浮點數 |
%s | 字符串 |
%c | 單個字符 |
%p | 指針的值 |
%e | 指數形式的浮點數 |
%x | %X 無符號以十六進制表示的整數 |
%o | 無符號以八進制表示的整數 |
%g | 自動選擇合適的表示法 |
$ awk 'BEGIN{n1=124.113;n2=-1.224;n3=1.2345; printf("%.2f,%.2u,%.2g,%X,%on",n1,n2,n3,n1,n1);}' 124.11,4294967295,1.2,7C,174 $ awk 'BEGIN{n1=124.113;n2=-1.224;n3=1.2645; printf("%.2f,%.2u,%.2g,%X,%on",n1,n2,n3,n1,n1);}' 124.11,4294967295,1.3,7C,174
注:看上面的 n3 輸出值會發(fā)現,在使用 printf 處理時一個比較智能的功能是可以進行四舍五入保留小數點位的。
時間函數
函數名 | 說明 | 實例 |
---|---|---|
mktime( YYYY MM DD HH MM SS[ DST]) | 生成時間格式 |
$ awk 'BEGIN { print "Number of seconds since the Epoch = " mktime("2014 12 14 30 20 10") }' 輸出結果為: Number of seconds since the Epoch = 1418604610 |
strftime([format [, timestamp]]) | 格式化時間輸出,將時間戳轉為時間字符串 具體格式,見下表. |
$ awk 'BEGIN { print strftime("Time = %m/%d/%Y %H:%M:%S", systime()) }' 輸出結果為: Time = 12/14/2014 22:08:42 |
systime() | 得到時間戳,返回從1970年1月1日開始到當前時間(不計閏年)的整秒數 |
awk 'BEGIN{now=systime();print now}' 輸出結果為: 1343210982 |
strftime 日期和時間格式說明符:
序號 | 描述 |
---|---|
%a | 星期縮寫(Mon-Sun)。 |
%A | 星期全稱(Monday-Sunday)。 |
%b | 月份縮寫(Jan)。 |
%B | 月份全稱(January)。 |
%c | 本地日期與時間。 |
%C | 年份中的世紀部分,其值為年份整除100。 |
%d | 十進制日期(01-31) |
%D | 等價于 %m/%d/%y. |
%e | 日期,如果只有一位數字則用空格補齊 |
%F | 等價于 %Y-%m-%d,這也是 ISO 8601 標準日期格式。 |
%g | ISO8610 標準周所在的年份模除 100(00-99)。比如,1993 年 1 月 1 日屬于 1992 年的第 53 周。所以,雖然它是 1993 年第 1 天,但是其 ISO8601 標準周所在年份卻是 1992。同樣,盡管 1973 年 12 月 31 日屬于 1973 年但是它卻屬于 1994 年的第一周。所以 1973 年 12 月 31 日的 ISO8610 標準周所在的年是 1974 而不是 1973。 |
%G | ISO 標準周所在年份的全稱。 |
%h | 等價于 %b. |
%H | 用十進制表示的 24 小時格式的小時(00-23) |
%I | 用十進制表示的 12 小時格式的小時(00-12) |
%j | 一年中的第幾天(001-366) |
%m | 月份(01-12) |
%M | 分鐘數(00-59) |
%n | 換行符 (ASCII LF) |
%p | 十二進制表示法(AM/PM) |
%r | 十二進制表示法的時間(等價于 %I:%M:%S %p)。 |
%R | 等價于 %H:%M。 |
%S | 時間的秒數值(00-60) |
%t | 制表符 (tab) |
%T | 等價于 %H:%M:%S。 |
%u | 以數字表示的星期(1-7),1 表示星期一。 |
%U | 一年中的第幾個星期(第一個星期天作為第一周的開始),00-53 |
%V | 一年中的第幾個星期(第一個星期一作為第一周的開始),01-53。 |
%w | 以數字表示的星期(0-6),0表示星期日 。 |
%W | 十進制表示的一年中的第幾個星期(第一個星期一作為第一周的開始),00-53。 |
%x | 本地日期表示 |
%X | 本地時間表示 |
%y | 年份模除 100。 |
%Y | 十進制表示的完整年份。 |
%z | 時區(qū),表示格式為+HHMM(例如,格式要求生成的 RFC 822或者 RFC 1036 時間頭) |
%Z | 時區(qū)名稱或縮寫,如果時區(qū)待定則無輸出。 |
位操作函數
函數名 | 說明 | 實例 |
---|---|---|
and | 位與操作。 |
$ awk 'BEGIN { num1 = 10 num2 = 6 printf "(%d AND %d) = %dn", num1, num2, and(num1, num2) }' 輸出結果為: (10 AND 6) = 2 |
compl | 按位求補。 |
$ awk 'BEGIN { num1 = 10 printf "compl(%d) = %dn", num1, compl(num1) }' 輸出結果為: compl(10) = 9007199254740981 |
lshift | 左移位操作 |
$ awk 'BEGIN { num1 = 10 printf "lshift(%d) by 1 = %dn", num1, lshift(num1, 1) }' 輸出結果為: lshift(10) by 1 = 20 |
rshift | 右移位操作 |
$ awk 'BEGIN { num1 = 10 printf "rshift(%d) by 1 = %dn", num1, rshift(num1, 1) }' 輸出結果為: rshift(10) by 1 = 5 |
or | 按位或操作 |
$ awk 'BEGIN { num1 = 10 num2 = 6 printf "(%d OR %d) = %dn", num1, num2, or(num1, num2) }' 輸出結果為: (10 OR 6) = 14 |
xor | 按位異或操作 |
$ awk 'BEGIN { num1 = 10 num2 = 6 printf "(%d XOR %d) = %dn", num1, num2, xor(num1, num2) }' 輸出結果為: (10 bitwise xor 6) = 12 |
其他函數
函數名 | 說明 | 實例 |
---|---|---|
close(expr) | 關閉管道的文件 |
$ awk 'BEGIN { cmd = "tr [a-z] [A-Z]" print "hello, world !!!" |& cmd close(cmd, "to") cmd |& getline out print out; close(cmd); }' 輸出結果為: HELLO, WORLD !!!
|
delete | 用于從數組中刪除元素 |
$ awk 'BEGIN { arr[0] = "One" arr[1] = "Two" arr[2] = "Three" arr[3] = "Four" print "Array elements before delete operation:" for (i in arr) { print arr[i] } delete arr[0] delete arr[1] print "Array elements after delete operation:" for (i in arr) { print arr[i] } }' 輸出結果為: Array elements before delete operation: One Two Three Four Array elements after delete operation: Three Four |
exit | 終止腳本執(zhí)行,它可以接受可選的參數 expr 傳遞 AWK 返回狀態(tài)。 |
$ awk 'BEGIN { print "Hello, World !!!" exit 10 print "AWK never executes this statement." }' 輸出結果為: Hello, World !!! |
flush | 刷新打開文件或管道的緩沖區(qū) | |
getline | 讀入下一行 |
使用 getline 從文件 marks.txt 中讀入一行并輸出: $ awk '{getline; print $0}' marks.txt ,AWK 從文件 marks.txt 中讀入一行存儲到變量 0 中。在下一條語句中,我們使用 getline 讀入下一行。因此AWK讀入第二行并存儲到 0 中。最后,AWK 使用 print 輸出第二行的內容。這個過程一直到文件結束。 |
next | 停止處理當前記錄,并且進入到下一條記錄的處理過程。 |
當模式串匹配成功后程序并不執(zhí)行任何操作: $ awk '{if ($0 ~/Shyam/) next; print $0}' marks.txt |
nextfile | 停止處理當前文件,從下一個文件第一個記錄開始處理。 |
首先創(chuàng)建兩個文件。 file1.txt 內容如下: file1:str1 file1:str2 file1:str3 file1:str4 文件 file2.txt 內容如下: file2:str1 file2:str2 file2:str3 file2:str4 現在我們來測試 nextfile 函數。 $ awk '{ if ($0 ~ /file1:str2/) nextfile; print $0 }' file1.txt file2.txt 輸出結果為: file1:str1 file2:str1 file2:str2 file2:str3 file2:str4 |
return | 從用戶自定義的函數中返回值。請注意,如果沒有指定返回值,那么的返回值是未定義的。 |
創(chuàng)建文件 functions.awk,內容如下: function addition(num1, num2) { result = num1 + num2 return result } BEGIN { res = addition(10, 20) print "10 + 20 = " res } 執(zhí)行該文件: $ awk -f functions.awk 10 + 20 = 30 |
system | 執(zhí)行特定的命令然后返回其退出狀態(tài)。返回值為 0 表示命令執(zhí)行成功;非 0 表示命令執(zhí)行失敗。 |
$ awk 'BEGIN { ret = system("date"); print "Return value = " ret }' 輸出結果為: Sun Dec 21 23:16:07 IST 2014 Return value = 0 |