欧美亚洲中文,在线国自产视频,欧洲一区在线观看视频,亚洲综合中文字幕在线观看

      1. <dfn id="rfwes"></dfn>
          <object id="rfwes"></object>
        1. 站長資訊網(wǎng)
          最全最豐富的資訊網(wǎng)站

          Grep(Regex)中的正則表達(dá)式

          grep是Linux中用于文本處理的最有用和功能最強(qiáng)大的命令之一。 grep在一個(gè)或多個(gè)輸入文件中搜索與正則表達(dá)式匹配的行,并將每條匹配的行寫入標(biāo)準(zhǔn)輸出。

          在本文中,我們將探討在grep的GNU版本中如何使用正則表達(dá)式的基礎(chǔ),大多數(shù)Linux操作系統(tǒng)默認(rèn)情況下都提供此功能。

          Grep正則表達(dá)式

          正則表達(dá)式或正則表達(dá)式是與一組字符串匹配的模式。模式由運(yùn)算符,構(gòu)造文字字符和元字符組成,它們具有特殊的含義。 GNU grep支持三種正則表達(dá)式語法,Basic,Extended和Perl兼容。

          最簡單的形式是,當(dāng)沒有給出正則表達(dá)式類型時(shí),grep會(huì)將搜索模式解釋為基本正則表達(dá)式。要將模式解釋為擴(kuò)展的正則表達(dá)式,請使用-E(或–extended-regexp)選項(xiàng)。

          在GNU的grep實(shí)現(xiàn)中,基本正則表達(dá)式和擴(kuò)展正則表達(dá)式語法之間沒有功能上的區(qū)別。唯一的區(qū)別是,在基本正則表達(dá)式中,元字符?,+,{,|,(和)被解釋為文字字符。為了在使用基本正則表達(dá)式時(shí)保持元字符的特殊含義,必須使用反斜杠()對(duì)字符進(jìn)行轉(zhuǎn)義。稍后我們將解釋這些和其他元字符的含義。

          通常,您應(yīng)始終將正則表達(dá)式括在單引號(hào)中,以避免shell解釋和擴(kuò)展元字符。

          文字匹配

          grep命令最基本的用法是在文件中搜索文字字符或一系列字符。例如,要在/ etc / passwd文件中顯示所有包含字符串“ bash”的行,您可以運(yùn)行以下命令:

          [linuxidc@localhost www.linuxidc.com]$ grep bash /etc/passwd

          輸出應(yīng)如下所示:

          root:x:0:0:root:/root:/bin/bash
          linuxidc:x:1000:1000:linuxidc:/home/linuxidc:/bin/bash

          Grep(Regex)中的正則表達(dá)式

          在此示例中,字符串“ bash”是由四個(gè)文字字符組成的基本正則表達(dá)式。 這告訴grep搜索帶有緊隨其后的“ a”,“ s”和“ h”的字符串“ b”。

          缺省情況下,grep命令區(qū)分大小寫。 這意味著將大寫和小寫字符視為不同的字符。 要在搜索時(shí)忽略大小寫,請使用-i選項(xiàng)(或–ignore-case)。

          請務(wù)必注意,grep會(huì)將搜索模式作為字符串而不是單詞來查找。 因此,如果您要搜索“ gnu”,則grep還將打印“ gnu”嵌入較大字詞(例如“ cygnus”或“ magnum”)的行。

          如果搜索字符串包含空格,則需要將其用單引號(hào)或雙引號(hào)引起來:

          $grep “Gnome Display Manager” /etc/passwd

          錨定Anchoring

          Anchoring是元字符,可讓您指定必須在該行中找到匹配項(xiàng)的位置。

          ^(脫字符號(hào))符號(hào)與一行開頭的空字符串匹配。 在以下示例中,僅當(dāng)字符串“ linux”出現(xiàn)在行的開頭時(shí)才匹配。

          $grep ‘^linux’ file.txt

          $(美元)符號(hào)與行首的空字符串匹配。 要查找以字符串“ linux”結(jié)尾的行,可以使用:

          $grep ‘linux$’ file.txt

          您還可以使用兩個(gè)錨點(diǎn)構(gòu)造一個(gè)正則表達(dá)式。 例如,要查找僅包含“ linux”的行,請運(yùn)行:

          $grep ‘^linux$’ file.txt

          另一個(gè)有用的示例是匹配所有空行的^ $模式。

          匹配單個(gè)字符

          .(點(diǎn))符號(hào)是與任何單個(gè)字符匹配的元字符。 例如,要匹配以“ kan”開頭,然后有兩個(gè)字符并以字符串“ roo”結(jié)尾的任何內(nèi)容,則可以使用以下模式:

          $grep ‘kan..roo’ file.txt

          括號(hào)表達(dá)式

          方括號(hào)表達(dá)式允許將一組字符括在方括號(hào)[]中來匹配一組字符。 例如,找到包含“ accept”或“ accent”的行,可以使用以下表達(dá)式:

          $grep ‘acce[np]t’ file.txt

          如果方括號(hào)內(nèi)的第一個(gè)字符是插入符號(hào)^,則它匹配方括號(hào)中未包含的任何單個(gè)字符。 以下模式將匹配以“ co”開頭的字符串的任意組合,后接除“ l”之后為“ la”的任何字母(例如“ coca”,“ cobalt”等),但不匹配包含“ cola”的行 ”:

          $grep ‘co[^l]a’ file.txt

          您可以在方括號(hào)內(nèi)指定一系列字符,而不是一個(gè)一個(gè)地放置字符。 通過指定以連字符分隔的范圍的第一個(gè)和最后一個(gè)字符來構(gòu)造范圍表達(dá)式。 例如,[a-a]等效于[abcde],[1-3]等效于[123]。

          以下表達(dá)式匹配以大寫字母開頭的每一行:

          $grep ‘^[A-Z]’ file.txt

          grep還支持括號(hào)中預(yù)定義的字符類。 下表顯示了一些最常見的字符類:

          Quantifier Character Classes
          [:alnum:] 字母數(shù)字字符。
          [:alpha:] 字母字符。
          [:blank:] 空格和制表符。
          [:digit:] 數(shù)字。
          [:lower:] 小寫字母。
          [:upper:] 大寫字母。

          有關(guān)所有字符類別的完整列表,請參閱Grep手冊。

          量詞

          量詞Quantifier允許您指定要出現(xiàn)的匹配項(xiàng)必須出現(xiàn)的項(xiàng)數(shù)。 下表顯示了GNU grep支持的量詞:

          Quantifier 描述
          * 匹配上一項(xiàng)零次或多次。
          ? 匹配上一項(xiàng)零或一次。
          + 將上一項(xiàng)匹配一次或多次。
          {n} 將前一項(xiàng)精確匹配n次。
          {n,} 至少匹配n個(gè)項(xiàng)目。
          {,m} 最多匹配m次以上項(xiàng)。
          {n,m} 將前一項(xiàng)匹配n至m次。

          *(星號(hào))字符與前面的項(xiàng)目匹配零次或多次。 以下將匹配“right”,“sright”,“ssright”等等。

          $grep ‘s*right’

          下面是更高級(jí)的模式,它匹配所有以大寫字母開頭,以句點(diǎn)或逗號(hào)結(jié)尾的行。 .* 正則表達(dá)式匹配任意數(shù)量的任何字符:

          $grep -E ‘^[A-Z].*[.,]$’ file.txt

          ? (問號(hào))字符使前一項(xiàng)為可選,并且只能匹配一次。 以下將同時(shí)匹配“bright”和“right”。 ? 字符以反斜杠轉(zhuǎn)義,因?yàn)槲覀兪褂玫氖腔菊齽t表達(dá)式:

          $grep ‘b?right’ file.txt

          下面是使用擴(kuò)展正則表達(dá)式的同一個(gè)正則表達(dá)式:

          $grep -E ‘b?right’ file.txt

          +(加號(hào))字符與前面的項(xiàng)目匹配一次或多次。 以下將匹配“sright”和“ssright”,但不匹配“right”:

          $grep -E ‘s+right’ file.txt

          大括號(hào)字符{}使您可以指定確切的數(shù)字,上限或下限或發(fā)生匹配必須發(fā)生的范圍。

          以下內(nèi)容匹配3到9位之間的所有整數(shù):

          $grep -E ‘[[:digit:]]{3,9}’ file.txt

          交替Alternation

          交替是一個(gè)簡單的“或”。替換操作符| (pipe)允許您指定不同的可能匹配,可以是文字字符串或表達(dá)式集。該操作符在所有正則表達(dá)式操作符中優(yōu)先級(jí)最低。

          在下面的例子中,我們搜索Nginx日志錯(cuò)誤文件中出現(xiàn)的所有單詞fatal, error和critical:

          $grep ‘fatal|error|critical’ /var/log/nginx/error.log

          如果使用擴(kuò)展正則表達(dá)式,則不應(yīng)轉(zhuǎn)義運(yùn)算符|,如下所示:

          $grep -E ‘fatal|error|critical’ /var/log/nginx/error.log

          分組

          分組是正則表達(dá)式的一項(xiàng)功能,可讓您將模式分組在一起并將其作為一項(xiàng)引用。 使用括號(hào)()創(chuàng)建組。

          使用基本正則表達(dá)式時(shí),必須用反斜杠()對(duì)括號(hào)進(jìn)行轉(zhuǎn)義。

          下面的示例同時(shí)匹配“ fearless”和“ less”。 ? 量詞使(fear)組成為可選的:

          $grep -E ‘(fear)?less’ file.txt

          反斜杠特殊表達(dá)式

          GNU grep包含幾個(gè)元字符,由反斜杠和常規(guī)字符組成。 下表顯示了一些最常見的特殊反斜杠表達(dá)式:

          Expression Description
          b 單詞鎖定符
          < 在單詞開頭匹配一個(gè)空字符串。
          > 在單詞末尾匹配一個(gè)空字符串。
          w 匹配一個(gè)單詞。
          s 匹配一個(gè)空格。

          以下模式將匹配單獨(dú)的單詞“ abject”和“ object”。 如果嵌入較大的單詞,則不會(huì)匹配這些單詞:

          $grep ‘b[ao]bjectb’ file.txt

          總結(jié)

          正則表達(dá)式用于文本編輯器,編程語言和命令行工具,例如grep,sed和awk。 在搜索文本文件,編寫腳本或過濾命令輸出時(shí),了解如何構(gòu)造正則表達(dá)式將非常有幫助。

          如果您有任何問題或反饋,請隨時(shí)發(fā)表評(píng)論。

          贊(1)
          分享到: 更多 (0)
          網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)