欧美亚洲中文,在线国自产视频,欧洲一区在线观看视频,亚洲综合中文字幕在线观看

<dfn id="rfwes"></dfn>

<object id="rfwes"></object>

<strong id="kb4qn"><ins id="kb4qn"></ins></strong>

<menuitem id="kb4qn"><ins id="kb4qn"></ins></menuitem>

<li id="kb4qn"><center id="kb4qn"></center></li>

當前位置：站長資訊網(wǎng) > 編程知識 > 正文

ASP.NET 中的正則表達式

2018-10-24 分類：編程知識閱讀(937) 評論(0)

摘要：正則表達式是一種處理文本的有用工具。無論是驗證用戶輸入、搜索字符串內(nèi)的模式、還是以各種有效方式重新設(shè)置文本格式，正則表達式都非常有用。下載本文的源代碼。
引言
Microsoft®.NET Framework 對正則表達式的支持是一流的，甚至在 Microsoft® ASP.NET 中也有依賴正則表達式語言的控件。本文介紹了深入學(xué)習(xí)正則表達式的基礎(chǔ)知識和推薦內(nèi)容。

本文主要面向?qū)φ齽t表達式知之甚少或沒有使用經(jīng)驗，但卻熟悉 ASP.NET、可借助 .NET 編程的初學(xué)者。此外，希望本文連同 regular expression cheat sheet 成為有正則表達式使用經(jīng)驗的開發(fā)者的手頭參考資料或進修資料。本文討論內(nèi)容如下：

1.	正則表達式使用歷史簡介
2.	簡單表達式
3.	限定符
4.	元字符
5.	字符類
6.	預(yù)定義的集合元字符
7.	表達式示例詳細內(nèi)容
8.	ASP.NET 中的驗證
9.	正則表達式 API
10.	免費工具
11.	高級主題概述
12.	小結(jié)和其他資源

通常，如果對本文或?qū)φ齽t表達式有疑問，請訪問 http://www.aspadvice.com/，通過 regex mailing list 提出問題。編寫此文時其中已有 350 多個訂戶參與。

返回頁首

正則表達式使用歷史簡介

正則表達式設(shè)計于五十年代，存在至今。正則表達式最初用于描述“正則集”，它們是一些神經(jīng)生理學(xué)家研究的模式。正則表達式最早由數(shù)學(xué)家 Stephen Kleene 提出，最終由 Ken Thompson 在兩種非常流行的文本實用程序 qed 和 grep 中使用。Jeffrey Friedl 在其著作“Mastering Regular Expressions (2^nd edition)”中對此作了進一步闡述。建議那些希望更多了解正則表達式理論和歷史的人看看這本書。

在最近的五十年中，正則表達式逐漸從模糊深奧的數(shù)學(xué)概念發(fā)展為在各類工具和軟件包中應(yīng)用的主要功能。盡管數(shù)十年來很多 UNIX 工具都支持正則表達式，但僅僅是近十年來，它才在大部分 Windows 開發(fā)者工具包中得到體現(xiàn)。在 Microsoft® Visual Basic® 6 或 Microsoft® VBScript 中，即使情況理想，正則表達式仍難以使用。但隨著.NET Framework 的推行，正則表達式的支持發(fā)展到極點，所有 Microsoft 開發(fā)者和所有 .NET 語言都可以使用正則表達式。

那么，正則表達式究竟是什么呢？正則表達式是一種語言，它可以明確描述文本字符串中的模式。除了簡單描述這些模式之外，正則表達式引擎通?？捎糜诒闅v匹配，并使用模式作為分隔符來將字符串解析為子字符串，或以智能方式替換文本或重新設(shè)置文本格式。正則表達式為解決與文本處理有關(guān)的許多常見任務(wù)提供了有效而簡捷的方式。

在討論正則表達式時，通常以正則表達式匹配（或不匹配）的文本為基礎(chǔ)分析正則表達式。本文（以及 System.Text.RegularExpressions 類）將在正則表達式交互操作中引用 3 個參與對象：正則表達式的“模式”、“輸入”字符串和字符串內(nèi)的所有模式的“匹配”。

返回頁首

簡單表達式

最簡單的正則表達式大家都已熟悉，即文字字符串。特定的字符串可通過文字本身加以描述；像 foo 這樣的正則表達式模式可精確匹配輸入的字符串 foo。在本例中，也將匹配如下輸入：The food was quite tasty，如果希望精確匹配，這可能不是預(yù)期結(jié)果。

當然，使用正則表達式匹配等于它自身的精確字符串是沒有價值的實現(xiàn)，不能體現(xiàn)正則表達式的真正作用。假如不查找 foo，而是查找以字母 f 開頭的所有單詞，或所有 3 個字母的單詞，那該怎么辦？目前，這超出了文字字符串的合理范圍。我們需要更加深入地研究正則表達式。下面是一個文字表達式示例及一些匹配的輸入。

模式	輸入（匹配）
foo	foo、food、foot、“There’s evil afoot.”

返回頁首

限定符

限定符提供了一種簡單方法，用于指定在模式中允許特定字符或字符集自身重復(fù)出現(xiàn)的次數(shù)。有 3 個非顯式限定符：

1.	*，描述“出現(xiàn) 0 或多次”。
2.	+，描述“出現(xiàn) 1 或多次”。
3.	?，描述“出現(xiàn) 0 或 1 次”。

限定符始終引用限定符前（左邊）的模式，通常是單個字符，除非使用括號創(chuàng)建模式組。下面是一些模式示例及匹配的輸入。

模式	輸入（匹配）
fo*	foo、foe、food、fooot、“forget it”、funny、 puffy
fo+	foo、foe、food、foot、“forget it”
fo?	foo、foe、food、foot、“forget it”、funny、puffy

除了指定給定模式準確出現(xiàn) 0 或 1 次之外，? 字符還可強制模式或子模式匹配數(shù)目最少的字符（如果匹配輸入字符串中的多個字符）。

除了非顯式限定符（一般叫做限定符，但為區(qū)別于下一組，故稱非顯式限定符）之外，還有顯式限定符。在模式出現(xiàn)次數(shù)方面，限定符的概念非常模糊。使用顯式限定符則可準確指定數(shù)字、范圍或數(shù)字集。顯式限定符位于所應(yīng)用的模式的后邊，這一點與正則限定符一樣。顯式限定符使用花括號 {} 及其中的數(shù)字值表示模式出現(xiàn)次數(shù)的上下限。例如，x{5} 將準確匹配 5 個 x 字符 (xxxxx)。如果僅指定一個數(shù)字，則表示次數(shù)上限；如果數(shù)字后跟一個逗號，如 x{5,}，表示匹配任何出現(xiàn)次數(shù)大于 4 的 x 字符。下面是一些模式示例及匹配的輸入。

模式	輸入（匹配）
ab{2}c	abbc、aaabbccc
ab{,2}c	ac、abc、abbc、aabbcc
ab{2,3}c	abbc、abbbc、aabbcc、aabbbcc

返回頁首

元字符

在正則表達式中，有一種意義特殊的構(gòu)造，即元字符。目前已知的元字符有很多，如 *、?、+ 和 {} 字符。其他字符在正則表達式語言中都有特殊的含義。這些字符包括：$ ^ . [ ( | ) ] 和。

.（句點或點）元字符是最簡單但最常用的一個字符。它可匹配任何單字符。如果要指定某些模式可包含任意組合的字符，使用句點非常有用，但一定要在特定長度范圍內(nèi)。此外，我們知道表達式將對包含在較長字符串中的所有模式進行匹配，假如只需要精確匹配模式，又該怎么辦？這在驗證方案中經(jīng)常出現(xiàn)，例如，要確保用戶輸入的郵政編碼或電話號碼的格式正確。使用 ^ 元字符可指定字符串（或行）的開始，使用 $ 元字符可指定字符串（或行）的結(jié)束。通過將這些字符添加到模式的開始和結(jié)束處，可強制模式僅匹配精確匹配的輸入字符串。如果 ^ 元字符用在方括號 [ ] 指定的字符類的開頭，也有特殊的含義。具體內(nèi)容見下。

（反斜杠）元字符既可根據(jù)特殊含義“轉(zhuǎn)義”字符，也可指定預(yù)定義集合元字符的實例。同樣，具體內(nèi)容見下。為了在正則表達式中包括文字樣式的元字符，必須使用反斜杠進行“轉(zhuǎn)義”。例如，如果要匹配以“c:”開始的字符串，可使用：^c:\。注意，要使用 ^ 元字符指出字符串必須以此模式作為開始，然后用反斜杠元字符轉(zhuǎn)義文字反斜杠。

|（管道）元字符用于交替指定，特別用于在模式中指定“此或彼”。例如，a|b 將匹配包含“a”或“b”的任何輸入內(nèi)容，這與字符類 [ab] 非常類似。

最后，括號 ( ) 用于給模式分組。它允許使用限定符讓一個完整模式出現(xiàn)多次。為了便于閱讀，或分開匹配特定的輸入部分，可能允許分析或重新設(shè)置格式。
下面列出元字符的一些使用示例。

模式輸入（匹配）
.
a、b、c、1、2、3 .*
Abc, 123, 任意字符串, 無字符時也匹配
^c:\
c:windows、c:\\、c:foo.txt、c: 后跟任何其他內(nèi)容
abc$
abc、123abc、以 abc 結(jié)束的任意字符串
(abc){2,3}
abcabc、abcabcabc

字符類
字符類是正則表達式中的“迷你”語言，在方括號 [ ] 中定義。最簡單的字符類只不過是括號中的一個字符表，如 [aeiou]。在表達式中使用字符類時，可在模式的此位置使用其中任何一個字符（但只能使用一個字符，除非使用了限定符）。請注意，不能使用字符類定義單詞或模式，只能定義單個字符。

要指定任何數(shù)值數(shù)字，可以使用字符類 [0123456789]。但是，由于這樣使用字符不大方便，所以要通過在括號中使用連字符 – 來定義字符的范圍。連字符在字符類中有特殊的含義（不是在正則表達式中，因此，準確地說它不能叫正則表達式元字符），且僅在連字符不是第一個字符時，連字符才在字符類中有特殊含義。要使用連字符指定任何數(shù)值數(shù)字，可以使用 [0-9]。小寫字母也一樣，可以使用 [a-z]，大寫字母可以使用 [A-Z]。連字符定義的范圍取決于使用的字符集。因此，字符在（例如）ASCII 或 Unicode 表中出現(xiàn)的順序確定了在范圍中包括的字符。如果需要在范圍中包括連字符，將它指定為第一個字符。例如：[-.?] 將匹配 4 個字符中任何一個字符（注意，最后的字符是個空格）。另請注意，正則表達式元字符在字符類中不做特殊處理，所以這些元字符不需要轉(zhuǎn)義?？紤]到字符類是與其他正則表達式語言分開的一種語言，因此字符類有自己的規(guī)則和語法。

如果使用字符 ^ 作為字符類的第一個字符來否定此類，也可以匹配字符類成員以外的任何字符。因此，要匹配任何非元音字符，可以使用字符類 [^aAeEiIoOuU]。注意，如果要否定連字符，應(yīng)將連字符作為字符類的第二個字符，如 [^-]。記住，^ 在字符類中的作用與它在正則表達式模式中的作用完全不同。
下面列出操作中使用的一些字符類。

模式輸入（匹配）
^b[aeiou]t$
Bat、bet、bit、bot、but

^[0-9]{5}$
11111, 12345, 99999

^c:\
c:windows、c:\\、c:foo.txt、c: 后跟任何其他內(nèi)容

abc$
abc、123abc、以 abc 結(jié)束的任意字符串

(abc){2,3}
abcabc、abcabcabc

^[^-][0-9]$
0、1、2、… （不匹配 -0、-1、 -2 等）

在 .NET Framework 的下一版中，代碼名“Whidbey”作為一種新功能被添加到字符類中，稱作字符類差 (character class subtraction)。它的主要作用是，允許從一個字符類中減去另一個字符類，可提供更可讀的方式描述某些模式。該規(guī)范可通過以下地址訪問：

http://www.gotdotnet.com/team/clr/bcl/TechArticles/techarticles/Specs/Regex/

CharacterClassSubtraction.doc。它的語法類似 [a-z-[aeiou]]，匹配所有的小寫輔音字母。

返回頁首

預(yù)定義的集合元字符

使用目前提供的工具可以完成很多工作。但是，要使用 [0-9] 表示模式中的每個數(shù)值數(shù)字，或（更糟）使用 [0-9a-zA-Z]表示任何字母數(shù)字字符，還有一段相當漫長的過程。為了減輕處理這些常用但冗長模式的痛苦，事先定義了預(yù)定義元字符集合。正則表達式的不同實現(xiàn)定義了不同的預(yù)定義元字符集合，下面描述的預(yù)定義元字符集合在 .NET Framework 中得到 System.Text.RegularExpressions API 的支持。這些預(yù)定義元字符的標準語法是，在反斜杠后跟一個或多個字符。多數(shù)預(yù)定義元字符只有一個字符，它們的使用很容易，是冗長字符類的理想替代字符。以下是兩個示例：d 匹配所有數(shù)值數(shù)字，w 匹配所有單詞字符（字母數(shù)字加下劃線）。例外情況是一些特定字符代碼匹配，此時必須指定所匹配字符的地址，如 u000D 將匹配 Unicode 回車符。下面列出一些最常用的字符類及其等效的元字符。

<dfn id="rfwes"></dfn>

<object id="rfwes"></object>

在线免费观看二区三区好看中文字幕亚洲国产老熟女免费精品久久综合精品视频网欧美国产日韩一区


元字符	等效字符類
a	匹配鈴聲（警報）；u0007
b	匹配字符類外的字邊界，它匹配退格字符，u0008
t	匹配制表符，u0009
r	匹配回車符，u000D
w	匹配垂直制表符，u000B
f	匹配換頁符，u000C
n	匹配新行，u000A
e	匹配轉(zhuǎn)義符，u001B
欧美亚洲中文,在线国自产视频,欧洲一区在线观看视频,亚洲综合中文字幕在线观看