發表文章

目前顯示的是 4月, 2013的文章

python regular expression 初探

圖片
本編主要是參考 Beginning Python 的 page242頁所寫的  regular expression 正規表示式 在wiki的介紹 "." 點可以匹配任何字符(除了換行字符外),如'.ython'可以匹配'+ython','kython','python',或' ython' 但是不能匹配'xdython'或'ython',因為"." 只能匹配單一字元,不匹配兩個字元或沒有字元. 因為它匹配任何單一字符(除了換行字符),句號"."又稱為"萬用字元"(wildcard) "\"跳脫字元,跳脫字元主要用來跳脫一些特殊字元如".",如果我們要匹配'python.org',我們不能用'python.org',這樣會變成匹配'pythonzorg'或'pythonqorg',,,等等的任何一個字元介於python org之間.因為如上所述 "." 是 "萬用字元"會變成匹配任何字元,必須使用'python\\.org', 如果你嫌要打上兩條斜線太麻煩,那可以使用r'python\.org',在兩點前面加一個r,它告訴 python interpreter 這是raw string,你可以少打一條斜線. character set   字集:如果你要更有效的匹配 character(  字符 ) 你可以建立一個 character se t ( 字集 )  ,使用 [ ] 中括號. 舉例:  [ pj ]ython將會匹配 python 和 jython. [a-z]會匹配所有小寫的英文字母.a跟z中間是 - [a-zA-Z0-9]會匹配大小寫和數字 [^abc]這是指匹配任何字母 "除了 abc ",加上^可用來避開匹配 在[ ]裡如果有 .*,,,等會被regular expression判別為萬用字元的,如果要把它當一般字元還是必...