前言
如果大家在網上搜索Python 正則表達式,你將會看到大量的垃圾文章會這樣寫代碼:
import re pattern = re.compile('正則表達式') text = '一段字符串' result = pattern.findall(text)
這些文章的作者,可能是被其他語言的壞習慣影響了,也可能是被其他垃圾文章誤導了,不假思索拿來就用。
在Python里面,真的不需要使用re.compile!
為了證明這一點,我們來看Python的源代碼。
在PyCharm里面輸入:
import re re.search
然后Windows用戶按住鍵盤上的Ctrl鍵,鼠標左鍵點擊search,Mac用戶按住鍵盤上的Command鍵,鼠標左鍵點擊search,PyCharm會自動跳轉到Python的re模塊。在這里,你會看到我們常用的正則表達式方法,無論是findall還是search還是sub還是match,全部都是這樣寫的:
_compile(pattern, flag).對應的方法(string)
例如:
def findall(pattern, string, flags=0): """Return a list of all non-overlapping matches in the string. If one or more capturing groups are present in the pattern, return a list of groups; this will be a list of tuples if the pattern has more than one group. Empty matches are included in the result.""" return _compile(pattern, flags).findall(string)
如下圖所示:
然后我們再來看compile:
def compile(pattern, flags=0): "Compile a regular expression pattern, returning a Pattern object." return _compile(pattern, flags)
如下圖所示:
看出問題來了嗎?
我們常用的正則表達式方法,都已經自帶了compile了!
根本沒有必要多此一舉先re.compile再調用正則表達式方法。
此時,可能會有人反駁:
如果我有一百萬條字符串,使用使用某一個正則表達式去匹配,那么我可以這樣寫代碼:
texts = [包含一百萬個字符串的列表] pattern = re.compile('正則表達式') for text in texts: pattern.search(text)
這個時候,re.compile只執行了1次,而如果你像下面這樣寫代碼:
texts = [包含一百萬個字符串的列表] for text in texts: re.search('正則表達式', text)
相當于你在底層對同一個正則表達式執行了100萬次re.compile。
Talk is cheap, show me the code.
我們來看源代碼,正則表達式re.compile調用的是_compile,我們就去看_compile的源代碼,如下圖所示:
紅框中的代碼,說明了_compile自帶緩存。它會自動儲存最多512條由type(pattern), pattern, flags)組成的Key,只要是同一個正則表達式,同一個flag,那么調用兩次_compile時,第二次會直接讀取緩存。
綜上所述,請你不要再手動調用re.compile了,這是從其他語言(對的,我說的就是Java)帶過來的陋習。
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
