黄色网页视频 I 影音先锋日日狠狠久久 I 秋霞午夜毛片 I 秋霞一二三区 I 国产成人片无码视频 I 国产 精品 自在自线 I av免费观看网站 I 日本精品久久久久中文字幕5 I 91看视频 I 看全色黄大色黄女片18 I 精品不卡一区 I 亚洲最新精品 I 欧美 激情 在线 I 人妻少妇精品久久 I 国产99视频精品免费专区 I 欧美影院 I 欧美精品在欧美一区二区少妇 I av大片网站 I 国产精品黄色片 I 888久久 I 狠狠干最新 I 看看黄色一级片 I 黄色精品久久 I 三级av在线 I 69色综合 I 国产日韩欧美91 I 亚洲精品偷拍 I 激情小说亚洲图片 I 久久国产视频精品 I 国产综合精品一区二区三区 I 色婷婷国产 I 最新成人av在线 I 国产私拍精品 I 日韩成人影音 I 日日夜夜天天综合

Python字符串和正則表達式中的反斜杠('\')問題詳解

系統 1910 0

在Python普通字符串中

在Python中,我們用'\'來轉義某些普通字符,使其成為特殊字符,比如

            
In [1]: print('abc\ndef') # '\n'具有換行的作用
abc
defg

In [2]: print('abc\tdef') # '\t'具有制位符的作用           
abc  defg
          

我們還可以用'\'來轉義特殊字符,使其成為普通字符,比如

            
In [3]: print('abc\\tdef') # 使'\'成為一個普通的字符,沒有轉義作用
abc\tdef

In [4]: print('abc\'tdef') # 使'''成為一個普通的字符,不再需要和另一半單引號'''配對              
abc'tde
          

所以,在python普通字符串中,我們不能以奇數個'\'結尾,這樣會導致結束的的引號轉義成一個純字符,從而使得這段字符串沒有引號來結束。

在Python原生字符串中

我們在字符串前加一個'r'來表示原生字符串,比如r'abc'。原生字符串中的特殊字符的特殊含義將會被剝奪掉,如下

            
In [5]: print(r'abc\ndefg') # '\n'沒有換行的作用,僅僅是一個普通的字符串             
abc\ndefg

In [6]: print(r'abc\tdefg') # '\t'沒有制位符的作用,僅僅是一個普通的字符串          
abc\tdef
          

這里有一個奇怪的問題,在原生字符串中,雖然'\'成為了一個普通的字符串,但我們同樣不能以奇數個'\'字符串結尾,這是因為Python正則表達式的原因,在正則表達式中我們將會解釋這個問題。

在Python(regular express)正則表達式中

Python正則表達式中會有一些不同,正則表達式中指定了一些元字符(metacharacter),如下

            
. ^ $ * + ? { } [ ] \ | ( )
          

它們都具有特殊的含義,'\'也屬于元字符。'\'既屬于Python中的特殊字符,也屬于正則中的元字符,所以使用時得非常小心。那么在正則中,'\'的作用是什么呢?我們看一個例子

            
In [7]: re.search('.', 'sd.f')               
Out[7]: <_sre.SRE_Match object; span=(0, 1), match='s'>

In [8]: re.search('\.', 'sd.f')              
Out[8]: <_sre.SRE_Match object; span=(2, 3), match='.'>In [9]: re.search('\n', 'sdfd\nfds')            Out[9]: <_sre.SRE_Match object; span=(4, 5), match='\n'>

"""
'.'作為一個元字符,它的特殊含義是匹配任意一個字符,而當我們在其前面加'\'后,它的特殊含義消失了,匹配到的是'.';而且'\'依然可以把Python中某些字符轉義成特殊字符。
"""
          

所以,'\'的作用是剝奪元字符的特殊含義,使其成為一個Python字符,所以它還是會具有在Python普通字符串中的轉義作用,比如'\n'依然表示換行。所以,'\'既是正則中的一個元字符,又是Python中的一個特殊字符。那么我們該如何匹配到純字符'\'(無任何特殊意義)?

在正則中,'\'的作用是把元字符轉義成Python字符串文字(a Python string literal),所以正則中的'\\'其實是其實是Python字符中的'\',它仍然還具有轉義作用,所以在正則中我們還得對每個'\'再進行轉義一次,即'\\\\',這樣就可以匹配到純字符'\'了。看下面例子

            
In [10]: re.search('\\\\', 'fsd\nfds') # 目標字符串中沒有純字符'\',所以匹配為空

In [11]: re.search('\\\\', 'fsd\\nfds')                     
Out[11]: <_sre.SRE_Match object; span=(3, 4), match='\\'> # Python字符串中,'\\'就是純字符'\'
          

在re中反復的使用'\',這可能會生成大量的連續的反斜杠,從而導致某些字符串難以理解。解決的辦法是用Python原生字符串來書寫正則表達式,如下

            
In [12]: re.search(r'\\', 'fsd\\nfds') # 兩個'\\'就可以匹配到純字符'\'
Out[12]: <_sre.SRE_Match object; span=(3, 4), match='\\'>
          

另外,當我們用原生字符串來書寫正則表達式時,Python字符中的特殊字符依然有效,比如

            
In [13]: re.search(r'\n', 'fsd\nfds')                      
Out[13]: <_sre.SRE_Match object; span=(3, 4), match='\n'>
"""
在Python字符中,r'\n'僅僅表示純字符串'\n',沒有換行的作用;在正則中,r'\n'依然還有換行的作用。所以此時我們不能用奇數個'\'來結尾某個正則表達式,這樣導致結束的引號被轉義成一個純字符,無結束符號。所以,在Python原生字符串中,我們也同樣規定不能用奇數個'\'來結尾。
"""
          

以上就是本次介紹的全部知識點內容,感謝大家對腳本之家的支持。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論