欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

python用match()函數爬數據方法詳解

系統 2003 0

match()函數的使用。以及從文本中提取數據的方法。在學習re模塊的相關函數前應了解正則表達式的特殊字符

準備一個要爬取的文本文檔:

直接從某個網頁拷貝一份代碼,粘貼在 一個txt文件里,以供學習。

方法很簡單,比如打開百度視頻的熱門電影網頁,右鍵點擊查看源代碼,然后復制,粘貼到一個txt文件里,保存到工作目錄下。

有4000多行。

python用match()函數爬數據方法詳解_第1張圖片

            
re.match(pattern, string, flags=0)
          

①pattern,是正則表達式。string,被檢驗的字符串。

②flags是可選參數,此標記是用來對patten的補充。例如:re.S,可以讓正則表達式中的點匹配換行符\n。(如圖片中,可以看幫助文檔,查看有哪些標記)

③ match()函數由左向右檢驗string,若匹配到正則表達式,返回一個匹配對象,否則就返回None.

④re.match() 匹配字符串的開始位置,而不匹配每行開始。

----所以才將網頁的每行放入列表,以供match函數對每行操作。

python用match()函數爬數據方法詳解_第2張圖片

比如要在文檔中,提取電影的網址,和電影名。

①復制那行文本作為表達式,

②將要提取的網址和和電影名替換為(.*),這只是暫時的,可以在接下來的代碼中調整。

python用match()函數爬數據方法詳解_第3張圖片

讀取文本:

①用with open()語句讀取;

②用readlines,一次性讀完,返回一個列表,元素是文本的每一行。

            
with open('aa.txt','r',encoding='utf-8') as f:
  lines=f.readlines()
          

python用match()函數爬數據方法詳解_第4張圖片

①判斷每行是否返回了匹配的對象,

②接收匹配對象,并用groups()提取表達式內括號的內容;

            
for line in lines:
  if re.match(pat,line):   #判斷過濾掉返回None的行,
    ret=re.match(pat,line) #接收匹配對象
    print(ret.groups())
          

python用match()函數爬數據方法詳解_第5張圖片

發現有不符合的行,稍加修改,過濾掉不符合的行:

因為,不合的行都有空格(或其他字符)。可以給第二子組的點 . 換成非[^ ];非空格的任意字符,意思就是不要有空格的。

python用match()函數爬數據方法詳解_第6張圖片

用f-string格式化對輸出的文本稍加修飾,使用group(1),group(2);

python用match()函數爬數據方法詳解_第7張圖片

可以將這段代碼封裝為一個函數。爬取百度視頻的其他欄目。

python用match()函數爬數據方法詳解_第8張圖片

測試: 百度視頻的電影,電視劇,和動漫等欄目,網頁上的格式基本相同,所以用上面的函數直接套用。

打開百度視頻的動漫,復制源代碼,存為bb.txt。

同樣可以爬取網址和視頻名稱。

以上僅是練習match()函數的例子。

python用match()函數爬數據方法詳解_第9張圖片

以上就是關于python如何用match()函數爬數據的全部內容,感謝大家的閱讀和對腳本之家的支持。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 午夜久久久久久久久久一区二区 | www色综合| 久久国产热视频 | 狠狠干成人 | 日韩在线观看中文字幕 | 特黄特色的大片观看免费视频 | 免费啪视频在线观看免费的 | 成人亚洲网 | 国产一级特黄aa大片爽爽 | 日韩欧美高清 | 久草色在线 | 九色国产在线 | 91精品一区 | 一区二区三区国产免费 | 性视频久久| 亚洲jizzjizz妇女 | 欧美三级欧美一级 | 亚洲午夜在线观看 | 又爽又黄又无遮挡的激情视频免费 | 国产一区二区三区乱码 | 99超级碰碰成人香蕉网 | 小草激情视频 | 久久精品网 | 中文字幕不卡在线观看 | 成年人免费网站视频 | 在线婷婷 | 久操青青 | 97国产精品| 国产精品手机在线 | 成人涩涩屋福利视频 | 久久综合玖玖爱中文字幕 | 日本一区中文字幕 | 水野朝阳128部合集在线 | 欧美成人免费丝袜视频在线观看 | 亚洲天堂免费看 | 欧美色综合 | 欧美日韩三区 | 免费大片黄在线观看 | 亚洲欧美国产日产综合不卡 | 一级国产黄色片 | 99久久精品免费看国产 |