python如何處理“&#”開頭加數字的html字符,比如:風水這類數據。
用python抓取數據時,有時會遇到想要數據是以“&#”開頭加數字的字符,比如圖中所示的這些:
風水大術士
這些字符需要再次轉換才能變回中文內容。這些字符需要再次轉換才能變回中文內容。
Python2.7版本
在python2.7版本中,使用import HTMLParser
定義變量,再定義轉換代碼。
代碼中最重要的是“data_parser = HTMLParser.HTMLParser()”,通過此才能用“.unescape()”方法。?
測試運行,這串字符串正常輸出了中文。
Python3.7+版本
在最新python版本中,不能用上面的導入方法??梢杂?import html"或者“from html import unescape”。這里使用"import html"做測試。
導入html后,直接用".unescape()"來處理字符串。
運行后,正常轉換成了中文字符。
感謝大家的閱讀和對腳本之家的支持。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
