python爬蟲編碼問題

系統(tǒng) 2019-09-27 17:49:29 1977 0

一、往文件中寫入數(shù)據(jù)

往TXT文件寫入的時候報錯? 'gbk' codec can't encode character '\xXX' in position XX

打開文件時，增加一個選項：

            
              def wirteFile(content):
    path = os.getcwd()
    a_path = os.path.join(path, "content.txt")
    f = open(a_path, "w+", encoding="utf-8")
    f.write(content)
    f.close()

open（）中添加編碼類型

二、lxml etree 顯示爬取的內(nèi)容時，中文亂碼

            
              session = requests.Session()                                                             
res = session.get('https://seat.lib.whu.edu.cn/login?targetUri=%2F', headers = headers)  
html = etree.HTML(res.text)  # 轉(zhuǎn)換成element對象，構(gòu)建成xpath解析對象                                 
result = etree.tostring(html, encoding='utf-8')  # bytes類型 這里需要增加編碼方式                               
print(result.decode("UTF-8"))

更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索：z360901061

微信掃一掃加我為好友

QQ號聯(lián)系： 360901061

您的支持是博主寫作最大的動力，如果您喜歡我的文章，感覺我的文章對您有幫助，請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧，狠狠點擊下面給點支持吧，站長非常感激您！手機微信長按不能支付解決辦法：請將微信支付二維碼保存到相冊，切換到微信，然后點擊微信右上角掃一掃功能，選擇支付二維碼完成支付。

【本文對您有幫助就好】元

2元

5元

10元

20元

自定義

發(fā)表我的評論

最新評論總共0條評論

一、往文件中寫入數(shù)據(jù)

二、lxml etree 顯示爬取的內(nèi)容時，中文亂碼

一、往文件中寫入數(shù)據(jù)

二、lxml etree 顯示爬取的內(nèi)容時，中文亂碼