python一直對中文支持的不好,最近老遇到編碼問題,而且?guī)缀鯖]有通用的方案來解決這個問題,但是對常見的方法都試過之后,發(fā)現(xiàn)還是可以解決的,下面總結(jié)了常用的支持中文的編碼問題(這些方法中可能其中一個就能解決問題,也可能是多個組合)。
(1)、首先,要保證文件的開頭要加上編碼設(shè)置來說明文件的編碼
#encoding=utf-8
(2)、然后,在連接數(shù)據(jù)的連接參數(shù)里加上字符集說明查詢出的結(jié)果的編碼,這個不加的后果可能是查詢出的漢字字符都是問號
conn=pymssql.connect(server='.',user='', password='',database='MyTest',charset='utf8')
(3)、設(shè)置python系統(tǒng)的默認(rèn)編碼(對于文件來說,這招幾乎屢試不爽,呵呵~~)
import sys
reload(sys)
sys.setdefaultencoding('utf8')
注意:上述編碼是“utf8”,而不是“utf-8”,我也沒弄明白,大部分情況下,這個無所謂的,但是這里我試了必須要是“utf8”
一個簡單的完整的python連接mssqlserver的例子如下(得安裝pymssql包):
#encoding:utf8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
import pymssql
try:
??? conn=pymssql.connect(server='.',user='', password='',database='MyTest',charset='utf8')
??? sql="select * from UserInfo"
??? cur=conn.cursor()
??? cur.execute(sql)
??? data=cur.fetchall()
??? conn.close()
??? print data
except Exception,e:
??? print e
運行結(jié)果如下:
[(u'20093501', u'\xb9\xf9\xbe\xb8', u'\u7537 ', 35, u'\xb4\xf3\xcf\xc0'),
?(u'20093502', u'\xbb\xc6\xc8\xd8', u'\u5973 ', 34, u'\xc3\xc0\xc5\xae'),
?(u'20093503', u'\xc1\xee\xba\xfc\xb3\xe5', u'\u7537 ', 25, u'2B\xc7\xe0\xc4\xea'),
?(u'20093504', u'\xc8\xce\xd3\xaf\xd3\xaf', u'\u5973 ', 24, u'\xc6\xaf\xc1\xc1')]
?[Finished in 0.2s]
?
雖然擺脫了問號和亂碼的困擾,但這仍不是我們想要的結(jié)果,但這個確實是正確的,因為結(jié)果是utf8編碼。這個現(xiàn)象確實詭異,請教了許多高手,得知,最好的結(jié)果就是逐個字段查詢,才能顯示中文,整個查詢的話,會以utf8的格式顯示出來。
上述代碼中第14行data是整個查詢的結(jié)果,如果指定某個具體的字段,如print data[0][2](表示取查詢結(jié)果的第一行第三列的字段的值),則會輸出中文。
其實不僅僅是mssqlserver數(shù)據(jù)庫,mysql(需下載MySQLdb包)、sqllite(python自帶的文件數(shù)據(jù)庫)、mongodb(需下載PyMongo包)等或者是普通文本文件也是類似的解決方案。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
