中文編碼問題一直是Python程序設計中很頭痛的問題,本文對此較為詳細的進行了總結歸納。具體如下:
?
當字符串是:'\u4e2d\u56fd'?
>>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66'] >>>str=s[0].decode('unicode_escape') #.encode("EUC_KR") >>>print str 中國
當字符串是:' 東亞學團一中'
>>>print unichr(19996) 東
ord()支持unicode,可以顯示特定字符的unicode號碼,如:
>>>print ord('A') 65
只要和Unicode連接,就會產生Unicode字串。如:
>>> 'help' 'help' >>> 'help,' + u'python' u'help,python'
對于ASCII(7位)兼容的字串,可和內置的str()函數把Unicode字串轉換成ASCII字串。如:
>>> str(u'hello world') 'hello world'
對幾個概念的理解:
ASCII碼 用數據字 對應 相應的字符 如下圖所示:
而中文 就是區位碼對應漢字。如:“好” 的ASCII碼為: 22909
?
unicode 編碼 每個國家分一塊。它有UTF-8、UTF-16、UTF-32等形式
中文范圍 4E00-9FBF:這個范圍內有 gbk,gb2312,
?
utf-8是基于unicode的 國際化的場合適合使用
gb2312和gb2312都是國標碼 出現的較早 主要用于編解碼常用漢字
希望本文所述對大家的Python程序設計有所幫助。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
