欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

UTF-8

系統 2173 0

這幾天研究UTF-8編碼,太暈了,把我的看法和各位討論討論。
歡迎來批啊。以下都是我的想法,哪里有不對的請不吝賜教,幫忙指出來。
==========================================================
相關的題外話:
一、操作系統
window系統內部都是unicode的。文件夾名,文件名等都是unicode的,任何語言系統下都能正常顯示。
二、輸入法:
微軟拼音輸出的是Unicode的,智能ABC輸出是簡體中文的(所以智能ABC在非簡體中文系統根本不能用,只能打英文)。
三、網頁的textarea
網頁的textarea是用unicode顯示的。所以往里打什么字都能顯示。而一些flash做的輸入框就不行了。
四、Access2000
access里面保存的數據是unicode的,在任何語言系統下都能顯示。
如果數據視圖查看有些字符不正常,那是因為顯示所用的字體不是Unicode字體,
換用Arial Unicode MS 字體就能全部顯示了。(access幫助,搜索,輸入unicode,有說明)
五、Word
word里的繁簡轉換,簡體轉換到繁體后,內碼仍是簡體中文的,其實只是簡體中的繁體字。
六、ASP內部是Unicode的,所有文本都是Unicode存儲的。需要時轉換到指定字符集。
=======================================================
首先說下結論:
<%@ codepage=936%>簡體中文
<%@ codepage=950%>繁體中文
<%@ codepage=65001%>UTF-8

codepage指定了IIS按什么編碼讀取傳遞過來的串串(表單提交,地址欄傳遞等)。
也指定了所有文本變量從Unicode轉換到的編碼,
也就指定了從數據庫取出的數據從Unicode轉換到的編碼。(注意這個,很重要。)

關鍵字:
讀?。阂粋€串串,按簡體讀取是一些字,按繁體讀取是一些字,串串本身編碼沒有變。
轉換:系統主動的轉換,比如從Unicode的“化”字到Big5的“化”字,內碼變成Big5的。如果Big5沒有對應的字,保留Unicode形式(&#xxxx;)

簡體中文:化六個結論
Unicode16進制形式:&#x5316;&#x516d;&#x4e2a;&#x7ED3;&#x8bba;
Unicode10進制形式:&#21270;&#20845;&#20010;&#32467;&#35770;

下面是我推測出來的編碼轉換的過程:
客戶端:輸入法Unicode--輸入框unicode--從Unicode按charset轉換到對應編碼()--表單發送編碼

服務器端:IIS解開表單編碼--按codepage指定編碼讀取--轉換到對應的Unicode--可以用request("")讀取了--進行一些處理--以Unicode編碼保存到數據庫

服務器端:讀取數據庫的Unicode數據,轉換到codepage指定編碼---生成源代碼--IE按charset讀取顯示。


下面舉例說明:
例一:
假設有三個asp頁面,典型的留言頁面:
1.

<!--ubbcodetab-->

<!--/ubbcodetab-->

write.asp 簡單的輸入表單,提交到add.asp。
<META http-equiv="Content-Type" content="text/html; charset=big5">
2.

<!--ubbcodetab-->

<!--/ubbcodetab-->

add.asp 接收留言,保存到數據庫
<%@ codepage=936%>
3.

<!--ubbcodetab-->

<!--/ubbcodetab-->

read.asp 從數據庫取得留言,顯示。
<%@ codepage=936%> charset=GB2312 或
<%@ codepage=950%> charset=big5

大家可以猜一猜,我在write.asp里用微軟拼音輸入法輸入“化六個討論”。最后在read.asp里會顯示什么樣?
是不是暈了。讓我們從頭分析。



例二:
把例一的add.asp的<%@ codepage=936%>改為<%@ codepage=950%>,又會怎么樣呢?



到這里發現了什么?
1.如果輸入的文字和Charset對應的不同,一轉換,就可能出現Unicode形式的字了。這里就是原因所在。以后整個過程都保留著。
2.Add.asp里codepage決定了保存到數據庫的文字,用的是哪個語言對應的Unicode.如codepage=936,
那么數據庫保存的就是簡體中文的Unicode(數據庫拿回簡體中文系統,一切正常的),
codepage=950保存的就是繁體中文的Unicode.(拿回簡體中文系統,就不對了)。
3.注意一下串串的變化過程:
--------------------------------------------------------------------
1)

<!--ubbcodetab-->

<!--/ubbcodetab-->

輸入法---Charset

<!--ubbcodetab-->

<!--/ubbcodetab-->

Unicode----指定字符集的映射
2)

<!--ubbcodetab-->

<!--/ubbcodetab-->

Charset----表單編碼

<!--ubbcodetab-->

<!--/ubbcodetab-->

串串簡單編碼
3)

<!--ubbcodetab-->

<!--/ubbcodetab-->

表單解碼

<!--ubbcodetab-->

<!--/ubbcodetab-->

上步的逆過程,兩步抵消了。
4)

<!--ubbcodetab-->

<!--/ubbcodetab-->

串串à按codepage讀取

<!--ubbcodetab-->

<!--/ubbcodetab-->

串串沒變,這步有可能“誤會讀取”
5)

<!--ubbcodetab-->

<!--/ubbcodetab-->

轉為對應的Unicode

<!--ubbcodetab-->

<!--/ubbcodetab-->

Codepage指定字符集----Unicode映射
6)

<!--ubbcodetab-->

<!--/ubbcodetab-->

中間處理,進數據庫

<!--ubbcodetab-->

<!--/ubbcodetab-->

無變化,直接以Unicode形式進入
7)

<!--ubbcodetab-->

<!--/ubbcodetab--><!--ubbcodetab-->

<!--/ubbcodetab-->


8)

<!--ubbcodetab-->

<!--/ubbcodetab-->

按codepage讀取數據庫

<!--ubbcodetab-->

<!--/ubbcodetab-->

Unicode----codepage指定字符集的映射
9)

<!--ubbcodetab-->

<!--/ubbcodetab-->

顯示,按Charset指定字符集讀取

<!--ubbcodetab-->

<!--/ubbcodetab-->

串串沒變。
-------------------------------------------------------------------------------
以例一說明:


例二:


=============================================
暈了?,F在來用用知識。

案例1。
簡體中文系統下跑的好好的代碼,放到國外空間上,數據庫里亂碼,原有的數據也亂碼。
分析:因為大多數人平時用的都是簡體中文系統,默認的codepage=936,所以平時大家不寫也沒有關系。
但到了國外空間問題就出來了。從數據庫里的Unicode轉換到英文編碼去了,所以數據庫原有的簡體中文轉換到英文后,按GB顯示自然亂碼。
如圖,新輸入的文字顯示正常,但數據庫里保存的是英文的Unicode的。
解決方法:全部加上<%@codepage=936即可%>。
全程只有簡體中文與對應Unicode間的轉換。



案例二:
簡體中文的代碼和數據,想轉為完全的繁體版,該怎么辦?
分析:1。代碼文件編碼全部改為Big5的,文件本身保存編碼選繁體。
2.<%@ codepage=936 %>
3.Charset=big5
4.access版本無所謂,因為access里的數據是Unicode的。
5.好了,代碼可以在純繁體系統下跑了。
6.遺留問題:原有的簡體中文數據讀出會有一些問號。效果同例一的950讀取,big5顯示。因為從簡體中文的Unicode轉換到繁體中文了,有些字繁體中沒有,就會出問號。
7.解決:用一個臨時asp頁,codepage=65001,讀出為簡體中文的Unicode,用一個Unicode->Big5的函數,轉為繁體中文,然后寫回數據庫,應該行了吧?
=============================================
兩個案例完全是我按照理論推導出來了,未經證實。
有類似經歷的歡迎批評指正。

UTF-8


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦?。?!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: a毛片久久免费观看 | 伊人狠狠 | 色综合久久天天综合网 | 欧美在线观看一区 | 国产精品久久嫩一区二区免费 | 看毛片免费 | 日本三级黄色片网站 | 精品国产不卡一区二区三区 | 亚洲精品国产第1页 | 日韩在线视频在线 | jjzz日本女人 | 羞羞的视频在线 | 中文字幕一区在线观看视频 | 成人毛片一区 | 男女男精品视频免费观看 | 高清国语自产拍免费视频国产 | 久久99国产亚洲精品观看 | videos韩国| 国产自啪啪| 久久精品蜜芽亚洲国产a | 日韩精品一区二区三区国语自制 | 亚洲高清在线视频 | 一级国产黄色片 | 韩国男女无遮挡高清性视频 | 亚洲香蕉在线视频 | 日本黄色免费网址 | 亚洲综合在线一区 | 美腿丝袜中文字幕 | 精品一区二区三区不卡 | 小优视频污 | 99久久精品国产亚洲 | 99精品热 | 欧美图片激情小说 | 午夜插插| 欧美jizzjizz在线播放 | 久久久国产视频 | 久久久网| 国产一区二区三区免费观看 | 天堂在线观看中文字幕 | 免费大片在线观看网站 | 国产精品麻豆视频 |