欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

關(guān)于VIM編碼問題的解決

系統(tǒng) 1873 0

先放上自己前兩年做的幾個(gè)視頻吧,懶了,本打算做8個(gè),只做了4個(gè)。

http://www.boobooke.com/v/bbk4407

http://www.boobooke.com/v/bbk4414

http://www.boobooke.com/v/bbk4415

http://www.boobooke.com/v/bbk4416

此文講解的是vim編輯多字節(jié)編碼文檔(中文)所要了解的一些基礎(chǔ)知識,注意其沒有涉及gvim,純指字符終端下的vim。
vim編碼方面的基礎(chǔ)知識:
1,存在3個(gè)變量:
encoding—-該選項(xiàng)使用于緩沖的文本(你正在編輯的文件),寄存器,Vim 腳本文件等等。你可以把 ‘encoding’ 選項(xiàng)當(dāng)作是對 Vim 內(nèi)部運(yùn)行機(jī)制的設(shè)定。
fileencoding—-該選項(xiàng)是vim寫入文件時(shí)采用的編碼類型。
termencoding—-該選項(xiàng)代表輸出到客戶終端(Term)采用的編碼類型。
2,此3個(gè)變量的默認(rèn)值:
encoding—-與系統(tǒng)當(dāng)前l(fā)ocale相同,所以編輯文件的時(shí)候要考慮當(dāng)前l(fā)ocale,否則要設(shè)置的東西就比較多了。
fileencoding—-vim打開文件時(shí)自動(dòng)辨認(rèn)其編碼,fileencoding就為辨認(rèn)的值。為空則保存文件時(shí)采用encoding的編碼,如果沒有修改encoding,那值就是系統(tǒng)當(dāng)前l(fā)ocale了。
termencoding—-默認(rèn)空值,也就是輸出到終端不進(jìn)行編碼轉(zhuǎn)換。
由此可見,編輯不同編碼文件需要注意的地方不僅僅是這3個(gè)變量,還有系統(tǒng)當(dāng)前l(fā)ocale和、文件本身編碼以及自動(dòng)編碼識別、客戶運(yùn)行vim的終端所使用的編碼類型3個(gè)關(guān)鍵點(diǎn),這3個(gè)關(guān)鍵點(diǎn)影響著3個(gè)變量的設(shè)定。
如果有人問:為什么我用vim打開中文文檔的時(shí)候出現(xiàn)亂碼?
答案是不確定的,原因上面已經(jīng)講了,不搞清楚這3個(gè)關(guān)鍵點(diǎn)和這3個(gè)變量的設(shè)定值,出現(xiàn)亂碼是正常的,倒是不出現(xiàn)亂碼那反倒是湊巧的。
再來看一下常見情況下這三個(gè)關(guān)鍵點(diǎn)的值以及在這種情況下這3個(gè)變量的值:
1,locale—-目前大部分Linux系統(tǒng)已經(jīng)將utf-8作為默認(rèn)locale了,不過也有可能不是,例如有些系統(tǒng)使用中文locale
zh_CN.GB18030。在locale為utf-8的情況下,啟動(dòng)vim后encoding將會設(shè)置為utf-8,這是兼容性最好的方式,因?yàn)閮?nèi)部
處理使用utf-8的話,無論外部存儲編碼為何都可以進(jìn)行無缺損轉(zhuǎn)換。locale決定了vim內(nèi)部處理數(shù)據(jù)的編碼,也就是encoding。
2,文件的編碼以及自動(dòng)編碼識別—-這方面牽扯到各種編碼的規(guī)則,就不一一細(xì)講了。但需要明白的是,文件編碼類型并不是保存在文件內(nèi)的,也就是說沒有任何
描述性的字段來記錄文檔是何種編碼類型的。因此我們在編輯文檔的時(shí)候,要么必須知道這文檔保存時(shí)是以什么編碼保存的,要么通過另外的一些手段來斷定編碼類
型,這另外的手段,就是通過某些編碼的碼表特征來斷定,例如每個(gè)字符占用的字節(jié)數(shù),每個(gè)字符的ascii值是否都大于某個(gè)字段來斷定這個(gè)文件屬于何種編
碼。這種方式vim也使用了,這就是vim的自動(dòng)編碼識別機(jī)制了。但這種機(jī)制由于編碼各式各樣,不可能每種編碼都有顯著的特征來辨別,所以是不可能
100%準(zhǔn)確的。對于我們GB2312編碼,由于其中文是使用了2個(gè)acsii值高于127的字符組成漢字字符的,因此不可能把gb2312編碼的文件與
latin1編碼區(qū)分開來,因此自動(dòng)識別編碼的機(jī)制對于gb2312是不成功的,它只會將文件辨識為latin1編碼。此問題同樣出現(xiàn)在gbk,big5
上等。因此我們在編輯此類文檔時(shí),需要手工設(shè)定encoding和fileencoding。如果文檔編碼為utf-8時(shí),一般vim都能自動(dòng)識別正確的
編碼。
3,客戶運(yùn)行vim的終端所使用的編碼類型—-同第二條一樣,這也是一個(gè)比較難以斷定的關(guān)鍵點(diǎn)。第二個(gè)關(guān)鍵點(diǎn)決定著從文件讀取內(nèi)容和寫入內(nèi)容到文件
時(shí)使用的編碼,而此關(guān)鍵點(diǎn)則決定vim輸出內(nèi)容到終端時(shí)使用的編碼,如果此編碼類型和終端認(rèn)為它收到的數(shù)據(jù)的編碼類型不同,則又會產(chǎn)生亂碼問題。在
linux本地X環(huán)境下,一般終端都認(rèn)為其接收的數(shù)據(jù)的編碼類型和系統(tǒng)locale類型相符,因此不需關(guān)心此方面是否存在問題。但如果牽涉到遠(yuǎn)程終端,例
如ssh登錄服務(wù)器,則問題就有可能出現(xiàn)了。例如從1臺locale為GB2310的系統(tǒng)(稱作客戶機(jī))ssh到locale為utf-8的系統(tǒng)(稱作服
務(wù)器)并開啟vim編輯文檔,在不加任何改動(dòng)的情況下,服務(wù)器返回的數(shù)據(jù)為utf-8的,但客戶機(jī)認(rèn)為服務(wù)器返回的數(shù)據(jù)是gb2312的,按照
gb2312來解釋數(shù)據(jù),則肯定就是亂碼了,這時(shí)就需要設(shè)置termencoding為gb2312來解決這個(gè)問題。此問題更多出現(xiàn)在我們的
windows
desktop機(jī)遠(yuǎn)程ssh登錄服務(wù)器的情況下,這里牽扯到不同系統(tǒng)的編碼轉(zhuǎn)換問題。所以又與windows本身以及ssh客戶端有很大相關(guān)性。在
windows下存在兩種編碼類型的軟件,一種是本身就為unicode編碼方式編寫的軟件,一種是ansi軟件,也就是程序處理數(shù)據(jù)直接采用字節(jié)流,不
關(guān)心編碼。前一種程序可以在任何語言的windows上正確顯示多國語言,而后一種則編寫在何種語言的系統(tǒng)上則只能在何種語言的系統(tǒng)上顯示正確的文字。對
于這兩種類型的程序,我們需要區(qū)別對待。以ssh客戶端為例,我們使用的putty是unicode軟件,而secure CRT則是ansi
軟件。對于前者,我們要正確處理中文,只要保證vim輸出到終端的編碼為utf-8即可,就是termencoding=utf-8。但對于后者,一方面
我們要確認(rèn)我們的windows系統(tǒng)默認(rèn)代碼頁為cp936(中文windows默認(rèn)值),另一方面要確認(rèn)vim設(shè)置的termencoding=
cp936。
最后來看看處理中文文檔最典型的幾種情況和設(shè)置方式:
1,系統(tǒng)locale是utf-8(很多l(xiāng)inux系統(tǒng)默認(rèn)的locale形式),編輯的文檔是GB2312或GBK形式的(Windows記事本
默認(rèn)保存形式,大部分編輯器也默認(rèn)保存為這個(gè)形式,所以最常見),終端類型utf-8(也就是假定客戶端是putty類的unicode軟件)
則vim打開文檔后,encoding=utf-8(locale決定的),fileencoding=latin1(自動(dòng)編碼判斷機(jī)制不準(zhǔn)導(dǎo)致的),termencoding=空(默認(rèn)無需轉(zhuǎn)換term編碼),顯示文件為亂碼。
解決方案1:首先要修正fileencoding為cp936或者euc-cn(二者一樣的,只不過叫法不同),注意修正的方法不是:set
fileencoding=cp936,這只是將文件保存為cp936,正確的方法是重新以cp936的編碼方式加載文件為:edit
++enc=cp936,可以簡寫為:e ++enc=cp936。
解決方案2:臨時(shí)改變vim運(yùn)行的locale環(huán)境,方法是以LANG=zh_CN vim
abc.txt的方式來啟動(dòng)vim,則此時(shí)encoding=euc-cn(locale決定的),fileencoding=空(此locale下文件
編碼自動(dòng)判別功能不啟用,所以fileencoding為文件本身編碼方式不變,也就是euc-cn),termencoding=空(默認(rèn)值,為空則等
于encoding)此時(shí)還是亂碼的,因?yàn)槲覀兊膕sh終端認(rèn)為接受的數(shù)據(jù)為utf-8,但vim發(fā)送數(shù)據(jù)為euc-cn,所以還是不對。此時(shí)再用命令:
set termencoding=utf-8將終端數(shù)據(jù)輸出為utf-8,則顯示正常。
2,情況與1基本相同,只是使用的ssh軟件為secure CRT類ansi類軟件。
vim打開文檔后,encoding=utf-8(locale決定的),fileencoding=latin1(自動(dòng)編碼判斷機(jī)制不準(zhǔn)導(dǎo)致的),termencoding=空(默認(rèn)無需轉(zhuǎn)換term編碼),顯示文件為亂碼。
解決方案1:首先要保證運(yùn)行secure CRT的windows機(jī)器的默認(rèn)代碼頁為CP936,這一點(diǎn)中文windows已經(jīng)是默認(rèn)設(shè)置了。其他的與上面方案1相同,只是要增加一步,:set termencoding=cp936
解決方案2:與上面方案2類似,不過最后一步修改termencoding省略即可,在此情況下需要的修改最少,只要以locale為zh_CN開
啟vim,則encoding=euc-cn,fileencoding和termencoding都為空即為encoding的值,是最理想的一種情
況。
可見理解這3個(gè)關(guān)鍵點(diǎn)和3個(gè)參數(shù)的意義,對于編碼問題有很大助力,以后就可以隨心所欲的處理文檔了,同時(shí)不僅僅是應(yīng)用于vim,在其他需要編碼轉(zhuǎn)換的環(huán)境里,都可以應(yīng)用類似的思路來處理問題解決問題。
最后推薦一款功能強(qiáng)大的windows下的ssh客戶端—-xshell,它具有類似secure CRT一樣的多tab
的ssh窗口的能力,但最為方便的是這款工具還有改變Term編碼的功能,這樣我們就可以不用頻繁調(diào)整termencoding,只需在ssh軟件里切換
編碼即可,這是我用過的最為方便的ssh工具。它是商業(yè)軟件,但非注冊用戶使用沒有任何限制,只是30天試用期超出后會每次啟動(dòng)都提示注冊,對于功能沒有
絲毫影響。

關(guān)于VIM編碼問題的解決


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 成人深夜视频在线观看 | 看片一区 | 91高清免费 | 亚洲欧美视频一区二区 | 中国精品久久 | 久在线看 | 51国产视频 | 精品久久一二三区 | 羞羞色院91蜜桃在线观看 | 国产成久久免费精品AV片天堂 | 欧美激情综合亚洲五月蜜桃 | 亚洲三区视频 | 久色激情 | 亚洲欧美一区二区三区综合 | 在线成人免费视频 | 国产欧美日韩精品一区二 | 亚洲国产日韩欧美综合久久 | 一级做一级爱a做片性视频视频 | 久久亚洲国产精品 | 亚洲精品成人 | 国产尤物在线观看一区二区 | 中国av在线| 久久精品人人做人人看最新章 | av一区在线观看 | 欧美成人h版在线观看 | 天堂成人 | 亚洲日韩欧美综合 | 私房色播 | 亚洲午夜精品一区二区三区 | 色就是色网站 | 午夜男人天堂 | 国产精品一二三 | 香蕉久久久久久 | 亚洲AV久久久噜噜噜久久 | 一区二区三区免费在线观看 | 亚洲免费黄色 | 久草新视频 | 91.成人天堂一区 | 天天操一操 | 亚洲狠狠丁香婷婷综合久久久 | 久久综合玖玖爱中文字幕 |