首先由一個程序引入話題:
程序的輸出結果為:
sizeof(st1) is 12
sizeof(st2) is 8
問題出來了,這兩個一樣的結構體,為什么sizeof的時候大小不一樣呢?
本文的主要目的就是解釋明白這一問題。
內存對齊,正是因為內存對齊的影響,導致結果不同。
對于大多數的程序員來說,內存對齊基本上是透明的,這是編譯器該干的活,編譯器為程序中的每個數據單元安排在合適的位置上,從而導致了相同的變量,不同聲明順序的結構體大小的不同。
那么編譯器為什么要進行內存對齊呢?程序1中結構體按常理來理解sizeof(st1)和sizeof(st2)結果都應該是7,4(int) + 2(short) + 1(char) = 7 。經過內存對齊后,結構體的空間反而增大了。
在解釋內存對齊的作用前,先來看下內存對齊的規則:
<!--[if !supportLists]-->1、? <!--[endif]-->對于結構的各個成員,第一個成員位于偏移為0的位置,以后每個數據成員的偏移量必須是min(#pragma pack()指定的數,這個數據成員的自身長度) 的倍數。
<!--[if !supportLists]-->2、? <!--[endif]-->在數據成員完成各自對齊之后,結構(或聯合)本身也要進行對齊,對齊將按照#pragma pack指定的數值和結構(或聯合)最大數據成員長度中,比較小的那個進行。
#pragma pack(n) 表示設置為n字節對齊。 VC6默認8字節對齊
以程序1為例解釋對齊的規則 :
St1 :char占一個字節,起始偏移為0 ,int 占4個字節,min(#pragma pack()指定的數,這個數據成員的自身長度) = 4(VC6默認8字節對齊),所以int按4字節對齊,起始偏移必須為4的倍數,所以起始偏移為4,在char后編譯器會添加3個字節的額外字節,不存放任意數據。short占2個字節,按2字節對齊,起始偏移為8,正好是2的倍數,無須添加額外字節。到此規則1的數據成員對齊結束,此時的內存狀態為:
oxxx|oooo|oo
0123 4567 89 (地址)
(x表示額外添加的字節)
共占10個字節。還要繼續進行結構本身的對齊,對齊將按照#pragma pack指定的數值和結構(或聯合)最大數據成員長度中,比較小的那個進行,st1結構中最大數據成員長度為int,占4字節,而默認的#pragma pack 指定的值為8,所以結果本身按照4字節對齊,結構總大小必須為4的倍數,需添加2個額外字節使結構的總大小為12 。此時的內存狀態為:
oxxx|oooo|ooxx
0123 4567 89ab? (地址)
到此內存對齊結束。St1占用了12個字節而非7個字節。
St2 的對齊方法和st1相同,讀者可自己完成。
內存對齊的主要作用是:
<!--[if !supportLists]-->1、? <!--[endif]-->平臺原因(移植原因):不是所有的硬件平臺都能訪問任意地址上的任意數據的;某些硬件平臺只能在某些地址處取某些特定類型的數據,否則拋出硬件異常。
<!--[if !supportLists]-->2、? <!--[endif]-->性能原因:經過內存對齊后,CPU的內存訪問速度大大提升。具體原因稍后解釋。
圖一:
這是普通程序員心目中的內存印象,由一個個的字節組成,而CPU并不是這么看待的。
圖二:
CPU把內存當成是一塊一塊的,塊的大小可以是2,4,8,16字節大小,因此CPU在讀取內存時是一塊一塊進行讀取的。塊大小成為memory access granularity(粒度) 本人把它翻譯為“內存讀取粒度” 。
假設CPU要讀取一個int型4字節大小的數據到寄存器中,分兩種情況討論:
<!--[if !supportLists]-->1、<!--[endif]-->數據從0字節開始
<!--[if !supportLists]-->2、<!--[endif]-->數據從1字節開始
再次假設內存讀取粒度為4。
圖三:
當該數據是從0字節開始時,很CPU只需讀取內存一次即可把這4字節的數據完全讀取到寄存器中。
??? 當該數據是從1字節開始時,問題變的有些復雜,此時該int型數據不是位于內存讀取邊界上,這就是一類內存未對齊的數據。
圖四:
此時CPU先訪問一次內存,讀取0—3字節的數據進寄存器,并再次讀取4—5字節的數據進寄存器,接著把0字節和6,7,8字節的數據剔除,最后合并1,2,3,4字節的數據進寄存器。對一個內存未對齊的數據進行了這么多額外的操作,大大降低了CPU性能。
??? 這還屬于樂觀情況了,上文提到內存對齊的作用之一為平臺的移植原因,因為以上操作只有有部分CPU肯干,其他一部分CPU遇到未對齊邊界就直接down掉了。
1 //環境:vc6 + windows sp2 2 //程序1 3 #include <iostream> 4 5 using namespace std; 6 7 struct st1 8 { 9 char a ; 10 int b ; 11 short c ; 12 }; 13 14 struct st2 15 { 16 short c ; 17 char a ; 18 int b ; 19 }; 20 21 int main() 22 { 23 cout<<"sizeof(st1) is "<<sizeof(st1)<<endl; 24 cout<<"sizeof(st2) is "<<sizeof(st2)<<endl; 25 return 0 ; 26 }
程序的輸出結果為:
sizeof(st1) is 12
sizeof(st2) is 8
問題出來了,這兩個一樣的結構體,為什么sizeof的時候大小不一樣呢?
本文的主要目的就是解釋明白這一問題。
內存對齊,正是因為內存對齊的影響,導致結果不同。
對于大多數的程序員來說,內存對齊基本上是透明的,這是編譯器該干的活,編譯器為程序中的每個數據單元安排在合適的位置上,從而導致了相同的變量,不同聲明順序的結構體大小的不同。
那么編譯器為什么要進行內存對齊呢?程序1中結構體按常理來理解sizeof(st1)和sizeof(st2)結果都應該是7,4(int) + 2(short) + 1(char) = 7 。經過內存對齊后,結構體的空間反而增大了。
在解釋內存對齊的作用前,先來看下內存對齊的規則:
<!--[if !supportLists]-->1、? <!--[endif]-->對于結構的各個成員,第一個成員位于偏移為0的位置,以后每個數據成員的偏移量必須是min(#pragma pack()指定的數,這個數據成員的自身長度) 的倍數。
<!--[if !supportLists]-->2、? <!--[endif]-->在數據成員完成各自對齊之后,結構(或聯合)本身也要進行對齊,對齊將按照#pragma pack指定的數值和結構(或聯合)最大數據成員長度中,比較小的那個進行。
#pragma pack(n) 表示設置為n字節對齊。 VC6默認8字節對齊
以程序1為例解釋對齊的規則 :
St1 :char占一個字節,起始偏移為0 ,int 占4個字節,min(#pragma pack()指定的數,這個數據成員的自身長度) = 4(VC6默認8字節對齊),所以int按4字節對齊,起始偏移必須為4的倍數,所以起始偏移為4,在char后編譯器會添加3個字節的額外字節,不存放任意數據。short占2個字節,按2字節對齊,起始偏移為8,正好是2的倍數,無須添加額外字節。到此規則1的數據成員對齊結束,此時的內存狀態為:
oxxx|oooo|oo
0123 4567 89 (地址)
(x表示額外添加的字節)
共占10個字節。還要繼續進行結構本身的對齊,對齊將按照#pragma pack指定的數值和結構(或聯合)最大數據成員長度中,比較小的那個進行,st1結構中最大數據成員長度為int,占4字節,而默認的#pragma pack 指定的值為8,所以結果本身按照4字節對齊,結構總大小必須為4的倍數,需添加2個額外字節使結構的總大小為12 。此時的內存狀態為:
oxxx|oooo|ooxx
0123 4567 89ab? (地址)
到此內存對齊結束。St1占用了12個字節而非7個字節。
St2 的對齊方法和st1相同,讀者可自己完成。
內存對齊的主要作用是:
<!--[if !supportLists]-->1、? <!--[endif]-->平臺原因(移植原因):不是所有的硬件平臺都能訪問任意地址上的任意數據的;某些硬件平臺只能在某些地址處取某些特定類型的數據,否則拋出硬件異常。
<!--[if !supportLists]-->2、? <!--[endif]-->性能原因:經過內存對齊后,CPU的內存訪問速度大大提升。具體原因稍后解釋。
圖一:

這是普通程序員心目中的內存印象,由一個個的字節組成,而CPU并不是這么看待的。
圖二:

CPU把內存當成是一塊一塊的,塊的大小可以是2,4,8,16字節大小,因此CPU在讀取內存時是一塊一塊進行讀取的。塊大小成為memory access granularity(粒度) 本人把它翻譯為“內存讀取粒度” 。
假設CPU要讀取一個int型4字節大小的數據到寄存器中,分兩種情況討論:
<!--[if !supportLists]-->1、<!--[endif]-->數據從0字節開始
<!--[if !supportLists]-->2、<!--[endif]-->數據從1字節開始
再次假設內存讀取粒度為4。
圖三:

當該數據是從0字節開始時,很CPU只需讀取內存一次即可把這4字節的數據完全讀取到寄存器中。
??? 當該數據是從1字節開始時,問題變的有些復雜,此時該int型數據不是位于內存讀取邊界上,這就是一類內存未對齊的數據。
圖四:

此時CPU先訪問一次內存,讀取0—3字節的數據進寄存器,并再次讀取4—5字節的數據進寄存器,接著把0字節和6,7,8字節的數據剔除,最后合并1,2,3,4字節的數據進寄存器。對一個內存未對齊的數據進行了這么多額外的操作,大大降低了CPU性能。
??? 這還屬于樂觀情況了,上文提到內存對齊的作用之一為平臺的移植原因,因為以上操作只有有部分CPU肯干,其他一部分CPU遇到未對齊邊界就直接down掉了。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
