一级全黄生活片,亚洲高清在线,萌白酱JK白丝喷水视频在线

首先由一個程序引入話題：

    
1 //環境：vc6 + windows sp2
 2 //程序1
 3 #include <iostream>
 4 
 5 using namespace std;
 6 
 7 struct st1 
 8 {
 9     char a ;
10     int  b ;
11     short c ;
12 };
13 
14 struct st2
15 {
16     short c ;
17     char  a ;
18     int   b ;
19 };
20 
21 int main()
22 {
23     cout<<"sizeof(st1) is "<<sizeof(st1)<<endl;
24     cout<<"sizeof(st2) is "<<sizeof(st2)<<endl;
25     return 0 ;
26 }

程序的輸出結果為：

sizeof(st1) is 12
sizeof(st2) is 8

問題出來了，這兩個一樣的結構體，為什么sizeof的時候大小不一樣呢？

本文的主要目的就是解釋明白這一問題。

內存對齊，正是因為內存對齊的影響，導致結果不同。

對于大多數的程序員來說，內存對齊基本上是透明的，這是編譯器該干的活，編譯器為程序中的每個數據單元安排在合適的位置上，從而導致了相同的變量，不同聲明順序的結構體大小的不同。

那么編譯器為什么要進行內存對齊呢？程序1中結構體按常理來理解sizeof(st1)和sizeof(st2)結果都應該是7，4(int) + 2(short) + 1(char) = 7 。經過內存對齊后，結構體的空間反而增大了。

在解釋內存對齊的作用前，先來看下內存對齊的規則：

1、? 對于結構的各個成員，第一個成員位于偏移為0的位置，以后每個數據成員的偏移量必須是min(#pragma pack()指定的數，這個數據成員的自身長度) 的倍數。

2、? 在數據成員完成各自對齊之后，結構(或聯合)本身也要進行對齊，對齊將按照#pragma pack指定的數值和結構(或聯合)最大數據成員長度中，比較小的那個進行。

#pragma pack(n) 表示設置為n字節對齊。 VC6默認8字節對齊

以程序1為例解釋對齊的規則：

St1 ：char占一個字節，起始偏移為0 ，int 占4個字節，min(#pragma pack()指定的數，這個數據成員的自身長度) = 4（VC6默認8字節對齊），所以int按4字節對齊，起始偏移必須為4的倍數，所以起始偏移為4，在char后編譯器會添加3個字節的額外字節，不存放任意數據。short占2個字節，按2字節對齊，起始偏移為8，正好是2的倍數，無須添加額外字節。到此規則1的數據成員對齊結束，此時的內存狀態為：

oxxx|oooo|oo
0123 4567 89 （地址）

（x表示額外添加的字節）

共占10個字節。還要繼續進行結構本身的對齊，對齊將按照#pragma pack指定的數值和結構(或聯合)最大數據成員長度中，比較小的那個進行，st1結構中最大數據成員長度為int，占4字節，而默認的#pragma pack 指定的值為8，所以結果本身按照4字節對齊，結構總大小必須為4的倍數，需添加2個額外字節使結構的總大小為12 。此時的內存狀態為：

oxxx|oooo|ooxx
0123 4567 89ab? （地址）

到此內存對齊結束。St1占用了12個字節而非7個字節。
St2 的對齊方法和st1相同，讀者可自己完成。

內存對齊的主要作用是：

1、? 平臺原因(移植原因)：不是所有的硬件平臺都能訪問任意地址上的任意數據的；某些硬件平臺只能在某些地址處取某些特定類型的數據，否則拋出硬件異常。

2、? 性能原因：經過內存對齊后，CPU的內存訪問速度大大提升。具體原因稍后解釋。

圖一：

這是普通程序員心目中的內存印象，由一個個的字節組成，而CPU并不是這么看待的。

圖二：

CPU把內存當成是一塊一塊的，塊的大小可以是2，4，8，16字節大小，因此CPU在讀取內存時是一塊一塊進行讀取的。塊大小成為memory access granularity（粒度）本人把它翻譯為“內存讀取粒度” 。

假設CPU要讀取一個int型4字節大小的數據到寄存器中，分兩種情況討論：

1、數據從0字節開始

2、數據從1字節開始

再次假設內存讀取粒度為4。

圖三：

當該數據是從0字節開始時，很CPU只需讀取內存一次即可把這4字節的數據完全讀取到寄存器中。

??? 當該數據是從1字節開始時，問題變的有些復雜，此時該int型數據不是位于內存讀取邊界上，這就是一類內存未對齊的數據。

圖四：

此時CPU先訪問一次內存，讀取0—3字節的數據進寄存器，并再次讀取4—5字節的數據進寄存器，接著把0字節和6，7，8字節的數據剔除，最后合并1，2，3，4字節的數據進寄存器。對一個內存未對齊的數據進行了這么多額外的操作，大大降低了CPU性能。

??? 這還屬于樂觀情況了，上文提到內存對齊的作用之一為平臺的移植原因，因為以上操作只有有部分CPU肯干，其他一部分CPU遇到未對齊邊界就直接down掉了。

內存對齊的規則以及作用

更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索：z360901061

微信掃一掃加我為好友

QQ號聯系： 360901061

您的支持是博主寫作最大的動力，如果您喜歡我的文章，感覺我的文章對您有幫助，請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧，狠狠點擊下面給點支持吧，站長非常感激您！手機微信長按不能支付解決辦法：請將微信支付二維碼保存到相冊，切換到微信，然后點擊微信右上角掃一掃功能，選擇支付二維碼完成支付。

【本文對您有幫助就好】元

2元

5元

10元

20元

自定義