MongoDB數(shù)據(jù)文件內(nèi)部結(jié)構(gòu)
有人在Quora上提問(wèn): MongoDB 數(shù)據(jù)文件 內(nèi)部的組織 結(jié)構(gòu) 是什么樣的。隨后10gen的工程師 Jared Rosoff 出來(lái)做了簡(jiǎn)短的回答。
每一個(gè)數(shù)據(jù)庫(kù)都有自己獨(dú)立的文件。如果你開(kāi)啟了directoryperdb選項(xiàng),那你每個(gè)庫(kù)的文件會(huì)單獨(dú)放在一個(gè)文件夾里。
數(shù)據(jù)庫(kù)文件在內(nèi)部會(huì)被切分成單個(gè)的塊,每個(gè)塊只保存一個(gè)名字空間的數(shù)據(jù)。在MongoDB中,名字空間用于區(qū)分不同的存儲(chǔ)類別。比如每個(gè)collection有一個(gè)獨(dú)立的名字空間,每個(gè)索引也有自己的名字空間。
在一個(gè)塊中,會(huì)保存多條記錄,每條記錄是BSON格式的,記錄與記錄之間通過(guò)雙向鏈表進(jìn)行連接。
索引數(shù)據(jù)也存在數(shù)據(jù)文件中,不過(guò)索引是被組織成B Tree結(jié)構(gòu),而不是雙向鏈表。
對(duì)每個(gè)數(shù)據(jù)庫(kù),有一個(gè)命名空間文件,用于保存每個(gè)名字空間對(duì)應(yīng)的元數(shù)據(jù)。我們通過(guò)查詢這些元數(shù)據(jù)來(lái)找到對(duì)應(yīng)的名字空間的存儲(chǔ)塊位置。
如果你開(kāi)啟了jorunaling日志,那么還會(huì)有一些文件存儲(chǔ)著你所有的操作記錄。
下面圖片摘自10gen工程師Mathias Stearn在MongoSV2011大會(huì)上的發(fā)言稿,手繪的數(shù)據(jù)文件結(jié)構(gòu)。
1.每個(gè)數(shù)據(jù)庫(kù)有相應(yīng)的數(shù)據(jù)文件和命名空間文件
2.數(shù)據(jù)文件從16MB開(kāi)始,新的數(shù)據(jù)文件比上一個(gè)文件大一倍,最大為2GB
3.文件使用MMAP進(jìn)行內(nèi)存映射,會(huì)將所有數(shù)據(jù)文件映射到內(nèi)存中,但是只是虛擬內(nèi)存,只有訪問(wèn)到這塊數(shù)據(jù)時(shí)才會(huì)交換到物理內(nèi)存。
4.MongoDB的數(shù)據(jù)文件映射到內(nèi)存表中的位置
5.使用32位機(jī)器的話,內(nèi)存地址最大可以標(biāo)識(shí)4GB內(nèi)存
6.但是在32位機(jī)器上,4GB內(nèi)存會(huì)有1GB被內(nèi)核戰(zhàn)用,大約0.5GB會(huì)用于mongod進(jìn)程的stack空間,只剩下大約2.5GB可用于映射數(shù)據(jù)文件。
7.在64位機(jī)器上則最多可以表示128TB的空間
8.每個(gè)數(shù)據(jù)文件會(huì)被分成一個(gè)一個(gè)的數(shù)據(jù)塊,塊與塊之間用雙向鏈表連接
9.在名字空間文件中,保存的是一個(gè)hash table,保存了每個(gè)名字空間的存儲(chǔ)信息元數(shù)據(jù),包括其大小,塊數(shù),第一塊位置,最后一塊位置,被刪除的塊的鏈表以及索引信息
10.這些位置通過(guò)DiskLoc數(shù)據(jù)結(jié)構(gòu)進(jìn)行存儲(chǔ),存儲(chǔ)了數(shù)據(jù)文件編號(hào)和塊在文件中的位置
11.對(duì)每一個(gè)塊來(lái)說(shuō),其頭部包含了一些塊的元數(shù)據(jù),比如自己的位置,上一個(gè)和下一個(gè)塊的位置以及塊中第一條和最后一條記錄的位置指針。剩下的部分用于存儲(chǔ)具體的數(shù)據(jù),具體數(shù)據(jù)之間也是通過(guò)雙向鏈接來(lái)進(jìn)行連接。
12.下面是B Tree的存儲(chǔ)結(jié)構(gòu)和工作原理
anyShare 贈(zèng)人玫瑰,手有余香,分享知識(shí),德藝雙馨! |
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
