http://blog.sina.com.cn/s/blog_622a99700100pjv3.html
?
?嘗試解答以下問題:
????? 1.為什么cp的方式更新運行中進程的so,程序會coredump
????? 2.采用什么方式更新已經加載了的so,就可以避免coredump
?
我們的公共組件絕大部分都支持so形式的自定義插件,比如s++,qzhttp,ttc。在不停進程更新so的時候往往會產生coredump,并且肯定core得莫名其妙,core得讓人心碎。
?
先看一下用cp的方式更新so的時候發生了什么事情
strace cp new.so old.so #strace是人間利器
發現老的so被trunc了,這個過程發生的具體的事情是:
????? 1.應用程序通過dlopen打開so的時候,kernel通過mmap把so加載到進程地址空間,對應于vma里的幾個page.
????? 2.在這個過程中loader會把so里面引用的外部符號例如malloc printf等解析成真正的虛存地址。
????? 3.當so被cp覆蓋時,確切地說是被trunc時,kernel會把so文件在虛擬內的頁purge 掉。
????? 4.當運行到so里面的代碼時,因為物理內存中不再有實際的數據(僅存在于虛存空間內),會產生一次缺頁中斷。
????? 5.Kernel從so文件中copy一份到內存中去,a)但是這時的全局符號表并沒有經過解析,當調用到時就產生segment fault ,? b)如果需要的文件偏移大于新的so的地址范圍,就會產生bus error.
?
所以,如果用相同的so去覆蓋
????? A) 如果so 里面依賴了外部符號,coredump
????? B) 如果so里面沒有依賴外部符號,運氣不錯,不會coredump
?
所有問題的產生都是因為so被trunc了一把,所以如果不用turnc的方式就避免這個問題。Ok,該我們的install 上場了。
strace install new.so old.so
install 的方式跟cp不同,先unlink再creat,當unlink的時候,已經map的虛擬空間vma中的inode結點沒有變,只有inode結點的引用計數為0是,kernel才把它干掉。
也就是新的so和舊的so用的不是同一個inode結點,所以不會相互影響。這時只有得啟程序才會使用到新的so。所以采用這種方式的話就可以避免先stop進程,更新so,再重啟進程這樣比較耗時的操作。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
