最近在實習(xí),boss給布置了一個python的小任務(wù),學(xué)習(xí)過程中發(fā)現(xiàn)copy()和deepcopy()這對好基友實在是有點過分,搞的博主就有點傻傻分不清啊,但是呢本著一探到底的精神,還是要查資料搞清楚這對好基友的區(qū)別。
其實呢,copy()與deepcopy()之間的區(qū)分必須要涉及到python對于數(shù)據(jù)的存儲方式。
首先直接上結(jié)論:
―?C我們尋常意義的復(fù)制就是深復(fù)制,即將被復(fù)制對象完全再復(fù)制一遍作為獨立的新個體單獨存在。所以改變原有被復(fù)制對象不會對已經(jīng)復(fù)制出來的新對象產(chǎn)生影響。
―?C而淺復(fù)制并不會產(chǎn)生一個獨立的對象單獨存在,他只是將原有的數(shù)據(jù)塊打上一個新標(biāo)簽,所以當(dāng)其中一個標(biāo)簽被改變的時候,數(shù)據(jù)塊就會發(fā)生變化,另一個標(biāo)簽也會隨之改變。這就和我們尋常意義上的復(fù)制有所不同了。
對于簡單的 object,用 shallow copy 和 deep copy 沒區(qū)別
復(fù)雜的 object, 如 list 中套著 list 的情況,shallow copy 中的 子list,并未從原 object 真的「獨立」出來。也就是說,如果你改變原 object 的子 list 中的一個元素,你的 copy 就會跟著一起變。這跟我們直覺上對「復(fù)制」的理解不同。
看不懂文字沒關(guān)系我們來看代碼:
>>> import copy >>> origin = [1, 2, [3, 4]] #origin 里邊有三個元素:1, 2,[3, 4] >>> cop1 = copy.copy(origin) >>> cop2 = copy.deepcopy(origin) >>> cop1 == cop2 True >>> cop1 is cop2 False #cop1 和 cop2 看上去相同,但已不再是同一個object >>> origin[2][0] = "hey!" >>> origin [1, 2, ['hey!', 4]] >>> cop1 [1, 2, ['hey!', 4]] >>> cop2 [1, 2, [3, 4]] #把origin內(nèi)的子list [3, 4] 改掉了一個元素,觀察 cop1 和 cop2
可以看到 cop1,也就是 shallow copy 跟著 origin 改變了。而 cop2 ,也就是 deep copy 并沒有變。
似乎 deep copy 更加符合我們對「復(fù)制」的直覺定義: 一旦復(fù)制出來了,就應(yīng)該是獨立的了。如果我們想要的是一個字面意義的「copy」,那就直接用 deep_copy 即可。
那么為什么會有 shallow copy 這樣的「假」 copy 存在呢? 這就是有意思的地方了。
python的數(shù)據(jù)存儲方式
Python 存儲變量的方法跟其他 OOP 語言不同。它與其說是把值賦給變量,不如說是給變量建立了一個到具體值的 reference。
當(dāng)在 Python 中 a = something 應(yīng)該理解為給 something 貼上了一個標(biāo)簽 a。當(dāng)再賦值給 a 的時候,就好象把 a 這個標(biāo)簽從原來的 something 上拿下來,貼到其他對象上,建立新的 reference。 這就解釋了一些 Python 中可能遇到的詭異情況:
>> a = [1, 2, 3] >>> b = a >>> a = [4, 5, 6] //賦新的值給 a >>> a [4, 5, 6] >>> b [1, 2, 3] # a 的值改變后,b 并沒有隨著 a 變 >>> a = [1, 2, 3] >>> b = a >>> a[0], a[1], a[2] = 4, 5, 6 //改變原來 list 中的元素 >>> a [4, 5, 6] >>> b [4, 5, 6] # a 的值改變后,b 隨著 a 變了
上面兩段代碼中,a 的值都發(fā)生了變化。區(qū)別在于,第一段代碼中是直接賦給了 a 新的值(從 [1, 2, 3] 變?yōu)?[4, 5, 6]);而第二段則是把 list 中每個元素分別改變。
而對 b 的影響則是不同的,一個沒有讓 b 的值發(fā)生改變,另一個變了。怎么用上邊的道理來解釋這個詭異的不同呢?
首次把 [1, 2, 3] 看成一個物品。a = [1, 2, 3] 就相當(dāng)于給這個物品上貼上 a 這個標(biāo)簽。而 b = a 就是給這個物品又貼上了一個 b 的標(biāo)簽。?
第一種情況:
a = [4, 5, 6] 就相當(dāng)于把 a 標(biāo)簽從 [1 ,2, 3] 上撕下來,貼到了 [4, 5, 6] 上。
在這個過程中,[1, 2, 3] 這個物品并沒有消失。 b 自始至終都好好的貼在 [1, 2, 3] 上,既然這個 reference 也沒有改變過。 b 的值自然不變。
第二種情況:
a[0], a[1], a[2] = 4, 5, 6 則是直接改變了 [1, 2, 3] 這個物品本身。把它內(nèi)部的每一部分都重新改裝了一下。內(nèi)部改裝完畢后,[1, 2, 3] 本身變成了 [4, 5, 6]。
而在此過程當(dāng)中,a 和 b 都沒有動,他們還貼在那個物品上。因此自然 a b 的值都變成了 [4, 5, 6]。
搞明白這個之后就要問了,對于一個復(fù)雜對象的淺copy,在copy的時候到底發(fā)生了什么?
再看一段代碼:
>>> import copy >>> origin = [1, 2, [3, 4]] #origin 里邊有三個元素:1, 2,[3, 4] >>> cop1 = copy.copy(origin) >>> cop2 = copy.deepcopy(origin) >>> cop1 == cop2 True >>> cop1 is cop2 False #cop1 和 cop2 看上去相同,但已不再是同一個object >>> origin[2][0] = "hey!" >>> origin [1, 2, ['hey!', 4]] >>> cop1 [1, 2, ['hey!', 4]] >>> cop2 [1, 2, [3, 4]] #把origin內(nèi)的子list [3, 4] 改掉了一個元素,觀察 cop1 和 cop2
學(xué)過docker的人應(yīng)該對鏡像這個概念不陌生,我們可以把鏡像的概念套用在copy上面。?
copy對于一個復(fù)雜對象的子對象并不會完全復(fù)制,什么是復(fù)雜對象的子對象呢?就比如序列里的嵌套序列,字典里的嵌套序列等都是復(fù)雜對象的子對象。對于子對象,python會把它當(dāng)作一個公共鏡像存儲起來,所有對他的復(fù)制都被當(dāng)成一個引用,所以說當(dāng)其中一個引用將鏡像改變了之后另一個引用使用鏡像的時候鏡像已經(jīng)被改變了。
所以說看這里的origin[2],也就是 [3, 4] 這個 list。根據(jù) shallow copy 的定義,在 cop1[2] 指向的是同一個 list [3, 4]。那么,如果這里我們改變了這個 list,就會導(dǎo)致 origin 和 cop1 同時改變。這就是為什么上邊 origin[2][0] = “hey!” 之后,cop1 也隨之變成了 [1, 2, [‘hey!', 4]]。
deepcopy的時候會將復(fù)雜對象的每一層復(fù)制一個單獨的個體出來。
這時候的 origin[2] 和 cop2[2] 雖然值都等于 [3, 4],但已經(jīng)不是同一個 list了。即我們尋常意義上的復(fù)制。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
