greenplum屬于分布式的數(shù)據(jù)庫,MPP+Share nothing的體系,查詢的效率很快.不過,這是建立在數(shù)據(jù)分散均勻的基礎(chǔ)上的.如果DK值設(shè)置不合理的話,完全有可能出現(xiàn)所有數(shù)據(jù)落在單個(gè)節(jié)點(diǎn)上的情況,這就體現(xiàn)不出優(yōu)勢來.因此,DK值的設(shè)置是否合適是建表的時(shí)候,需要考慮的重要因素之一.
????? 查看表(table_name)的數(shù)據(jù)在節(jié)點(diǎn)的分布情況:
select
gp_segment_id,
count
(
*
)
from
table_name
group
by
gp_segment_id;
如果數(shù)據(jù)有嚴(yán)重傾斜的話,即某些節(jié)點(diǎn)的數(shù)據(jù)量過大,表示DK值需要重新調(diào)整.調(diào)整語句為alter table table_name set distirbuted by(col1,col2,...);
???? 現(xiàn)在有個(gè)問題是:如何發(fā)現(xiàn)哪些DK值設(shè)置不合理的表呢?可以參照之前寫的文章: 數(shù)據(jù)分布查看 , 執(zhí)果索因調(diào)整
???? 這里介紹的是如何把DK值展現(xiàn)出現(xiàn),一般設(shè)置單列(該列為日期類型,每天一份的話)的表,就很有可能出現(xiàn)DK值不合理的情況。我們需要利用到三張表:
???? pg_class?????? --object屬性表,relkind表示object屬性,'r'代表table
???? pg_attribute? --展現(xiàn)詳細(xì)的列
???? gp_distribution_policy? --存儲(chǔ)DK值
首先,創(chuàng)建一個(gè)類型,用來顯示function的結(jié)果集.
create
type dk_table_type as
(
table_name
varchar
,
dk_cols
varchar
);
然后,用上面三張表組合起來,得到相應(yīng)的所需要的結(jié)果信息.
CREATE
OR
REPLACE
FUNCTION
get_table_dk()
RETURNS
SETOF dk_table_type
AS
$BODY$
DECLARE
v_cur_tb
cursor
for
select
d.nspname
||
'
.
'
||
a.relname,b.attname
from
pg_class a
inner
join
pg_attribute b
on
a.oid
=
b.attrelid
inner
join
gp_distribution_policy c
on
a.oid
=
c.localoid
inner
join
pg_namespace d
on
a.relnamespace
=
d.oid
where
a.relkind
=
'
r
'
and
b.attnum
=any
(c.attrnums)
order
by
d.nspname
||
'
.
'
||
a.relname,b.attname,b.attnum;
v_tb
varchar
(
500
):
=
''
;
v_tb_new
varchar
(
500
):
=
''
;
v_dk_col
varchar
(
100
):
=
''
;
v_dk_cols
varchar
(
1000
):
=
''
;
v_record
dk_table_type;
BEGIN
open
v_cur_tb;
loop
fetch
v_cur_tb
into
v_tb_new,v_dk_col;
if
not
found
THEN
exit
;
end
if
;
if
v_tb
=
''
and
v_dk_cols
=
''
then
v_tb :
=
v_tb_new;
v_dk_cols:
=
v_dk_col;
ELSEIF v_tb
<>
v_tb_new
THEN
select
v_tb,v_dk_cols
into
v_record;
return
next
v_record;
v_tb :
=
v_tb_new;
v_dk_cols:
=
v_dk_col;
ELSE
v_dk_cols:
=
v_dk_cols
||
'
,
'
||
v_dk_col;
end
if
;
end
loop;
select
v_tb,v_dk_cols
into
v_record;
return
next
v_record;
close
v_cur_tb;
end
;
$BODY$
LANGUAGE plpgsql VOLATILE;
然后,執(zhí)行select * from get_table_dk() 就可以獲得表以及其對(duì)應(yīng)的DK值(列),從而可以直觀的發(fā)現(xiàn)是否有些表需要調(diào)整,此時(shí)就用上面的gp_segment_id來驗(yàn)證.如果是的話,就進(jìn)行相應(yīng)的調(diào)整.
?
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061
微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元

