同事問了一個(gè)非常簡(jiǎn)單的問題,怎么取出每個(gè)partition里面另外一個(gè)列的最小值?
create table t1 (int c1, int c2);
?
假如按照c2分區(qū),0-10,10-20,20-30,30-40,40-50
?
insert into t1 values(101, 1);
insert into t1 values(102, 2);
insert into t1 values(111, 11);
insert into t1 values(112, 12);
insert into t1 values(121, 21);
insert into t1 values(122, 22);
insert into t1 values(131, 31);
insert into t1 values(132, 32);
insert into t1 values(133, 32);
insert into t1 values(132, 33);
insert into t1 values(141, 41);
insert into t1 values(142, 42);
insert into t1 values(142, 43);
?
本來這個(gè)問題非常簡(jiǎn)單,但今天死活想不出來了,居然繞著去看RANK系列的OLAP函數(shù),學(xué)習(xí)了好長(zhǎng)時(shí)間也發(fā)現(xiàn)沒辦法搞定。
其實(shí)只需要按照分區(qū)表的范圍取整數(shù)就可以了
?
select cast(c2/10 as integer), min(c1),max(c1) from t1
group by cast(c2/10 as integer);
?
輸出如下:
1 2 3
- --- ---
0 101 102
1 111 112
2 121 122
3 131 133
4 141 142
不過倒是又溫習(xí)了一下RANK系列函數(shù),簡(jiǎn)單總結(jié)一下:
RANK() 排名函數(shù) ,返回值是不連續(xù)的,如果有兩個(gè)相同的第一名,則第三個(gè)值為3
DENSE_RANK
() 奧運(yùn)冠軍排名函數(shù),返回值是連續(xù)的,可以并列第一,然后第二名,第三名
ROW_NUMBER() 連續(xù)值,基本可以看作ORACLE里的ROWNUM
OVER()可以加分區(qū)列或者列表達(dá)式,這樣在輸出max(c1)的時(shí)候如果分在一個(gè)區(qū),所有的值都是一樣的
?
SELECT c1,c2,CAST(C2/10 AS INTEGER),MAX(C1) OVER( PARTITION BY CAST(C2/10 AS INTEGER)) FROM T1;
?
得到如下輸出:
C1 C2 3 4
--- -- - ---
101 1 0 102
102 2 0 102
111 11 1 112
112 12 1 112
121 21 2 122
122 22 2 122
131 31 3 133
132 33 3 133
133 32 3 133
132 32 3 133
141 41 4 142
142 43 4 142
142 42 4 142
OVER 內(nèi)還可以加ORDER BY 用來指定排序的時(shí)候用那個(gè)column
另外一個(gè)非常有用的功能是窗口函數(shù)可以在OVER()內(nèi)指定rows或者range來指定以當(dāng)前行為范圍的一個(gè)窗口,在這個(gè)窗口內(nèi)來進(jìn)行聚集函數(shù)的計(jì)算。
比如, 我想看看某商品當(dāng)前日期的價(jià)格和此前30天的平均價(jià)格:
?
SELECT c1 as price,c2 as days,avg(C1) OVER(
order by c2 range 30 PRECEDING
) as avg_price
FROM T1;
?
結(jié)果如下:
PRICE DAYS AVG_PRICE
----- ---- ---------
101 1 101
102 2 101
111 11 104
112 12 106
121 21 109
122 22 111
131 31 114
132 32 120
133 32 120
132 33 124
141 41 126
142 42 129
142 43 132
在我想來,窗口函數(shù)最有用的功能是看當(dāng)前股票價(jià)格和此前一段時(shí)間的平均價(jià)格。
這就是OLAP之RANK系列函數(shù)的簡(jiǎn)單介紹,有了這些知識(shí)之后應(yīng)該可以很快的寫出更多更加有用的SQL。我的感覺是RANK系列函數(shù)相當(dāng)于在處理每一行的數(shù)據(jù)的同時(shí)都可以為某其它列帶著group by,非常強(qiáng)大。但千萬注意,這里面的任何函數(shù)都會(huì)導(dǎo)致掃面非常多的數(shù)據(jù),所以這類SQL的性能不會(huì)太好,千萬在online的程序中慎用。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061
微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元

