hive源代碼解析之一hive主函數入口

系統 2019-08-12 09:27:38 4756 0

hive其實做的就是解析一條sql然后形成到mapreduce任務，就是一個代碼解釋器。hive源代碼本身就可以分為ql/metasotre/service/serde 這幾塊；其中

? 對于Hive來說，ql是整個Hive最最核心的一個模塊，Hive主要的功能都集中在這樣一個模塊中，即 org.apache.hadoop.hive.ql.*，其中最重要的幾個模塊：

parse：語法解析器和語義分析器，將SQL轉化為執行計劃。
optimizer：優化器，包括執行計劃Operator圖的改寫（邏輯優化）和Task圖的改寫（物理優化）
exec：執行器，作業提交和執行相關。
udf：Hive內置的用戶自定義函數，包括操作符加、減、乘、除、與、或、非，常用數學操作（sin、cos等）、字符串操作（substr、instr）、聚合操作（count、sum、avg等）等。

? ? ? 無論使用CLI、Thrift Server、JDBC還是自定義的提交工具，最終的HQL都會傳給Driver實例，執行Driver.run()方法。從這種設計也可以看出，如果您要開發一套自定義的Hive作業提交工具，最好的方式是引用Driver實例，調用相關方法進行開發。
? ? ? 而Driver.run()方法，獲得了這樣一個HQL，則會執行兩個重要的步驟：編譯和執行，即Driver.complie()和Driver.execute()。對于Driver.comile()來說，其實就是調用parse和optimizer包中的相關模塊，執行語法解析、語義分析、優化（回想一下大學時的編譯原理，編譯的過程是不是語法分析、語法解析、語義分析）；對于Driver.run()來說，其實就是調用exec包中的相關模塊，將解析后的執行計劃執行，如果解析后的結果是一個查詢計劃，那么通常的作法就是提交一系列的MapReduce作業。

以查詢的執行為例，整個Hive的流程是非常簡單的一條直線，由上到下進行。

hive源代碼解析之一hive主函數入口

對于main函數，其中主要做了三件事情：

（1）初始化各種配置和參數；

（2）循環執行解析執行各種命令；

hive源代碼解析之一hive主函數入口

更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索：z360901061

微信掃一掃加我為好友

QQ號聯系： 360901061

您的支持是博主寫作最大的動力，如果您喜歡我的文章，感覺我的文章對您有幫助，請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧，狠狠點擊下面給點支持吧，站長非常感激您！手機微信長按不能支付解決辦法：請將微信支付二維碼保存到相冊，切換到微信，然后點擊微信右上角掃一掃功能，選擇支付二維碼完成支付。

【本文對您有幫助就好】元

2元

5元

10元

20元

自定義

發表我的評論

最新評論總共0條評論