新聞中心
Hive和Impala作為數(shù)據(jù)查詢(xún)工具,它們是怎樣來(lái)查詢(xún)數(shù)據(jù)的呢?與Impala和Hive進(jìn)行交互,我們有哪些工具可以使用呢?

我們首先明確Hive和Impala分別提供了對(duì)應(yīng)查詢(xún)的接口:
(1)命令行shell:
1、 Impala:impala shell
2、 Hive:beeline(早期hive的命令行版本是hive shell,現(xiàn)在基本不使用)
(2)Hue Web UI:
1.Hue里面提供了 Hive查詢(xún)編輯器
2.Hue里面提供了Impala查詢(xún)編輯器
3.Hue里面提供了元數(shù)據(jù)管理器,可以直接對(duì)元數(shù)據(jù)進(jìn)行訪(fǎng)問(wèn)。
(3)提供了JDBC和ODBC支持
下面進(jìn)行具體介紹:
一、Impala
(1)使用Impala shell
Impala shell是類(lèi)似于MySQL的交互式工具,可以直接在終端啟動(dòng)Impala shell,但是Impala shell在哪里啟動(dòng)很有講究。Impala本身是分布式的架構(gòu),它的Impalad是在每個(gè)slave節(jié)點(diǎn)中的。那么Impala按照如下這種情況直接執(zhí)行的話(huà)肯定是在slave節(jié)點(diǎn)中運(yùn)行的。

如果不是在slave節(jié)點(diǎn)中運(yùn)行的話(huà),可以指定它的server,像如下這種方式,通過(guò)—i的參數(shù),指定21000端口執(zhí)行。

Impala shell和所有的SQL一樣,輸入分號(hào)作為語(yǔ)句的結(jié)束,使用quit命令退出shell。如果需要查看幫助的話(huà)使用impala-shell --help查看完整的選項(xiàng)列表。因?yàn)槿魏蔚墓ぞ咚膮?shù)都是很多的,一定要習(xí)慣和學(xué)會(huì)使用幫助去找到自己想要的一些參數(shù),然后去解決一些復(fù)雜數(shù)據(jù)的分析和處理。
在Impala shell里面執(zhí)行查詢(xún)的示例:

(2)Impala與操作系統(tǒng)進(jìn)行交互
在Impala里面,我們有時(shí)候需要去執(zhí)行一些Linux的命令,比如查詢(xún)?nèi)掌冢h(yuǎn)程連接,訪(fǎng)問(wèn)目錄數(shù)據(jù)等,我們不需要退出Impala shell,直接操作就可以,比如:

但是Impala不直接支持HDFS命令,但是可以使用shell運(yùn)行hdfs dfs命令去創(chuàng)建一個(gè)目錄,如下:

(3)從命令行運(yùn)行Impala查詢(xún),可以不用登陸Impala shell就可以執(zhí)行,如:
1、 使用-f選項(xiàng)來(lái)執(zhí)行包含查詢(xún)的文件

2、 使用-q選項(xiàng)直接在命令行運(yùn)行查詢(xún)

3、 使用-o來(lái)將結(jié)果輸出到文件

二、Hive
(1)啟動(dòng)beeline
Hive shell是Hive早期版本,現(xiàn)在使用Beeline shell,跟Impala shell相似,但是它是基于JDBC和ODBC,如果需要使用Beeline的話(huà),需要去啟動(dòng)Hive2,通過(guò)為Hive2服務(wù)器指定URL來(lái)啟動(dòng)Beeline,這個(gè)時(shí)候還需要根據(jù)需要指定用戶(hù)名和密碼,如下:

(2)在Beeline執(zhí)行查詢(xún)
和SQL一樣以分號(hào)結(jié)束,執(zhí)行查詢(xún)和Impala shell類(lèi)似,但結(jié)果格式有少許不同,如:

(3)使用Beeline
和其他工具有一些不同,執(zhí)行查詢(xún)都是正常的SQL輸入,但是如果是一些管理的命令,比如進(jìn)行連接,中斷,退出,執(zhí)行Beeline命令需要帶上“!”,不需要終止符。常用命令介紹:
1、!connect url –連接不同的Hive2服務(wù)器
2、!exit –退出shell
3、!help –顯示全部命令列表
4、!verbose –顯示查詢(xún)追加的明細(xì)
示例:

(4)從命令行執(zhí)行Hive查詢(xún)
1、使用-f選項(xiàng)來(lái)執(zhí)行包含HiveQL代碼的文件

2、使用-e選項(xiàng)直接在命令行運(yùn)行HiveQL

3、使用--silent來(lái)阻止通知的消息輸出,也可以和-e或-f選項(xiàng)一起使用

三、Hue
(1)通過(guò)Hue訪(fǎng)問(wèn)Hive和Impala,它們各自都有editors,在Hue的query editors里面我們可以找到Hive和Impala的一些工具,
如下:

以及元數(shù)據(jù)庫(kù)我們可以在Data Browsers里面可以看到它的一些工具,如:

(2)Hue查詢(xún)編輯器,查詢(xún)Impala和Hive查詢(xún)編輯器幾乎相同,具體操作示意:

與Impala和Hive進(jìn)行交互,以上就是我們可以利用和使用的工具,但是在實(shí)際的操作中我們還需要加強(qiáng)自己的實(shí)戰(zhàn)能力才能更好的去掌握和理解。大數(shù)據(jù)作為當(dāng)下還在不斷完善發(fā)展的技術(shù),需要每一位想要從事和已經(jīng)從事它的人員不斷去學(xué)習(xí)和積累,更需要去交流和分享,共同進(jìn)步。“大數(shù)據(jù)cn”、“大數(shù)據(jù)時(shí)代學(xué)習(xí)中心”是我平時(shí)自己在自主學(xué)習(xí)過(guò)程中找到微信服務(wù)號(hào),里面介紹的關(guān)于大數(shù)據(jù)的知識(shí)以及大數(shù)據(jù)發(fā)展的一些行業(yè)知識(shí)都很不錯(cuò),平常大家可以看看。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線(xiàn),公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性?xún)r(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專(zhuān)為企業(yè)上云打造定制,能夠滿(mǎn)足用戶(hù)豐富、多元化的應(yīng)用場(chǎng)景需求。
分享題目:學(xué)習(xí)Hive和Impala必看經(jīng)典解析-創(chuàng)新互聯(lián)
當(dāng)前路徑:http://www.dlmjj.cn/article/jeich.html


咨詢(xún)
建站咨詢(xún)
