在线观看一级毛片高清无码_国产精品理论电影_日本中文字幕精品理论在线_国产色司机在线视频免费观看

首頁>茶油設備>談談RDD,DataFrame,Dataset的區(qū)別和各自的優(yōu)勢

談談RDD,DataFrame,Dataset的區(qū)別和各自的優(yōu)勢

來源:www.ehwe.cn   時間:2024-11-27 13:21   點擊:64   編輯:niming   手機版

一、談談RDD,DataFrame,Dataset的區(qū)別和各自的優(yōu)勢

RDD、DataFrame和DataSet是容易產生混淆的概念,必須對其相互之間對比,才可以知道其中異同。

RDD和DataFrame

RDD-DataFrame

上圖直觀地體現(xiàn)了DataFrame和RDD的區(qū)別。左側的RDD[Person]雖然以Person為類型參數,但Spark框架本身不了解

Person類的內部結構。而右側的DataFrame卻提供了詳細的結構信息,使得Spark

SQL可以清楚地知道該數據集中包含哪些列,每列的名稱和類型各是什么。DataFrame多了數據的結構信息,即schema。RDD是分布式的

Java對象的集合。DataFrame是分布式的Row對象的集合。DataFrame除了提供了比RDD更豐富的算子以外,更重要的特點是提升執(zhí)行效

率、減少數據讀取以及執(zhí)行計劃的優(yōu)化,比如filter下推、裁剪等。

提升執(zhí)行效率

RDD

API是函數式的,強調不變性,在大部分場景下傾向于創(chuàng)建新對象而不是修改老對象。這一特點雖然帶來了干凈整潔的API,卻也使得Spark應用程序在運

行期傾向于創(chuàng)建大量臨時對象,對GC造成壓力。在現(xiàn)有RDD

API的基礎之上,我們固然可以利用mapPartitions方法來重載RDD單個分片內的數據創(chuàng)建方式,用復用可變對象的方式來減小對象分配和GC的

開銷,但這犧牲了代碼的可讀性,而且要求開發(fā)者對Spark運行時機制有一定的了解,門檻較高。另一方面,Spark

SQL在框架內部已經在各種可能的情況下盡量重用對象,這樣做雖然在內部會打破了不變性,但在將數據返回給用戶時,還會重新轉為不可變數據。利用

DataFrame API進行開發(fā),可以免費地享受到這些優(yōu)化效果。

減少數據讀取

分析大數據,最快的方法就是 ——忽略它。這里的“忽略”并不是熟視無睹,而是根據查詢條件進行恰當的剪枝。

上文討論分區(qū)表時提到的分區(qū)剪 枝便是其中一種——當查詢的過濾條件中涉及到分區(qū)列時,我們可以根據查詢條件剪掉肯定不包含目標數據的分區(qū)目錄,從而減少IO。

對于一些“智能”數據格 式,Spark

SQL還可以根據數據文件中附帶的統(tǒng)計信息來進行剪枝。簡單來說,在這類數據格式中,數據是分段保存的,每段數據都帶有最大值、最小值、null值數量等

一些基本的統(tǒng)計信息。當統(tǒng)計信息表名某一數據段肯定不包括符合查詢條件的目標數據時,該數據段就可以直接跳過(例如某整數列a某段的最大值為100,而查

詢條件要求a > 200)。

此外,Spark SQL也可以充分利用RCFile、ORC、Parquet等列式存儲格式的優(yōu)勢,僅掃描查詢真正涉及的列,忽略其余列的數據。

二、杭州哪里有賣修花堂化妝品的?

www.lushier.com

地????址: 浙江省杭州蕭山區(qū)佳境街45號

三、鋼化玻璃刮花了,能修嗎

是鋼化前刮痕還是鋼化后有刮痕,鋼化前刮花可用拋光機處理,鋼化后刮痕是沒有辦法的。 手提玻璃拋光機 主要特點: 手提拋光機主要用于玻璃表面微裂紋和花斑等的處理和加工,能夠對輕微受損的表面進行人工的打磨拋光處理,使受損的玻璃表面恢復平滑和光亮,常配合拋光粉一起使用。

四、栽了五年的樹苗初夏剪枝太狠,來年春天會活嗎?剪后也發(fā)了新芽,但夏天一到全曬枯了

栽了五年的樹苗,

初夏剪枝太狠,

來年春天會活嗎?

剪后也發(fā)了新芽,

但夏天一到全曬枯了,

可以看看主干有沒有死了,

假如沒有死當然是開春會發(fā)芽的。

感覺不錯,贊哦! (0)
下次努力,加油! (0)
網友評論僅供其表達個人看法,并不表明本站立場。
評論
    共 0 條評論
本站所發(fā)布的全部內容源于互聯(lián)網搬運,僅限于小范圍內傳播學習和文獻參考,請在下載后24小時內刪除!
如果有侵權之處請第—時間聯(lián)系我們刪除。敬請諒解!qq:2850716282@qq.com
山茶油 滇ICP備2021006107號-532
關于本站 聯(lián)系我們 特別鳴謝