安庆大理运城常德铜陵江西
投稿投诉
江西南阳
嘉兴昆明
铜陵滨州
广东西昌
常德梅州
兰州阳江
运城金华
广西萍乡
大理重庆
诸暨泉州
安庆南充
武汉辽宁

Spark(六)RDD的血缘依赖

3月27日 长歌行投稿
  RDD依赖关系1。RDD血缘关系
  RDD只支持粗粒度转换,即在大量记录上执行的单个操作。将创建RDD的一系列Lineage(血统)记录下来,以便恢复丢失的分区。RDD的Lineage会记录RDD的元数据信息和转换行为,当该RDD的部分分区数据丢失时,它可以根据这些信息来重新运算和恢复丢失的数据分区。
  查看RDD的血缘方法:rdd。toDebugString
  示例description:RDD血缘依赖author:HaoWucreate:2020年08月04日objectDependeciedTest{defmain(args:Array〔String〕):Unit{valconfnewSparkConf()。setAppName(RDDTest)。setMaster(local〔〕)valscnewSparkContext(conf)valrdd1sc。makeRDD(List(1,2,3,4))。map(xx)println(rdd1。toDebugString)println()valrdd2rdd1。map(xx)println(rdd2。toDebugString)println()valrdd3rdd2。groupBy(xx)println(rdd3。toDebugString)println()rdd3。collect()}}
  结果(8)MapPartitionsRDD〔1〕atmapatDependeciedTest。scala:15〔〕ParallelCollectionRDD〔0〕atmakeRDDatDependeciedTest。scala:15〔〕(8)MapPartitionsRDD〔2〕atmapatDependeciedTest。scala:18〔〕MapPartitionsRDD〔1〕atmapatDependeciedTest。scala:15〔〕ParallelCollectionRDD〔0〕atmakeRDDatDependeciedTest。scala:15〔〕(8)ShuffledRDD〔4〕atgroupByatDependeciedTest。scala:21〔〕(8)MapPartitionsRDD〔3〕atgroupByatDependeciedTest。scala:21〔〕MapPartitionsRDD〔2〕atmapatDependeciedTest。scala:18〔〕MapPartitionsRDD〔1〕atmapatDependeciedTest。scala:15〔〕ParallelCollectionRDD〔0〕atmakeRDDatDependeciedTest。scala:15〔〕2。依赖关系
  依赖关系:当前RDD和和父RDD之间的依赖关系
  查看依赖关系方法:rdd。dependencies
  示例description:RDD依赖关系author:HaoWucreate:2020年08月04日objectDependeciedTest{defmain(args:Array〔String〕):Unit{valconfnewSparkConf()。setAppName(RDDTest)。setMaster(local〔〕)valscnewSparkContext(conf)valrdd1sc。makeRDD(List(1,2,3,4))println(rdd1。dependencies)println()valrdd2rdd1。map(xx)println(rdd2。dependencies)println()valrdd3rdd2。groupBy(xx)println(rdd3。dependencies)println()rdd3。collect()}}
  结果不依赖于任何RDDList()1对1(1父1子)依赖(窄依赖),窄依赖不会划分StageList(org。apache。spark。OneToOneDependency1eaf1e62)1对N(1父多子)依赖(宽依赖或shuffle依赖),宽依赖会划分StageList(org。apache。spark。ShuffleDependency5fad41be)3。RDD的宽窄依赖窄依赖(NarrowDependency)每一个父RDD的Partition只能被子RDD的一个Partition使用,窄依赖我们形象的比喻为独生子女。宽依赖(ShuffleDependency)同一个父RDD的Partition被多个子RDD的Partition依赖,会引起Shuffle,宽依赖我们形象的比喻为多生。4。任务划分
  RDD任务切分中间分为:Application、Job、Stage和TaskApplication:初始化一个SparkContext即生成一个AJob:一个Action算子就会生成一个JStage:Stage等于宽依赖(ShuffleDependency)的个数加1;Task:一个Stage阶段中,最后一个RDD的分区个数就是Task的个数。
  注意:ApplicationJobStageTask每一层都是1对n的关系。
投诉 评论 转载

芯片取得重大突破,中国芯或将弯道超车我国芯片再次迎来重大突破,芯片行业将迎来大变革,外媒盛赞中国速度之快,这是怎么一回事呢?众所周知,传统芯片的核心设备,也就是光刻机制造技术,一直牢牢的掌握在荷兰手中,而阿……ASC科研发现一起来看僵尸病毒如何操纵毛毛虫自杀这听起来像是恐怖电影中的情节,但在昆虫世界中发生的频率比你想象的要多:病毒接管宿主并驱使它们走向死亡,这样病毒就可能更容易传播给其他受害者。科学家们认为,这实际上已经持续……如何将视频的语音变成文字播放出来?剪映软件APP,音频里有个字幕自动识别菜单,这个功能对视频里已经有的原声和后期视频录音都可以识别字母出来,制作视频字幕的时候要注意错字修改,普通话不标准或本身视频里的声音比较吵……互联网厨电领域领导企业,纯米科技完成1。1亿元D轮融资商道创投网5月9日官方获悉:纯米科技近日正式宣布完成1。1亿元D轮融资,投资方是由鼎晖百孚独家投资。用四品牌布局万亿厨电市场成立于2013年5月的纯米科技,以互联网厨电为……vueVue脚手架消息订阅与发布今天的内容有意思了,朋友们继续对我们之前的案例完善,是这样的我们之前是不是靠props来完成父给子,子给父之间传数据,其实父给子最好的方法就是props但是自给父就不是了,并且……续航超1000km,L4级智能驾驶,3。9秒破百,这些新能源前几年要说在国内这块庞大的汽车市场上什么车型最火,那毫无疑问当属SUV,说得好听点叫做群雄争霸,说得不好听就是群魔乱舞。不管是传统车企,还是造车新势力,无不推出各种类型的SUV……为什么感觉国内用高档办公本的人都不怎么用surface?自己在用,surface的产品我用的pro3,说真的,微软做产品那是非常垃圾。当年的zune就是例证之一!Surface的问题,音量太小,以前没感觉这是什么问题,但是你真……华为P50Pro丨抬手就拍的相机南山晚霞huaweiP50Pro第一次外拍体验!犹豫了好久决定买以主打影像为主的P50Pro,既然买了就不后悔,整体使用相当奈斯,以P系列主打的影像技术确实在游玩中……继续深耕赛事IP营销,TCL成英雄联盟职业联赛官方合作伙伴熟悉电竞圈的朋友应该都知道,如今的英雄联盟职业联赛已经成为全球顶级的电竞赛事。为了促进LPL联赛的持续健康发展,以LPL为中心衍生出的商业化模型也越来越庞大,更多国内外知名品牌……两千元最强性价比神机,RedmiNote10Pro有何魅力很多预算在两千元的小伙伴,购机直接选择红米,确实红米的性价比一直受消费者称赞,RedmiNote10Pro售价2099元,搭载天玑1100芯片,在同级产品中性能表现比较突出。……Spark(六)RDD的血缘依赖RDD依赖关系1。RDD血缘关系RDD只支持粗粒度转换,即在大量记录上执行的单个操作。将创建RDD的一系列Lineage(血统)记录下来,以便恢复丢失的分区。RDD的Li……直击广交会除了松子阿富汗商人阿里还带来更多好物西班牙香皂、智利红酒、土耳其咖啡壶、韩国面膜、德国轴承进入第131届广交会线上进口展区,来自全球32个国家和地区的402家境外企业带来的好吃的、好玩儿的、好看的、好用的商品令人……
为什么现在300m的宽带和以前的20m感觉速度差不多?刘强东年轻时穿成这样,看得叫人心酸,这才是真正的白手起家七个月后,它已是HiFi小尾巴标杆DC评乐图PAWS1vb解析文本文件摩托罗拉edgespro今天开售拥有一亿像素2399元起健康当道!惠而浦FreshCare筑起衣物健康防线红米K和红米note区别在哪里?升级EMUI11的Mate30Pro拍照更强了吗?秋意缤纷从黑领变白领5G让采矿行业变成了这样涨见识了!居然见到512GB内存的iPhoneXR小米12功能亮点小结这个奖项含金量有多高?京东独揽国际顶会两项AI领域顶级大奖

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找七猫云易事利