Flume采集Kafka数据存储到Hive

江西南阳
嘉兴昆明
铜陵滨州
广东西昌
常德梅州
兰州阳江
运城金华
广西萍乡
大理重庆
诸暨泉州
安庆南充
武汉辽宁

5月21日程染筱投稿

　　需求背景
　　将Kafka中的数据通过Flume收集并存储到Hive里。环境准备
　　这里是使用Apache社区版部署的环境，而非CDH、HDP等方式，可以先参考官方文档搭建好环境。配置Hive修改hivesite。xml文件，添加以下内容。propertynamehive。txn。managernamevalueorg。apache。hadoop。hive。ql。lockmgr。DbTxnManagervaluedescriptionSettoorg。apache。hadoop。hive。ql。lockmgr。DbTxnManageraspartofturningonHivetransactions，whichalsorequiresappropriatesettingsforhive。compactor。initiator。on，hive。compactor。worker。threads，hive。support。concurrency（true），andhive。exec。dynamic。partition。mode（nonstrict）。ThedefaultDummyTxnManagerreplicatespreHive0。13behaviorandprovidesnotransactions。descriptionpropertypropertynamehive。support。concurrencynamevaluetruevaluedescriptionWhetherHivesupportsconcurrencycontrolornot。AZooKeeperinstancemustbeupandrunningwhenusingzookeeperHivelockmanagerdescriptionpropertypropertynamehive。metastore。urisnamevaluethrift：localhost：9083valuedescriptionThriftURIfortheremotemetastore。Usedbymetastoreclienttoconnecttoremotemetastore。descriptionproperty创建hive数据库和表，需要注意，建表时需要分区、分桶、事务。CREATEDATABASECREATETABLEtestkafkatohive（timestring，typestring，valuestring，codestring）PARTITIONEDBY（partitiontimestring）CLUSTEREDBY（time）INTO2BUCKETSstoredASORCTBLPROPERTIES（transactionaltrue）；配置Flume新建配置文件kafka2hive。conf，内容如下，更多相关的配置可以参考官方文档kafkasource和hivesink。创建source、channel、sinka。sourceskafkasourcea。channelsmemorychannela。sinkshivesinkkafka为souce的配置a。sources。kafkasource。typeorg。apache。flume。source。kafka。KafkaSourcea。sources。kafkasource。zookeeperConnectlocalhost：2181a。sources。kafkasource。bootstrap。serverslocalhost：9092a。sources。kafkasource。topicprocessedrealtimeDataa。sources。kafkasource。channelsmemorychannela。sources。kafkasource。consumer。timeout。ms1000a。sources。kafkasource。batchSize10hive为sink的配置a。sinks。hivesink。typehivea。sinks。hivesink。hive。metastorethrift：hosthivemetadatastore：9083a。sinks。hivesink。hive。databasetestdba。sinks。hivesink。hive。tabletestkafkatohivea。sinks。hivesink。hive。partitionYmda。sinks。hivesink。hive。txnsPerBatchAsk2a。sinks。hivesink。batchSize1a。sinks。hivesink。serializerJSONa。sinks。hivesink。serializer。fieldnamestime，type，value，codechannel的配置a。channels。memorychannel。typecom。my。flume。channel。JsonParsedMemoryChannela。channels。memorychannel。capacity1000a。channels。memorychannel。transactionCapacity100三者之间的关系a。sources。kafkasource。channelsmemorychannela。sinks。hivesink。channelmemorychannel拷贝Hadoop的配置文件coresite。xml和hdfssite。xml到Flume的conf目录里，编辑coresite。xml文件，添加以下内容。propertynamefs。hdfs。implnamevalueorg。apache。hadoop。hdfs。DistributedFileSystemvalueproperty运行Flume。binflumengagentc。conff。confkafka2hive。confnaDflume。root。loggerINFO，console注意事项运行过程中遇到很多类不存在或者找不到类等相关的异常，解决办法是把Hive和Hadoop的相关jar包拷贝到Flume的lib目录下，如下这些是部署过程中碰到的一些，具体可以根据实际情况来处理。Hivehcatalogsharehcataloghivehcatalogstreaming3。1。0。jarhcatalogsharehcataloghivehcatalogcore3。1。0。jarhcatalogsharehcataloghivehcatalogserverextensions3。1。0。jarhcatalogsharehcataloghivehcatalogpigadapter3。1。0。jarhcatalogsharehcataloghivehcatalogcore3。1。0。jarlibhivejdbc3。1。0。jarliblog4j1。2api2。10。0。jarliblog4japi2。10。0。jarliblog4jcore2。10。0。jarliblog4jslf4jimpl2。10。0。jarliblog4jweb2。10。0。jarlibhivestandalonemetastore3。1。0。jarlibhivecontrib3。1。0。jarlibhiveexec3。1。0。jarliblibfb3030。9。3。jarlibcalcitecore1。16。0。jarjdbchivejdbc3。1。0standalone。jarjdbchivejdbc3。1。0standalone。jarHadoopsharehadoopcommonhadoopcommon2。7。7。jarsharehadoopmapreducehadoopmapreduceclientcommon2。7。7。jarsharehadoopmapreducehadoopmapreduceclientcore2。7。7。jarsharehadoopcommonlibcommonsconfiguration1。6。jarsharehadoopcommonlibhadoopauth2。7。7。jarsharehadoophdfshadoophdfs2。7。7。jarsharehadoophdfslibhtracecore3。1。0incubating。jar

投诉评论转载

Flume采集Kafka数据存储到Hive需求背景将Kafka中的数据通过Flume收集并存储到Hive里。环境准备这里是使用Apache社区版部署的环境，而非CDH、HDP等方式，可以先参考官方文档搭建好……苹果首次开卖iPhone12mini官翻机只便宜不到500块苹果销售经过官方认证的翻新机并不是什么新鲜事清，目前就有多款翻新Mac在苹果官网售卖。但今天，苹果在官网上架了iPhone12mini的官翻版，这是这款手机自2020年10月发……医生提醒吃牛肉一小时内，建议少碰这5物，或会影响健康牛肉作为生活中常见的一种肉类食物，营养价值非常高，适当食用牛肉，对于身体健康饮食有着一定的好处，而且像一些牛肉也是肉质非常鲜美的，尤其是在平时制作成牛排或者是炖牛肉的话，都是非……创造历史，张伟丽击败卡拉单场收入曝光，相当于中了一次超级大奖近日，中国体坛的热门人物自然非格斗女王张伟丽莫属。这位有着中国最能打女生称号的格斗运动员，在美国实现了职业生涯的飞跃。正如她自己所说，她已经从中国的伟丽，变成了世界的伟丽。而她……正式加盟！山东救火外援抵达济南，王晗目标冲击四强兰兹博格正式加盟山东男篮根据山东方面记者夏晓司报道，山东男篮之前签约的小外援兰兹博格抵达济南。CBA第二阶段要到12月6日才开打，兰兹博格有足够的时间去恢复自己的身体，希……鲁某某摸了一下孩子，监控却证明他撒了谎，隔着屏幕感到了疼看到一个视频，挺震撼的。鲁某某：以后不能拿东西打人，两只耳朵听见了没有？幼儿：听见了。鲁某某：听见了没有！随着话音落地，啪！的一声！鲁某某扬手朝小男孩扇……北京电科院集成电路设计与测试中试基地投产，助力高技能人才培养新京报讯（记者杨菲菲）11月11日，北京电子科技职业学院（以下简称北京电科院）与北京集创北方科技股份有限公司（以下简称集创北方）举行战略合作签约仪式，共同签署共建集成电路设计与……苏有朋晒照纪念左耳，杨洋22岁旧照成亮点，网友时间是把刀距离《左耳》播出已经七周年，虽然已经过去7年，但剧中的很多剧情大家还很清晰地记着，而且几位主演也一直都活跃在荧屏上，所以大家对这部剧的印象要深的深。为了纪念七周年，导演苏……游记山东大钦岛上的海带村山东大钦岛上的海带村宁可心离蓬莱三个半小时的船程便是大钦岛。将近半上午的时间，你不会感到无聊，因为有海鸟儿时常盘旋，有海岛偶尔可以欣赏，还有一种花可以欣赏，那就是白……今天你消费降级了吗？最近大家都很难，纷纷开始了生活降级。一细看，别人的低质量生活不就是我的生活日常嘛。我的低消费生活：穿搭篇simplewardrobe1。打造胶囊衣橱。胶囊衣橱的理念就是通……我们从哪里来地球生物大灭绝，到底有多可怕？古生物在极短的时间内集中灭绝的事件，被地质学家和古生物学家称为大灭绝。回顾大冰期以来的5亿多年历史，地球生物至少经历了七次大灭绝事件：约5。1亿年前的寒武纪末期，各……明明是同一个人，演完双世宠妃又演沉香重华，差点认不出文宸曦微凉《沉香如屑》收官，《沉香重华》接档而来，剧中应渊、颜淡的感情戏，依然虐得观众心肝疼，不仅如此，《沉香重华》中应渊的身世也会浮出水面，他的疯批爹爹玄夜也将出场，值……

<<<<<<－>>>>>>

汉服熊猫之蹴鞠熊猫蹴鞠的酷炫绝技文末有福利丨年末岁尾，我想对自己家人说克里米亚幽灵谷，为什么被称为俄罗斯最神秘的地方？更新iOS16。1正式版，剪贴板弹窗开关共享图库和实时活动来暗恋，是人生中轰轰烈烈的一场即兴表演胃口大，一定要注意了猫系长相为什么屡次出圈？起底宋智雅的猫系长相特点张庭夫妇名下96套房产因传销被查封，价值17亿，冰山一角？对孩子来说，每天午睡和从不午睡的差距有多大？家长要心中有数黄金，铂金，钻石哪个更保值，差距有多大，超乎你的认知。纳达尔爆冷输给蒂亚福，詹姆斯对蒂亚福表达祝贺，年轻的国王沪深交易所今日新增600只两融标的股票

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找七猫云易事利