sparkSQL来完成对Hive的操作


接下来做的操作是:(这个操作,将程序打成jar包到集群中运行)
(1)编写spark程序在线上的hive中创建表 香港云主机并导入数据
(2)查询hive中的数据
(3)将查询结果保存到MySQL中
代码:打jar包到集群中运行:https://blog.51cto.com/14048416/2337760作业提交shell:然后满怀期待的等待着success,不幸的是,当程序运行到一半的时候异常终止了:
我查看了一下打印的日志:

我上网查了好多资料,都说是hive的版本过高,what? I‘not why!!
然后想了想,我在集群中,使用spark的程序,去在hive表中进行操作,那么是不是spark需要和hive整合一下啊,然后我又上网查了spark如何整合hive,总的来说就是将hive的元数据库共享出去,让spark可以访问。
具体操作
①在hive的hive-site.xml加入:②在相应的节点上启动在hive-site.xml中配置的进程ps:这里需要注意一下,nohup是后台启动的,而且所有的信息都是定向输出的,这条命令使用之后,一定要检查一下这个命令是否真的执行成功了:
使用:jsp查一下是否有相应的进程启动,如果没有表示启动失败,肯定是 /home/hadoop/logs这个父目录没有创建,然后创建这个目录之后,在启动,在检查是否启动成功!!!!!!!
③将hive-site.xml复制到$SPARK_HOME/conf下(注意是每一个节点都要复制)
测试是否成功:spark-sql,如果正确进入并且可以访问hive的表,表示spark整合hive成功!!!之后我有将原来的程序,重新跑了一次,结果 没有报错,程序运行成功!!!
我不敢相信,我又查看了一下MySQL的表:

确认 程序成功!!!!!!

相关推荐: CSS中怎么使用behavior属性

本篇内容主要讲解“CSS中怎么使用behavior属性”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“CSS中怎么使用behavior属性”吧!CSS属性behavior语法在进行CSS网页布局的时候,我们经遇到刷新…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

Like (0)
Donate 微信扫一扫 微信扫一扫
Previous 07/23 18:00
Next 07/23 18:00

相关推荐