当前位置:网站首页>cdh6,使用oozie进行spark的jar任务调度
cdh6,使用oozie进行spark的jar任务调度
2022-08-06 20:59:00 【我要用代码向我喜欢的女孩表白】
首先准备1个jar
然后保证他丢到服务器,能用spark-submit /sparkTest.jar跑。
不会打包spark的可参考:linux上spark运行scala的jar包_我要用代码向我喜欢的女孩表白的博客-CSDN博客
首先你得有oozie和hue,安装好了,才行
下面是jar在hue的oozie中的应用

切换文档为操作action

将那个星星,也就是spark程序,托过来

然后上传你的spark.jar到hdfs上,因为他只能读取hdfs的jar
打开一台机器
hadoop fs -mkdir /sparkNews
hadoop fs -put /sparkTest.jar /sparkNews
其中/sparkTest.jar是我本地jar包的路径
开启权限
hadoop fs -chmod -R 777 /sparkNews

选择你的jar位置

然后保存


点击提交,播放的那个标识,三角形
提交,点击试运行,出现问题

不得不说网上的菜雕,写文章真是太shift了,我还根据下面安装了半天?
然后我CDH直接搞定

简书 这篇文章是真好,csdn的文章鱼龙混杂,鱼目混珠。
安装完成之后,直接就有lib

之后,进行中,一直卡在百分之50,打开oozie日志发现

没有log4j2文件,但是我有log4j.xml,难道还得加1个log4j2?,我直接启动spark都没有这种情况。我加上试一下

先在集群上直接测试,丢到oozie上测试
然后点击运行:发现一直卡在50%

去oozie查看日志
点击oozie选择oozie web ui

先看这条running的,然后点击橙色,跳转到日志界面

拉到最下面查看日志,点他,和点logs,这2个id的,logs都要看
他说我没有设置hadoop的环境变量

添加环境变量
vi /etc/profile
export HADOOP_HOME=/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/hadoop
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export SPARK_DIST_CLASSPATH=$(hadoop classpath)
source /etc/profile
错误示范直接跳过
通过命令"hadoop fs -ls /user"命令查看文件目录,确实不存在/user/oozie路径,说明oozie的sharelib没有放到hdfs上,我们现在要做的就是将oozie的share lib放到Hadoop的对应目录中
hadoop fs -mkdir -p /user/oozie/share/lib
没有,我就创建一个空的呗,然后再次运行
org.apache.oozie.action.ActionExecutorException: Could not locate Oozie sharelib
参考:Oozie 报错的解决方法_qqliang1314的博客-CSDN博客t
他说在做一个本地映射,找到oozie的lib目录
/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/oozie
边栏推荐
- 口服产品上市叠加成人市场发展,生长激素赛道发展突破口显现
- 深入理解隔离性(MVCC,快照,undo log,Read View)
- The predicament of e-commerce giants is reversed, and Alibaba and Amazon have the same goal
- pinia 基于插件pinia-plugin-persist的 持久化
- 分布式架构介绍
- idea中启动多个微服务(开启RunDashBoard管理)
- openssl官网文档资料
- LeetCode_730_每日温度
- Dingxiang's first business security monthly report
- 面试官:运行 npm run xxx 的时候发生了什么?
猜你喜欢
随机推荐
Es nested object
3D建模师Joinx的猫耳少女建模展示
ThreadLocal原理总结(建议收藏观看)
Servlet使用
es nested object区别
How to implement route caching in umi
从0到1构建可视化大屏-员工管理
vscode 1.70变化与关注点(人工折叠/粘性滚动等)
Vikinger v1.9.3汉化版WordPress模板主题
Shell系统学习之文件操作
STM32MP157A驱动开发 | 05 - 基于LTDC接口驱动RGB LCD
ArcGIS Desktop 10.8软件安装包和安装教程
Matlab统计与回归
2. 线性表的基本概念 + 基本操作
复现一个循环问题以及两个循环问题
从To C到To B、To G,多多云科技如何实现转型
话费优惠
xss-labs靶场1~7详解
一文带你了解webrtc基本原理(动手实现1v1视频通话)
Danger!Please replace BeanUtils in your code now!!!







