cdh版本升级（5.14 -> 6.2）

我们的Cloudera Manager和cdh版本是5.14，现在公司需要升级到cdh7.2
需要先升级Cloudera Manager，然后升级cdh。(参考
https://www.cloudera.com/documentation/enterprise/upgrade/topics/ug_cm_upgrade.html)
升级之前先确定linux的版本已经升级到Cloudera Manager6.2支持的版本###查看数据库信息得到类似如下信息：Create a top level backup directory.Back up the Agent directory and the runtime state.Back up the existing repository directory.在安装了Service Monitor 的机器上执行：在安装了Host Monitor 的机器上执行：在安装了Event Server的机器上执行：Create a top-level backup directory.$ Back up the Cloudera Manager Server directories:Back up the existing repository directory.登陆Cloudera Manager Server节点，删除原有yum源创建新的yum源文件在server的配置文件中配置java_home：
在/etc/default/cloudera-scm-server
增加JAVA_HOME
export JAVA_HOME=”/usr/java/jdk1.8.0_162″1.登录Cloudera Manager Server主机。
2.停止Cloudera管理服务。（要点：此时不停止Cloudera Management Service可能会导致管理角色崩溃或Cloudera Manager Server可能无法重新启动。）
步骤：3.停止Cloudera Manager Server.4.停止Cloudera Manager Agent.5.升级Cloudera packages.6.确认下包安装好了7.启动Cloudera Manager Agent.8.启动Cloudera Manager Server.启动过程中如果有问题可以参考日志文件：9.正常的话打开cdh升级页面就可以看到升级的情况了
http://cloudera_Manager_server_hostname:7180/cmf/upgradea.使用CDH界面升级
点击 Cloudera Manager Agent软件包
选项1：选择agent存储库
我们使用公共库就可以了
选择 Public Cloudera Repository
2.安装JDK
已经安装了就不用选择了
3.安装agent
配置一下root或者sudo账号就可以了，需要能访问所有agent节点的权限选项2:使用命令升级
清除老的repo文件新建repo文件香港云主机：repo文件内容：停止Cloudera Manager agent服务升级Cloudera Manager agent等到所以机器都完成了之后，每个agent节点执行查看
http://192.168.0.254:7180/cmf/upgrade
显示所有机器的agent都已经升级，且都有心跳
点击 Host Inspector，检测一下节点的情况
完成之后点击显示检查器结果，查看有问题的项，修复。
显示的问题中有个比较重要的：如果后续要运行CDH6，hue需要使用python2.7，先记着，暂时不管。然后，启动Cloudera Management Service如果升级失败，需要还原，可以参考官方的步骤：
https://www.cloudera.com/documentation/enterprise/upgrade/topics/ug_cm_downgrade.html升级之前先确定linux的版本已经升级到CDH6.2支持的版本，java版本为1.8登录到CDH管理页面，启动hdfs服务
然后运行以下命令检查集群情况
如果有问题则修复
检查hdfs：检查hbase表中的一致性：
$ sudo -u hdfs hbase hbck
如果使用了kudu，检查kudu：以下服务在6.0.0中已经没有了，升级之前，需要停止并且删除这些服务
Accumulo
Sqoop 2
MapReduce 1
Spark 1.6
Record Service以下CDH组件不需要备份：
MapReduce
YARN
Spark
Pig
Impala升级CDH前完成以下备份的步骤
1.Back Up Databases
我们使用mysql，所以以mysq为例
1）如果尚未停止，请停止服务。如果Cloudera Manager指示存在依赖服务，则还要停止依赖服务。2）备份各个服务（Sqoop, Oozie, Hue,Hive Metastore ,Sentry）的数据库。替换数据库名称，主机名，端口，用户名和备份目录路径，然后运行以下命令： 2.Back Up ZooKeeper
在每台zookeeper节点，备份cdh中配置的zookeeper的数据存储目录，如 3.Back Up HDFS
（命令中的数据路径根据cdh中实际配置更改）$ sudo cp -rp /data/dfs/jn /data/dfs/jn-CM-CDH5.14这些命令创建临时回滚目录。如果稍后需要回滚到CDH 5.x，则回滚过程要求您修改此目录中的文件。 4.Back Up Key Trustee Server and Clients
服务没有使用
5.Back Up HSM KMS
服务没有使用
6.Back Up Navigator Encrypt
服务没有使用
7.Back Up HBase
由于回滚过程还会回退HDFS，因此HBase中的数据也会回滚。此外，存储在ZooKeeper中的HBase元数据将作为ZooKeeper回滚过程的一部分进行恢复。
8.Back Up Search
服务没有使用
9.Back Up Sqoop 2
服务没有使用
10.Back Up Hue
在运行Hue Server角色的所有主机上，备份app注册表文件对于centos6版本的系统：
需要在hue的节点安装python2.7
Enable the Software Collections Library:$ Install the Software Collections utilities:$ Install Python 2.7:Verify that Python 2.7 is installed:1.HBase 2.0 不支持PREFIX_TREE数据块编码，升级前需要先删除，否则hbase2.0无法启动
如果你已经安装了CDH6.那么通过运行以下工具来确保所有表或快照都不使用PREFIX_TREE数据块编码：2.升级协处理器类
外部协处理器不会自动升级。有两种方法可以处理协处理器升级：
在继续升级之前，请手动升级协处理器jar。
暂时取消协处理器的设置并继续升级。
手动升级后，可以重置它们。尝试在不升级协处理器jar的情况下进行升级可能会导致不可预测的行为，例如HBase角色启动失败，HBase角色崩溃，甚至数据损坏。如果您已经安装了CDH 6，则可以通过运行来确保您的协处理器与升级兼容 hbase pre-upgrade validate-cp 工具。当使用Cloudera Manager Backup and Disaster Recovery (BDR)将集群从Cloudera Manager 5.13或更低版本升级到CDH 6.0或更高版本时，使用Cloudera Manager Backup and Disaster Recovery (BDR)备份数据将不起作用。
用于执行升级的次要版本的Cloudera Manager必须等于或大于CDH次要版本。要升级Cloudera Manager注意：
使用滚动重新启动（仅限次要升级）升级CDH时：
自动故障转移不会影响滚动重新启动操作。
升级完成后，如果当前正在运行MapReduce或Spark作业，请不要删除旧的块。这些作业仍使用旧的块，必须重新启动才能使用新升级的块。
确保Oozie工作是幂等的。
不要使用Oozie Shell Actions来运行与Hadoop相关的命令。
不支持滚动升级Spark Streaming作业。升级完成后重新启动流作业，以便开始使用新部署的版本。
必须将运行时库打包为Spark应用程序的一部分。
您必须使用分布式缓存从客户端网关计算机传播作业配置文件。
不要构建包含第三方依赖项或CDH类的“超级”或“胖”JAR文件，因为这些文件可能与Yarn，Oozie和其他服务自动添加到CLASSPATH的类冲突。
在不捆绑CDH JAR的情况下构建Spark应用程序。在cloudera manager升级之前我们备份了一次，在升级之后还需要备份一次。例如：在每台agent节点上执行：备份agent目录和运行时状态备份Cloudera Management Service
在Service Monitor节点执行在Host Monitor节点上执行在Event Server节点上执行在CDH管理界面中停止Cloudera Management Service，选择：
Clusters->Cloudera Management Service.
Actions > Stop.
停止 Cloudera Manager Server：数据库信息为刚才第一步中查看文件中获取的信息在Cloudera Manager Server节点执行：
1.创建一个备份目录：2.备份 Cloudera Manager Server的目录3.备份当前repo目录
4.要在升级过程中避免不必要的警报，请在开始升级之前在群集上进入维护模式。进入维护模式会停止发送电子邮件警报和SNMP陷阱，但不会停止检查和配置验证。完成升级后，请务必退出维护模式以重新启用Cloudera Manager警报。1.确保在升级完成之前，不会将新应用程序（如MapReduce或Spark应用程序）提交到群集。
2.打开CDH管理界面，进入到要升级的YARN服务
3.在实例选项卡上，选择所有NodeManager角色。这可以通过过滤角色类型下的角色来完成
4.点击已选定的操作 -> 解除授权
如果群集运行CDH 5.9或更高版本并由Cloudera Manager 5.9或更高版本管理，并且您配置了正常解除授权，则会启动超时倒计时。平滑退役开始停止使用过程之前提供了一个超时。超时会创建一个时间窗口，以便从系统中消耗已经运行的工作负载，并允许它们运行完成。在YARN服务的Configuration选项卡上搜索Node Manager Graceful Decommission Timeout字段，并将该属性设置为大于0的值以创建超时。
5.等到解除授权完成。完成后，NodeManager的状态为停止，授权状态为解除授权。
6.选中所有NodeManagers，点击已选定的操作 -> 重新授权。
(6这一步不做的话后面升级过程中会报错，而且很难找到原因，会在yarn升级的过程中报这样的一个：
Caused by: org.apache.hadoop.ipc.RemoteException(java.io.IOException): Requested replication factor of 0 is less than the required minimum of 1 for /user/yarn/mapreduce/mr-framework/3.0.0-cdh7.2.0-mr-framework.tar.gz)查询语法，DDL语法和Hive API都有变化。在升级之前，您可能需要在应用程序工作负载中编辑HiveQL代码。sentry
如果群集使用Sentry策略文件授权，则必须先将策略文件迁移到数据库支持的Sentry服务，然后再升级到CDH 6。如果群集使用Hue，请执行以下步骤（维护版本不需要）。这些步骤清理Hue使用的数据库表，可以帮助提高升级后的性能。
1.备份Hue数据库。
2.连接到Hue数据库。
3.检查desktop_document，desktop_document2，oozie_job，beeswax_session，beeswax_savedquery和beeswax_queryhistory表的大小以获得参考点。如果其中任何行超过10万行，请运行清理。1.打开CDH管理界面，点击主机 -> Parcels -> 配置
2.使用以下远程parcel存储库URL更新CDH的Parcel存储库：a.在远程 Parcel 存储库 URL 部分中，单机 “+”图标添加上面的url，单击保存更改
b.在表中找到包含新CDH parcel的行，然后单击“ 下载”按钮。
c.下载包后，单击“ 分配”按钮。
d.分发完所有包裹后，点击升级按钮。1.进入升级向导后，会运行一些集群的check，check的结果可能会出现一些问题，会影响到后续的升级，先把这些问题解决。还会有备份数据库的提示。如果都已经ok了，点击是，我已执行这些步骤，然后点击继续。
2.点击完整群集重启 (群集的全部停机时间)，点击继续。（这个步骤会重启所有服务）升级过程中Oozie异常提示：
1.E0103: Could not load service classes, Cannot create PoolableConnectionFactory (Table ‘oozie.validate_conn’ doesn’t exist)
解决方案：
2.“java.lang.ClassNotFoundException:org.cloudera.log4j.redactor.RedactorAppender”找不到类。
参考这篇文章，把缺少的logredactor-2.0.7.jar建一个软连接从/opt/cloudera/parcels/CDH/lib/oozie/lib到/opt/cloudera/parcels/CDH/lib/oozie/libtools目录下3.ERROR StatusLogger No log4j2 configuration file found. Using default configuration: logging only errors to the console.
原因是log4j.xml没有配置导致异常信息无法显示，同样考一份log4j.xml的模版放到/opt/cloudera/parcels/CDH/lib/oozie/libtools目录下即可。用于在CDH 5中提交Spark 2作业的命令（spark2-submit）在CDH 6中删除，
替换为 spark-submit。在具有内置Spark 1.6服务和Spark 2服务的CDH 5集群中，spark-submit 与Spark 1.6服务一起使用，和spark2-submit与Spark 2服务一起使用。升级到CDH 6后，spark-submit 使用CDH内置的Spark 2服务， spark2-submit不再起作用。确保使用这些命令更新提交Spark作业的任何工作流。impala主要用于即时查询，不用于线上任务，所以重要性没有那么高，参考官网
https://www.cloudera.com/documentation/enterprise/upgrade/topics/impala_upgrading.html
即可。

相关推荐: win10提示你的电脑遇到问题需要重启怎么解决

今天小编给大家分享一下win10提示你的电脑遇到问题需要重启怎么解决的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。具体操作：方法一：点击开始菜单…

免责声明：本站发布的图片视频文字，以转载和分享为主，文章观点不代表本站立场，本站不承担相关法律责任；如果涉及侵权请联系邮箱：360163164@qq.com举报，并提供相关证据，经查实将立刻删除涉嫌侵权内容。