Rancher无法管理集群怎么办


这篇文章主要介绍“Rancher无法管理集群怎么办”,在日常操作中,相信很多人在Rancher无法管理集群怎么办问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Rancher无法管理集群怎么办”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!大部分Rancher用户倾向于通过使用Rancher Server创建自定义集群。而创建完成之后,也许会因为各种各样的原因导致 Rancher Server 无法继续管理该集群,比如误删 Rancher Server 或备份数据无法恢复等。遇到此类问题,通常的解决方案是重新启动一个 Rancher Server 并将下游业务集群导入并纳管,但这样会导致一些“后遗症”,比如无法继续扩展业务集群的节点。为了消除这一“后遗症”的影响,我们可以通过RKE纳管Rancher Server 创建的“自定义”集群。正如你所知,Rancher Server 通过 UI 创建的”自定义”集群,后端是通过 RKE 实现的,所以 RKE(https://docs.rancher.cn/rke/)有能力去纳管Rancher Server 创建的“自定义”集群。通过RKE 创建和管理 Kubernetes 集群,依赖 3 个文件:cluster.yml:RKE 集群配置文件kube_config_cluster.yml:该文件包含了获取该集群所有权限的认证凭据cluster.rkestate:Kubernetes 集群状态文件,包含了获取该集群所有权限的认证凭据所以,只要能从下游业务集群中获得这 3 个文件,就可以结合 RKE 二进制文件继续管理下游业务集群。下面将详细介绍如何通过 RKE 纳管 Rancher Server 创建的“自定义”集群,并通过RKE扩展集群的节点。本文只针对 Rancher v2.4.x 和 v2.5.x 版本做了测试,其他版本可能不适用。为了更好的演示效果,本文将从 Rancher Server 创建“自定义”集群开始,然后通过 RKE 纳管”自定义”集群,最后为了确认 RKE 有能力纳管集群,将演示通过 RKE 添加一个节点。Rancher Server(ip-172-31-2-203)可以采用最简单的docker run方式启动,并通过 UI 创建一个”自定义”集群,集群中包括两个节点:ip-172-31-2-203和ip-172-31-1-111, 详细如下:1、将ip-172-31-8-56 关机,模拟 Rancher Server 故障,此时无法通过 Rancher Server 继续管理下游集群。2、恢复下游业务集群的kube_config_cluster.yml文件,在controlplane节点上运行以下命令:成功导出kubeconfig_admin.yaml之后,就可以使用 kubectl 继续操作下游业务集群:3、恢复下游业务集群的cluster.rkestate文件,在controlplane节点上运行以下命令:4、恢复下游业务集群的cluster.yml文件目前我没找到好方法可以自动恢复该文件,但可以基于已经恢复的cluster.rkestate来手动恢复cluster.yml文件,因为cluster.yml需要的配置基本都可以从cluster.rkestate获得。从cluster.rkestate中获得集群节点的配置信息:根据 cluster.rkestate提供的节点信息,手动编写 cluster.yml以上手动编写的 cluster.yml 有几个地方需要注意:只能从cluster.rkestate文件中获得**controlplane(ip-172-31-2-203)节点的信息,因为本例集群中还有一个worker(p-172-31-1-111)节点,所以需要将worker(p-172-31-1-111)**节点的信息手动补充完整。cluster.yaml中的ip-172-31-5-186是新增的worker节点,用于下一步演示 RKE 新增节点。从cluster.rkestate获得的节点信息是root用户,需要根据实际需求,修改成 RKE 执行的用户,本例为ubuntu用户。一定要指定原始集群的kubernetes_version参数,否则会将集群升级到 RKE 默认的最新版 Kubernetes。除了以上方式,还可以通过下面的脚本恢复cluster.yml。同样,你需要修改以上几点提到的地方。使用这种方法的好处是可以更完整的恢复cluster.ym开发云主机域名l文件,篇幅有限,就不做过多演示:5、使用 RKE 在原有集群上新增节点。到目前为止,RKE 需要的配置文件cluster.yml、cluster.rkestate都已经恢复完成,接下来就可以通过rke up来操作集群增加**worker(p-172-31-1-111)**节点。等待集群更新完成之后,再次获取节点信息:可以看到新增了一个worker(ip-172-31-5-186)节点,并且集群版本依然是v1.18.14。以后,可以通过 RKE 来继续管理通过 Rancher Server 创建的自定义集群,无论是新增节点、快照、恢复均可。和直接通过 RKE 创建的集群几乎无差别。虽然本文介绍了如何通过 RKE 纳管 Rancher 自定义集群,但操作比较复杂,特别是cluster.yml的配置,如果出现一点差错,可能就会导致整个集群的更新或出错,所以使用前请您一定要多做测试。到此,关于“Rancher无法管理集群怎么办”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注开发云网站,小编会继续努力为大家带来更多实用的文章!

相关推荐: 如何分析sql中的触发器

这篇文章主要为大家分析了如何分析sql中的触发器的相关知识点,内容详细易懂,操作细节合理,具有一定参考价值。如果感兴趣的话,不妨跟着跟随小编一起来看看,下面跟着小编一起深入学习“如何分析sql中的触发器”的知识吧。一.触发器是什么 触发器(trigger)是S…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

Like (0)
Donate 微信扫一扫 微信扫一扫
Previous 05/19 13:49
Next 05/19 13:49

相关推荐