LanderCluster集群系统软件是由 LcMgrl、Daemon 和 St-Task 三部分组成,这三部分协同工作,共同完成主机系统的备援工作。
LanderCluster软件在启动时,首先读取集群系统的配置文件,在该文件中描述集群系统中各节点的网络信息,硬件描述以及任务的定义等参数。
集群核心程序根据集群的配置信息,进行集群系统的状态重组。根据当前的网络状态和集群参数,对节点中的服务器进行调整,建立集群的初始状态。
在节点初始状态建立起来后,Daemon 管理模块根据执行模块采集传递的当前网络状态的信息。根据定义的规则,对集群进行调整并分配集群网络资源,使集群中的某个节点获得对外提供网络服务的资源。
当生产节点形成后,同时启动节点监控功能,对集群中的节点进行网络状态监控,保持网络状态的健康。
集群任务启动后,该模块启动任务监控功能,对所启动任务的关键进程进行监控。保障对外提供服务的资源健康。
当以上资源建立起来后,集群系统进入正常运行状态。
LanderCluster高可用集群系统进入正常运行状态后,通过专用的通讯链路和集群中的其它节点进行通讯,传输各节点的状态信息,使各节点的核心管理模块获得整个集群节点的实时状态。
当系统中有节点故障时,集群管理模块根据集群当前的状态和该故障节点在集群中的角色做出集群系统是否重组。当该节点为生产机时,集群系统会自动将属于该节点的资源和任务移交到备份服务器上。保证该业务正常运行。
如果该节点为备份服务器,LanderCluster对系统管理员提出报警后,将任务的移交进行封锁,该任务当前处于不可移交状态,直到备份服务器故障修复处理后,重新进入集群系统后,LanderCluster 管理模块检查到该故障修复后,对当前的任务进行解锁操作。备份服务器在生产机出现故障的情况下,对任务及其资源进行接管。