产品中心
EterneCluster-MN
随着信息化建设的不断推进,企业的信息化已经非常普遍,各个企事业单位的活动越来越多的依赖于其关键的业务信息系统,这些业务信息系统对整个机构的运营和发展起着至关重要的作用。如果一些关键应用一旦发生宕机故障或应用停机,将给企业带来巨大的经济损失,并且由于业务的不可用而影响了企业的信誉,致使客户对企业失去信任,所造成的危害是致命的。
可见,对那些需要保障信息安全和提供不间断的信息服务的企业而言,业务系统的容错性和不间断性显得尤为重要。如何保障各种关键应用持续运营,达到永续经营的良性循环,已成为当今企事业单位和IT领域急需解决的关键问题。
通常,对于服务因错误造成的不可避免终止,企业都会安排相关的管理人员进行定时的监控,一旦发现服务不可用,便会立即进行处理排错。这是非常原始的高可用解决方案,存在诸多问题,譬如及时性问题,一旦错误在深夜发生,而人工不可能24小时监控;再譬如处理时间长短不可控,一旦错误造成的原因非常复杂,排错非常困难,需要非常长的时间,那么服务的终止将非常长。在排错过程中,人为操作失误将可能导致系统的永久瘫痪。另一方面,为了维持系统的高可用性而配备操作人员,劳务费用也非常昂贵。
目前,市场上提供多种高可用性解决的软件解决方案。主要分为双机和多机的解决方案,主要原理是在提供硬件冗余的系统基础之上,运行高可靠性软件而构成。高可用性软件自动检测服务的运行状态,一旦服务在主机上出现故障,高可用性软件将自动地把服务转到另一台服务器上,从而让服务持续可用。对系统应用状态的监控和服务故障的恢复,由高可用软件自动完成,减少了人员的负担。
EterneCluster-MN简介
EterneCluster-MN多节点集群产品:是EterneCluster产品系列中的旗舰产品,能支持2个以上节点的集群,具有稳定可靠、易于管理、集群工作方式灵活多样、节点和任务伸缩性强、保护用户投资、整合优化系统环境的功能和特点,能支持不超过32个节点的复杂应用集群环境。EterneCluster-MN多节点集群在未来会有大量需求,大家对集群的认识目前还在双机环境下。而实际上,在有多个关键应用都具有高可用需求, 在一个机房内建立多个双机系统显然是很浪费的,管理的复杂度又高,多节点集群可以有效的解决这个问题。对于多节点高可用,可以理解为多机互备,多个服务器连接在一个共享存储设备上,同时运行多个不同应用,在其中任意服务器出现故障时,其它服务器根据备援策略进行接管服务,保证整个集群中的服务都能高可用。
EterneCluster-MN功能特点
提供高可用性解决方案是EterneCluster的核心功能,该解决方案提供双机热备系统,也提供多机的高可用解决方案。
在集群系统的每一台服务器内,EterneCluster具有两个核心进程,他们互相监控(如:系统宕机、EterneCluster进程被杀掉、网络、SCSI线缆是否断开),如果其中一个进程失败,另一个进程会立即进行恢复。
支持网卡(私网/公网)、磁盘心跳等多种心跳方式,多重保障心跳检测途径,配置多条心跳路径可以避免系统的单点故障,进一步提高了系统的可靠性。
软件管理共享磁盘上的数据,以防止多个服务器在同一时间访问数据。EterneCluster在逻辑设备级(卷)上控制对数据的访问,管理员可以不必担心群中的其它服务器访问数据时,可能会带来的数据访问冲突。EterneCluster自动在被应用程序定义为共享资源的磁盘卷上设置SCSI-2/SCSI-3持久保留。当被保护的应用程序由一个服务器被移动/转换到另一个服务器时,EterneCluster控制这些锁定,以保证激活服务器对共享卷的访问。
在应用软件的检测时间间隔执行检测,以察看资源本身是否失效。如果快速检查和深入检查均局部告失败,系统将根据用户设定的策略尝试局部恢复资源。如果尝试成功,资源将不会向下一优先级的节点进行失效切换。如果局部恢复尝试失败,系统将向下一优先级的节点进行失效切换。
在主服务器上,可以加上另外一个NIC作为主服务器的备份NIC。当主NIC 出现故障时,EterneCluster将可切换的IP地址让由本地的备份 NIC 接管,本地资源不需要切换,有效的减少的切换时间。
不仅支持传统的单活(Active/Standby)、双活(Active/Active),还支持N和N+1多节点集群备份。目前EterneCluster最多支持8个节点的群集工作模式。
当首选节点发生故障后又恢复正常,如果允许自动迁回,备份节点在指定的恢复时间窗口内将资源组切换回首选节点运行;禁止自动迁回时,资源组将保留在备份结点上,管理员可在合适的时间手工切换。
当浮动IP切换到其它网卡上挂载时,Cluster会主动进行ARP广播通知客户端该IP的MAC地址发生改变,让客户端主动更新映射关系,这样客户端便会连接到相关的服务上,避免因浮动IP切换造成客户端无法访问的情况。
多机集群支持的模式
l 1-N配置
这个配置方式是一个标准的多机配置方案。在这个cluster中,每台服务器都能运行客户的应用服务,平时仅由主服务器提供应用服务,其余服务器都是备用服务器。一旦主服务器发生故障,cluster依照切换策略,会把任务切换到顺位的备份服务器中,如果顺位服务器也发生故障,应用服务会继续按照结点优先级切换到下一台,直到服务能够接管。这种配置方式一般用于那些要保证应用服务100%能够24小时在线的客户环境。
l N-1配置
这个配置方式是所有的服务器都在一个cluster中,其中一个服务器作为cluster中其它服务的备份服务器,一旦某个主服务器系统出现故障,任务会按照策略把该服务器的任务切换到该备份服务器。某种意义而言,其为双机系统的扩展版本,但这种体系结构配置对客户有多个服务的环境是非常优化的系统配置,同时能够让整个集群集中管理并且能够达到高可用。
l M-N配置
这个方式中多个生产服务器工作在一个集群中,通过合理定义备援策略,境中服务器相互备援,任何一个任务停止工作都将由其它服务器接管任务,是一种设备利用率最佳的部署方式。该部署方式同样有效的优化了系统结构,需要注意的是在定义备援策略时,仔细分析各服务器处理能力、任务的兼容性问题。
在M-N方式中当主节点发生故障时,允许多个备份节点被按照一定的优先级次序恢复一个资源组。对于在一对节点上的资源恢复,如果节点A发生故障了,资源将会切换到节点B上;如果节点B再发生故障而节点 A仍然不可用,资源将会失效切换到节点C上。多个备份节点被指定一个优先级。在上面的例子中,节点A有最高的优先级,节点B有第二优先级,而节点C有最低优先级。EterneCluster按优先级次序测验节点来决定在故障切换时哪一个服务器将进行工作。
支持的操作系统平台
l Window系列的操作系统平台
l Linux系列操作系统
n RedHat Enterprise Linux 4.0 及以上
n Suse Linux Enterprise 10.0 及以上
n Ubuntu 8 及以上
支持的应用
l 数据库:MS SQL Server、Oracle,Sybase等。
l 文件服务器: NFS 、Samba等。
l Web服务: IIS 、Apache等。
l 用户自定义。