heartbeat心跳问题解决二fence思路

HA,fence是HA集群的术语,在硬件领域,fence设备其实就是一个智能电源管理设备(IPMI),Intelligent PowerManagement Interface,智能电源管理设备或远程管理卡,也是一个外部的fence,还有内部的fence,内部的是插在服务器里面的,不管是内部还是外部,这些设备都是带有以太网口的,用来在HA切换触发时通过网络重启提供资源服务的服务器!

外部的fence设备,有APC的powerswitch,以太网的电源插座,用命令来指定对应的ID好进行控制关机还是重启!

仲裁设备
在RHCS下仲裁机制是一个仲裁盘,额外通过存储实现,比如SAN,通过mkqdisk命令来制作一个特殊设备
主从服务器的投票数都是1,双方平等,当心跳有问题的时候就会发生脑列,这个仲裁盘在RHCS中是可以设置投票数的,比如你可以设置仲裁盘投票数为2,节点双方使用ping网关的方式将资金的存货状态写入仲裁盘内,一旦节点心跳发生问题,并且仲裁盘没有收到节点的存货信息,则启动fence设备来进行关闭,或者重启设备!

前提都是主机无法通信(心跳问题)的时候发生
1,各自ping网关,ping不通自己关机
2,主备和仲裁设备连接,出问题的时候,把各自存活状态,写入到仲裁设备,由仲裁设备控制主备服务器的电源

stonith,shoot the other node in the head 简写,它是hearbeat软件包的一个组件,他允许使用一个远程或智能的链接到健康服务器的电源设备自动重启失效服务器的电源,stonith设备可以关闭电源并响应软件命令,允许heartbeat的服务器可以通过串口线或者网线向stonith设备传送命令,他控制高可用服务器对其他服务器的电力供应,换句话说,主服务器可以复位备用服务器的电源,备用服务器也可以复位主服务器的电源

stonith事件触发工作步骤
1,当备用服务器接受不到stontih事件开始
这并不意味着主服务器没有发送心跳,心跳可能有多种原因而没有抵达设备,这就是为什么建议至少需要两条物理路径传输避免出现假象的原因、
2,备用服务器发出一个stonith复位命令到stonith设备
3,stonith设备关闭主服务器的电力供应
4,一经切断主服务器的电源,它就不能再访问集群资源,也不能再为客户端提供资源,保证客户端计算机不能访问主服务器上的资源,排除可能发生的脑列状态
5,然后备用服务器获得主服务器上的资源,heartbeat用start参数运行资源脚本,并执行ARP欺骗广播以便客户端计算机发送他们的请求到网络接口上

0 分享

您可以选择一种方式赞助本站

支付宝扫码赞助

支付宝扫码赞助

日期: 2015-12-06分类: HeartBeat

标签: heartbeat

发表评论