基于HA 的failover 测试通过,
在物理机上安装集群,遇到问题,原因是我们起初采用的是组播的方式,进行集群间的数据通信,
在内网的环境上,交换机上做了策略禁止了组播,导致我们的集群无法建立,经过网络同事调试,集群测试通过,却发现网络流量很高,
尚不确定是否是因为集群的组播方式引起的。最后集群通讯改为udp点对点方式。目前看在不做网络策略修改的情况下,集群运行正常。
网络流量正常。
在进行压力测试的情况下,应用的响应在每秒100左右的情况下,触发集群failover
集群VIP 的检测与切换时间在5秒钟左右完成。
Postgresql 数据库的主从切换时间在1分钟左右
基于我们的策略, 数据库依赖于VIP 的位置, vip 与数据库的failover 是串行的。
先vip 检测失败,vip 切换, db stop db 切换 。
真个过程,大约需要70秒左右完成。
切换后,业务系统运行正常,访问正常。
切换期间,会造成业务的短暂中断。
技术分享
postgresql 数据库 基于linux-HA 的一个ppt
http://www.slideshare.net/babyyellow/linux-ha