在一次漏扫检查检查中,发现存在部分严重oracle漏洞,经评估需要打11g最新的GI PSU。
打补丁过程按照正常RAC打补丁步骤,不做详细介绍。一直到打补丁完成,启动集群之前都没有遇到问题。打完补丁之后,尝试启动两节点集群的时候,发现集群服务无法启动。
检查集群日志,提示ASM资源检查失败,集群宕,如图:

尝试手动拉起asm实例

ASM实例启动失败,检查日志:

发现在
ASM
实例宕掉之前,出现报错“
SMR is corrupted. Shut down and restart the instance to recreate it
”。随即在
MOS
上查找,找到了
Doc ID 2732507.1
。该文档显示,这是一个在
AIX 7
平台上,给
Oracle 11g RAC
数据库打
OCT 2020 PSU
时会引起的一个
BUG
。补丁版本、系统平台版本、数据库版本均与此次情况吻合。(如下图所示)

按照mos文档 Doc ID 2732507.1 提供的解决方案,下载补丁修复该bug( p32109594_11204201020_AIX64-5L.zip )。
打完补丁之后再尝试启动集群,此时集群、 ASM 、数据库实例都正常启动了。