于今天核查应用报错异常的时候。监控集群日志和监控器发现异常
测试环境场景如下:

主库日志

备库

备库归档全是空的。
经核查是部署问题导致的。 在最新版的dm8 文档提到 集群部署不支持数据文件拷贝的方式。 虽然也能部署起来 ,但是主备不会同步。 因为每个库都有一个数据库魔数( DB_MAGIC ), 每经过一次还原、恢复操作, DB_MAGIC 就会产生变化,需要通过这种方式来区分同一个数据守护环境中各个不同的库 。
解决:
在线联机备份主库, rman 在脱机的备机进行恢复,做备机重建 。
1.
1.
对主库进行联机备份操作
SQL> BACKUP DATABASE BACKUPSET '/dm/data/BACKUP_FILE_01';
备注:如果执行备份时,待备份的库是 Normal 模式,并且不能确定这个库一定作为主库使用,则对 Normal 模式的库必须使用脱机备份,不能使用联机备份方式。因为此次是备库重建,所以直接用联机备份方式。
2.
拷贝备份文件到备库所在机器
3.
直接在原备库上
执行
脱机
数据库还原与恢复
./dmrman CTLSTMT="RESTORE DATABASE '/dm/data/DAMENG/dm.ini' FROM BACKUPSET
'/dm/data/BACKUP_FILE_01'"
./dmrman CTLSTMT="RECOVER DATABASE '/dm/data/DAMENG/dm.ini' FROM BACKUPSET
'/dm/data/BACKUP_FILE_01'"
./dmrman CTLSTMT="RECOVER DATABASE '/dm/data/DAMENG/dm.ini'
UPDATE DB_MAGIC"
4. 重新配置 B 的 dm.ini 、 dmmal.ini 、 dmarch.ini 和 dmwatcher.ini 配置文件 。
5.
以
Mount
方式启动
B
./dmserver /dm/data/DAMENG/dm.ini mount
6. DIsql
登录
B
,设置
OGUID
, 修改备库模式
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL>sp_set_oguid(453332
);
SQL>alter database standby;
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
7.
启动
B
的守护进程
./dmwatcher /dm/data/DAMENG/dmwatcher.ini
执行以上步骤后,恢复 B 的准备过程已经完成。接下来,数据守护系统会将 B 作为备库重加入数据守护系统, A 的守护进程会自动通知同步数据到 B ,最终恢复主备库数据到一致状态。
登陆监控器查看集群健康状态:


一切正常。集群修复完成。