oracle undo表空间被删除，数据库无法启动，请问如何恢复

Posted 2023-03-21

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了oracle undo表空间被删除，数据库无法启动，请问如何恢复相关的知识，希望对你有一定的参考价值。

工程师发现undo表空间使用率到了100%，在网上随便参考了一个方法就干了（开始状态数据库是联机的），结果数据库无法启动了。操作步骤为
1、先在数据库里把undo表空间offline；
2、停止数据库；
3、后又在系统中把文件rm掉；
4、startup mount;
5、alter database datafile '/u01/app/oracle/oradata/orcl/undotbs01.dbf' offline drop;
6、alter database open; 到这一步时报错：ORA-01092: ORACLE instance terminated. Disconnection forced

首先，undo表空间满是正常的，oracle自然会重用或者扩展它，一般不用管它。
然后，现在要解决的话，需要先把undo tablespace设置成手动，启动数据库，创建新的undo tablespace。把新的设置成默认的。
假设你的库现在是mounted状态
1 创建PFILE(如果已有就是更新)
SQL>create pfile from spfile;
2 关闭数据库
SQL>shutdown immediate
3 在你的$ORACLE_HOME/dbs目录下面找个叫做
init<数据库>.ora的文件,把其中有undo_management=AUTO的一行改成
undo_management=MANUAL
如果没有就在文件末尾填一行
4 以sysdba身份连接数据库
SQL>connect "/ as sysdba"
用刚才改过的文件启动数据库
SQL> startup pfile=<刚才的文件全路径和名字>
这步是最关键的，如果成功，后面就没问题了
5 drop掉原来的表空间
SQL> drop tablespace <原来的undo表空间名字> including contents;
6 创建新的undo表空间
SQL> create UNDO tablespace undotbs2 datafile '/u01/app/oracle/oradata/orcl/undotbs02.dbf' size 100M autoextend on;
7 关闭数据库，
SQL>shutdown immediate
在开始那个init文件里设置UNDO_MANAGEMENT=AUTO
和 UNDO_TABLESPACE=UNDOTBS2
8 再做一次第四步
9 更新spfile
SQL>create spfile from pfile;
10 关闭数据库，正常重新启动
SQL>shutdown immediate
SQL>startup
11 去网上教你删undo那个地方骂它。非常想当然的做法。没有任何理由这么做
12 让你的工程师去学oracle 培训

以上步骤的中的第5步可能会出问题。我不确认。。。但是即使第5步不成功，问题应该也不大参考技术A undo表空间使用到了100%，也不至于要删掉吧。把数据文件设置成自动扩展就是了
undo表空间是循环使用的。
不清楚你数据库目前的状态，版本，参数设置不好回答参考技术B 你真强悍，undo表空间满了，你把它删了能够解决问题啊。。undo表空间都给删除了当然报错了。重新创建一个吧。。你的表空间使用率要高的话，可以适当的把undo_retention 调的大一点。10g的默认的是，900.不知道你的是什么版本。参考技术C PRM-DUL 可以直接从Oracle .DBF数据文件中抽取出表的数据。

Oracle DBA神器：PRM灾难恢复工具，Schema级别数据恢复。PRM For Oracle Database – schema级别oracle数据库数据恢复特性，PRM即ParnassusData Recovery Manager是企业级别Oracle数据库灾难恢复工具。PRM可以在无备份的情况下恢复被truncated掉的表，也可以恢复无法打开的Oracle数据库(Alter Database Open失败)中的数据。

Oracle备份恢复之无备份情况下恢复undo表空间

UNDO表空间存储着DML操作数据块的前镜像数据，在数据回滚，一致性读，闪回操作，实例恢复的时候都可能用到UNDO表空间中的数据。如果在生产过程中丢失或破坏了UNDO表空间，可能导致某些事务无法回滚，数据库无法恢复到一致性的状态，Oracle实例可能宕机，之后实例无法正常启动；如果有多个UNDO表空间数据文件，丢失其中一个数据文件数据库实例可能不会导致实例宕机，数据库无法干净的关闭（只能SHUTDOWN ABORT），数据库实例能正常的重启，但所有未回滚的数据块依然无法处理，尝试新建UNDO表空间、exp、expdp等操作都会收到ORA-604, ORA-376, and ORA-1110的报错，下面通过一个实际的案例讨论如何处理UNDO损坏后的恢复。

如果你的数据库还能干净的关闭，但在正常情况下无法新建UNDO表空间，那么执行以下的步骤：
I.A. THE DATABASE WAS CLEANLY SHUT DOWN
---------------------------------------
If you are ABSOLUTELY POSITIVE that the database was cleanly shutdown,
i.e., it was closed with either shutdown NORMAL or IMMEDIATE, then
the simplest solution is to offline drop the missing datafile, open the
database in restricted mode, and then drop and recreate the undo
tablespace to which the file belonged. DO NOT follow this procedure
if the database was shut down ABORT or if it crashed.
The steps are:
1. Make sure the database was last cleanly shut down.
   Check the alert.log file for this instance. Go to the bottom of
   the file and make sure the last time you shut the database down
   you got the messages:
        "Shutting down instance (immediate)"
   OR
"alter database close normal
         Completed: alter database close normal"
   This also includes the case of a clean shutdown followed by a
   failed attempt to startup the database. In that case, Oracle will
   issue error messages and shut itself down abort. For the purposes
   of this solution, though, this counts as a clean shutdown.
   If that is not the case, i.e., if the last time YOU shut the database
   down it was in abort mode, or the database crashed itself, it is
   NOT safe to proceed. You should follow the instructions for
   case I.B below.
2. If using automatic UNDO_MANAGEMENT, comment out this entry from the parameter
   file, or set it to MANUAL.
将UNDO_MANAGEMENT修改为MANUAL是因为UNDO表空间在自动管理模式下，如果不能成功新建回滚段（后面会DROP现有表空间）将导致数据库实例宕机。
   If using rollback segments, remove all the rollback segments in the
   tablespace to which the lost datafile belongs from the ROLLBACK_SEGMENTS
   parameter in the init.ora file for this instance. If you are not sure about which rollbacks are
   in that tablespace, simply comment out the whole ROLLBACK_SEGMENTS entry.
3. Mount the database in restricted mode.
   SQL> STARTUP RESTRICT MOUNT
以RESTRICT模式启动实例是避免在处理过程中有其他客户端连接。
4. Offline drop the lost datafile.
   SQL> ALTER DATABASE DATAFILE ‘‘ OFFLINE DROP;
5. Open the database.
   SQL> ALTER DATABASE OPEN
   You should receive the message "Statement processed,".
   If instead you get ORA-604, ORA-376, and ORA-1110, it is likely the shutdown
   was not normal/immediate. Review the rest of the options available and/or
   contact Oracle Support Services.
6. Drop the undo tablespace or tablespace which contains rollback segments
   to which the datafile belonged.
   SQL> DROP TABLESPACE INCLUDING CONTENTS;
7. Recreate the undo tablespace. If using rollback segments, recreate the
   rollback segment tablespace and all it‘s rollback segments. Remember to
   bring the rollbacks online after you create them.
SQL> CREATE TABLESPACE UNDOTBS2 DATAFILE <datafile_name< span="" style="word-wrap: break-word;">> SIZE 1G AUTOEXTEND ON NEXT 100M;
8. Edit the parameter file setting:
   UNDO_MANAGEMENT=AUTO
   UNDO_TABLESPACE=
   If using rollback segments, reinclude the rollbacks you just recreated in
   the ROLLBACK_SEGMENTS parameter in the init.ora file for this instance.
   As rollback segments were brought online in step #7, no need to proceed
   with shutdown/startup as needed for undo tablespace. All that is required
   is:
   SQL> ALTER SYSTEM DISABLE RESTRICTED SESSION;

如果你的数据库不能正常关闭，只需要在重启数据库实例之前将下面的参数加到参数文件：
_allow_resetlogs_corruption=TRUE
_offline_rollback_segments="_SYSSMU1$"
_offline_rollback_segments="_SYSSMU2$"
_offline_rollback_segments="_SYSSMU3$"
_offline_rollback_segments="_SYSSMU4$"
_offline_rollback_segments="_SYSSMU5$"
_offline_rollback_segments="_SYSSMU6$"
_offline_rollback_segments="_SYSSMU7$"
_offline_rollback_segments="_SYSSMU8$"
_offline_rollback_segments="_SYSSMU9$"
_offline_rollback_segments="_SYSSMU10$"
_corrupted_rollback_segments="_SYSSMU1$"
_corrupted_rollback_segments="_SYSSMU2$"
_corrupted_rollback_segments="_SYSSMU3$"
_corrupted_rollback_segments="_SYSSMU4$"
_corrupted_rollback_segments="_SYSSMU5$"
_corrupted_rollback_segments="_SYSSMU6$"
_corrupted_rollback_segments="_SYSSMU7$"
_corrupted_rollback_segments="_SYSSMU8$"
_corrupted_rollback_segments="_SYSSMU9$"
_corrupted_rollback_segments="_SYSSMU10$"
rollback_segments的具体值可以从v$rollname中获得。
处理完成后停止数据库实例，去掉以上参数，修改好UNDO相关参数即可正常启动数据库实例，之后再手动处理TEMP表空间丢失的TEMP数据文件。
虽然数据库实例能够正常启动，也恢复了UNDO表空间的使用，但这并不代表不一致的块已经恢复，执行某些查询的时候可能会收到报错，数据库完全恢复正常后应该立即执行一次逻辑备份+物理备份，确保数据库的安全。

如果Oracle在运行中很不幸遇到undo损坏，当然最好的方法是完全恢复，不过如果没有备份，可以采用一种非常规的手段（利用Oracle的隐藏参数），如果此时undo包含未提交的事务，会造成一点点的数据丢失（一般都是可忍受的），如果没有未提交的事务，则不会有数据丢失。其主要步骤有：

1. 修改undo表空间管理为手动；
2. 设置隐藏参数(_offline_rollback_segments或_corrupted_rollback_segments)标识受影响的回滚段，使Oracle忽略其上的未提交事务；
3. 手动删除受影响的回滚段和undo表空间，然后重建新的undo表空间；
4. 还原undo表空间管理为自动。

实验如下：
Step 1.
如果undo数据文件损坏，数据库只能到mount状态，open时会出现以下错误：
ORA-01157: cannot identify/lock data file 14 - see DBWR trace file
ORA-01110: data file 14: ‘I:INTEL_DATAO06DMS0UNDO1.O06DMS0‘
说明该undo文件已经损坏或丢失，把该文件offline之后就可以打开数据库了：
SQL> alter database datafile ‘I:INTEL_DATAO06DMS0UNDO1.O06DMS0‘ offline drop; 这个地方需要指定具体的文件名，否则自我试了几次出错
SQL> alter database open;
打开数据库的目的是为了找出受影响的回滚段：
SQL> select segment_name,status from dba_rollback_segs;
SEGMENT_NAME                   STATUS
------------------------------ ----------------
SYSTEM                         ONLINE
_SYSSMU10_1201331463$          OFFLINE
_SYSSMU9_2926456744$           OFFLINE
_SYSSMU8_640224757$            OFFLINE
_SYSSMU7_3984293596$           OFFLINE
_SYSSMU6_3694658906$           OFFLINE
_SYSSMU5_3475919656$           OFFLINE
_SYSSMU4_168502732$            OFFLINE
_SYSSMU3_1987193959$           OFFLINE
_SYSSMU2_3908286755$           OFFLINE
_SYSSMU1_3281912951$           OFFLINE

SQL> show parameter undo

NAME                                 TYPE        VALUE
------------------------------------ ----------- -------------
undo_management                      string      AUTO
undo_retention                       integer     900
undo_tablespace                      string      undo1
关闭数据库：
SQL> shutdown immediate;

Step 2.
创建一个临时的pfile：
SQL> create pfile=‘H:initO06DMS0.ora‘ from spfile;
修改pfile如下：
*.undo_management=‘manual‘ -- undo表空间管理方式修改为手动
*.undo_tablespace=‘undo2‘ --指定一个新的undo表空间
*._offline_rollback_segments=(‘_SYSSMU10_1201331463$‘,‘_SYSSMU9_2926456744$‘,‘_SYSSMU8_640224757$‘,‘_SYSSMU7_3984293596$‘,‘_SYSSMU6_3694658906$‘,‘_SYSSMU5_3475919656$‘,‘_SYSSMU4_168502732$‘,‘_SYSSMU3_1987193959$‘,‘_SYSSMU2_3908286755$‘,‘_SYSSMU1_3281912951$‘) --把所有受影响的回滚段都列在这里
并以改pfile重新启动数据库：
SQL> startup pfile=‘H:initO06DMS0.ora‘

Step 3.
手动删除受影响的回滚段：
SQL>drop rollback segment "_SYSSMU10_1201331463$";
SQL>drop rollback segment "_SYSSMU9_2926456744$";
SQL>drop rollback segment "_SYSSMU8_640224757$";
SQL>drop rollback segment "_SYSSMU7_3984293596$";
SQL>drop rollback segment "_SYSSMU6_3694658906$";
SQL>drop rollback segment "_SYSSMU5_3475919656$";
SQL>drop rollback segment "_SYSSMU4_168502732$";
SQL>drop rollback segment "_SYSSMU3_1987193959$";
SQL>drop rollback segment "_SYSSMU2_3908286755$";
SQL>drop rollback segment "_SYSSMU1_3281912951$";
手动删除旧的undo表空间：
SQL> drop tablespace undo1 including contents;
重建新的undo表空间：
SQL> create undo tablespace undo2 datafile ‘I:INTEL_DATAO06DMS0UNDO2.O06DMS0‘ size 100m;
创建新的spfile，覆盖旧的spfile：
SQL> create spfile from pfile=‘H:initO06DMS0.ora‘;
关闭数据库：
SQL> shutdown immediate;

Step 4.
以原来的spfile启动数据库：
SQL> startup;
还原undo表空间管理为自动：
SQL> alter system set undo_management=‘auto‘ scope=spfile;
取消隐藏参数的设置：
SQL> alter system reset "_offline_rollback_segments" scope=spfile;
重启使其生效：
SQL> shutdown immediate;
SQL> startup
SQL> show parameter undo

NAME                                 TYPE        VALUE
------------------------------------ ----------- -------------------
undo_management                      string      AUTO
undo_retention                       integer     900
undo_tablespace                      string      undo2

最终检查一下：
SQL> select segment_name,status from dba_rollback_segs;

SEGMENT_NAME                   STATUS
------------------------------ ----------------
SYSTEM                         ONLINE
_SYSSMU40_1968985325$          ONLINE
_SYSSMU39_4040503138$          ONLINE
_SYSSMU38_4059847715$          ONLINE
_SYSSMU37_2692202156$          ONLINE
_SYSSMU36_2617425201$          ONLINE
_SYSSMU35_1133967719$          ONLINE
_SYSSMU34_1916939664$          ONLINE
_SYSSMU33_99444166$            ONLINE
_SYSSMU32_162619813$           ONLINE
_SYSSMU31_830375278$           ONLINE

https://asktom.oracle.com/pls/asktom/f?p=100:11:0::::P11_QUESTION_ID:5669213349582

以上是关于oracle undo表空间被删除，数据库无法启动，请问如何恢复的主要内容，如果未能解决你的问题，请参考以下文章