Oracle
備份與恢復案例
By Piner
一. 理解什么是數據庫恢復
??
當我們使用一個數據庫時,總希望數據庫的內容是可靠的、正確的,但由于計算機系統的故障(硬件故障、軟件故障、網絡故障、進程故障和系統故障)影響數據庫系統的操作,影響數據庫中數據的正確性,甚至破壞數據庫,使數據庫中全部或部分數據丟失。因此當發生上述故障后,希望能重構這個完整的數據庫,該處理稱為數據庫恢復。恢復過程大致可以分為復原
(Restore)
與恢復
(Recover)
過程。
數據庫恢復可以分為以下兩類:
1.1
實例故障的一致性恢復
當實例意外地(如掉電、后臺進程故障等)或預料地(發出
SHUTDOUM ABORT
語句)中止時出現實例故障,此時需要實例恢復。實例恢復將數據庫恢復到故障之前的事務一致狀態。如果在在線后備發現實例故障,則需介質恢復。在其它情況
Oracle
在下次數據庫起動時(對新實例裝配和打開),自動地執行實例恢復。如果需要,從裝配狀態變為打開狀態,自動地激發實例恢復,由下列處理:
(
1
)
?
為了解恢復數據文件中沒有記錄的數據,進行向前滾。該數據記錄在在線日志,
包括對回滾段的內容恢復。
(
2
)
?
回滾未提交的事務,按步
1
重新生成回滾段所指定的操作。
(
3
)
?
釋放在故障時正在處理事務所持有的資源。
(
4
)
?
解決在故障時正經歷一階段提交的任何懸而未決的分布事務。
1.2
介質故障或文件錯誤的不一致恢復
介質故障是當一個文件、一個文件的部分或磁盤不能讀或不能寫時出現的故障。文件錯誤一般指意外的錯誤導致文件被刪除或意外事故導致文件的不一致。這種狀態下的數據庫都是不一致的,需要
DBA
手工來進行數據庫的恢復,這種恢復有兩種形式,決定于數據庫運行的歸檔方式和備份方式。
(
1
)
?
完全介質恢復可恢復全部丟失的修改。一般情況下需要有數據庫的備份且數據庫運行在歸檔狀態下并且有可用歸檔日志時才可能。對于不同類型的錯誤,有不同類型的完全恢復可使用,其決定于毀壞文件和數據庫的可用性。
(
2
)
?
不完全介質恢復是在完全介質恢復不可能或不要求時進行的介質恢復。重構受損的數據庫,使其恢復介質故障前或用戶出錯之前的一個事務一致性狀態。不完全介質恢復有不同類型的使用,決定于需要不完全介質恢復的情況,有下列類型:基于撤消、基于時間和基于修改的不完全恢復。
基于撤消
(CANCEL)
恢復:在某種情況,不完全介質恢復必須被控制,
DBA
可撤消在指定點的操作。基于撤消的恢復地在一個或多個日志組(在線的或歸檔的)已被介質故障所破壞,不能用于恢復過程時使用,所以介質恢復必須控制,以致在使用最近的、未損的日志組于數據文件后中止恢復操作。
基于時間
(TIME)
和基于修改
(SCN)
的恢復:如果
DBA
希望恢復到過去的某個指定點,是一種理想的不完全介質恢復,一般發生在恢復到某個特定操作之前,恢復到如意外刪除某個數據表之前。
第二章. 數據庫恢復案例測試環境
2.1
數據庫環境
以下的所有案例都是通過測試經過,環境為:
? OS
:
Windows 2000 Server
? DB
:
Oracle 816
? DBNAME
:
TEST
數據文件:
SQL> select file#,status,enabled,name from v$datafile;
??? FILE# STATUS? ENABLED??? ? NAME
----------------------------------------------------------------
???????? 1 SYSTEM? READ WRITE D:\Oracle\ORADATA\TEST\SYSTEM01.DBF
???????? 2 ONLINE? READ WRITE D:\Oracle\ORADATA\TEST\RBS01.DBF
???????? 3 ONLINE? READ WRITE D:\Oracle\ORADATA\TEST\USERS01.DBF
???????? 4 ONLINE? READ WRITE D:\Oracle\ORADATA\TEST\TEMP01.DBF
???????? 5 ONLINE? READ WRITE D:\Oracle\ORADATA\TEST\TOOLS01.DBF
???????? 6 ONLINE? READ WRITE D:\Oracle\ORADATA\TEST\INDX01.DBF
控制文件:
SQL> select * from v$controlfile;
STATUS? NAME
---------------------------------------------------------------------
????
?? D:\Oracle\ORADATA\TEST\CONTROL01.CTL
????
?? D:\Oracle\ORADATA\TEST\CONTROL02.CTL
????
?? D:\Oracle\ORADATA\TEST\CONTROL03.CTL
聯機日志:
SQL> select * from v$logfile;
??? GROUP# STATUS? ??? MEMBER
---------------------------------------------------------------------
????? 1 ??? STALE?? ?? D:\Oracle\ORADATA\TEST\REDO01.LOG
????? 2????????? ???? D:\Oracle\ORADATA\TEST\REDO02.LOG
????? 3 ??? STALE?? ?? D:\Oracle\ORADATA\TEST\REDO03.LOG
2.2
數據庫備份腳本
冷備份腳本
:
rem???? script:coldbak.sql
rem???? creater:chenjiping
rem???? date:5.8.2003
rem???? desc:offline full backup database
--connect database
connect internal/password;
--shutdown database
shutdown immediate;
--Copy Data file
!xcopy d:\Oracle\oradata\test\*.dbf d:\database/H/R;
--Copy Control file
!xcopy d:\Oracle\oradata\test\*.ctl d:\database/H/R;
--Copy Log file
!xcopy d:\Oracle\oradata\test\*.log d:\database/H/R;
--startup database
startup;
說明:
1
、以上腳本在數據庫關閉狀態下備份數據庫所有的數據文件,聯機日志,控制文件(在一個目
錄下),如果成功備份,所有文件是一致的
;
2
、沒有備份參數文件,參數文件可以另外備份,沒有必要每次都備份,只需要在改變設置后備份一次
;
3
、如果以上命令沒有成功依次執行,那么備份將是無效的,如連接數據庫不成功,那么肯定關閉數據庫也不成功,那么備份則無效
;
4
、冷備份建議下人工干預下執行。
數據庫
OS
熱全備份腳本
rem???? script:hotbak.sql
rem???? creater:chenjiping
rem??? ?date:5.8.2003
rem???? desc:backup all database datafile in archive
--connect database
connect internal/password;
--archive
alter system archive log current;
--start
alter tablespace system begin backup;
!xcopy d:\Oracle\oradata\test\system01.dbf d:\databak/H/R;
alter tablespace system end backup;
alter tablespace rbs begin backup;
!xcopy d:\Oracle\oradata\test\rbs01.dbf d:\databak/H/R;
alter tablespace rbs end backup;
alter tablespace users begin backup;
!xcopy d:\Oracle\oradata\test\users01.dbf d:\databak/H/R;
alter tablespace users end backup;
alter tablespace tools begin backup;
!xcopy d:\Oracle\oradata\test\tools01.dbf d:\databak/H/R;
alter tablespace tools end backup;
alter tablespace indx begin backup;
!xcopy d:\Oracle\oradata\test\indx01.dbf d:\databak/H/R;
alter tablespace indx end backup;
--end
--bak control file
--binary
alter database backup controlfile to 'd:\databak\controlbinbak.000';
--ascii
alter database backup controlfile to trace;
alter system archive log current;
說明:
1
、熱備份必須在數據庫歸檔方式下才可以運行;
2
、以上腳本可以在數據庫運行狀態下備份數據庫所有的數據文件(除了臨時數據文件),沒有必要備份聯機日志;
3
、歸檔日志至少需要一次完整備份之后的所有日志;
4
、如果以上命令沒有成功依次執行,那么備份也是無效的,如連接數據庫不成功,那么備份則無效。
RMAN
備份只講敘有恢復目錄的情況,如果沒有恢復目錄,情形大致相似。以下是
RMAN
的熱備份全備份的腳本:
#?? script:bakup.rcv
#?? creater:chenjiping
#?? date:5.8.2003
#?? desc:backup all database datafile in archive with rman
# connect database
connect rcvcat rman/rman@back;
connect target internal/virpure;
# start backup database
run{
allocate channel c1 type disk;
backup full tag 'dbfull' format 'd:\backup\full%u_%s_%p' database
include current controlfile;
sql 'alter system archive log current';
release channel c1;
}
# end
說明:
1
、
?
數據庫必須運行在歸檔模式下
;
2
、
?RMAN
將自動備份數據文件,運行可靠
;
3
、
?
歸檔日志另外備份處理,但至少需要保存一次備份來的日志
;
4
、
?
沒有必要用
RMAN
做冷備份,效果不好。
以上舉例說明了數據庫的恢復案例的測試環境與部分備份測試腳本,其它的備份腳本可以根據以上腳本演變而來或在案例中加以說明。
數據庫的自動實例將不加以說明,這里只舉例說明媒體錯誤或人為錯誤造成的恢復可能。
以上包括以下案例都是在
WINDOWS+Oracle816
上測試驗證的,在不同的操作系統與不同的數據庫版本中略有差別。
第三章. 了解與恢復相關的信息
1
、
?
理解報警日志文件
報警日志文件一般記載了數據庫的啟動
/
關閉信息,歸檔信息,備份信息,恢復信息,常見錯誤信息,部分數據庫修改記錄等。一般令名規則為
<SID>Alrt.log
或
Alrt<SID>.log
,如我的測試數據庫的報警日志文件的名稱為
testalrt.log
。
報警日志文件的路徑是根據初始化參數
background_dump_dest
來決定的,如在我的機器上,該參數值為
D:\Oracle\admin\test\bdump
,那么,你就可以在該路徑下找到該文件。
2
、
?
后臺進程跟蹤文件
后臺進程跟蹤文件的路徑與報警日志文件的路徑一致,在某些情況下,你可以通過后臺跟蹤文件的信息了解更多的需要恢復的信息。如在數據庫需要恢復的時候,報警日志文件中常有這樣的語句:
Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:
ORA-01157: cannot identify/lock data file 1 - see DBWR trace file
通過提示的
DBWR
跟蹤文件,可以查詢到更詳細的信息。
3
、
v$recover_file
與
v$recovery_log
這是兩個動態性能視圖,可以在
mount
下查看,通過這兩個視圖,你可以了解詳細的需要恢復的數據文件與需要使用到的歸檔日志。
第四章. 數據庫恢復案例
4.1
非歸檔模式下的備份與恢復
備份方案:采用
OS
冷備份
1.?
連接數據庫并創建測試表
SQL> connect internal/password as sysdba;
Connected.
SQL> create table test(a int);
Table created
SQL> insert into test values(1);
1 row inserted
SQL> commit;
Commit complete
2.?
備份數據庫
SQL> @coldbak.sql
或在
DOS
下
svrmgrl @coldbak.sql
3.?
再插入記錄
SQL> insert into test values(2);
1 row inserted
SQL> commit;
Commit complete
SQL> select * from test;
??????????
??????????????A
-------------------
???????????????????????? 1
???????????????????????? 2
4.?
關閉數據庫
SQL> shutdown immediate;
Database closed.
Database dismounted.
Oracle instance shut down.
5.?
毀壞一個或多個數據文件,如刪除
user01.dbf
C:\>del D:\Oracle\ORADATA\TEST\USERS01.DBF
模擬媒體毀壞。
6.?
重新啟動數據庫,會發現如下錯誤
SQL> startup
Oracle instance started.
Total System Global Area? 102020364 bytes
Fixed Size??????????????????? 70924 bytes
Variable Size????????????? 85487616 bytes
Database Buffers?????????? 16384000 bytes
Redo Buffers?? ???????????????77824 bytes
Database mounted.
ORA-01157: cannot identify/lock data file 3 - see DBWR trace file
ORA-01110: data file 3: 'D:\Oracle\ORADATA\TEST\USERS01.DBF'
在報警文件中,會有更詳細的信息
Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:
ORA-01157: cannot identify/lock data file 3 - see DBWR trace file
ORA-01110: data file 3: 'D:\Oracle\ORADATA\TEST\USERS01.DBF'
ORA-27041: unable to open file
OSD-04002: unable to open file
O/S-Error: (OS 2)
系統找不到指定的文件。
7.?
拷貝備份復原到原來位置
(restore
過程
)
C:\>xcopy d:\database\*.* d:\Oracle\oradata\test/H/R/S
8.?
打開數據庫,檢查數據
SQL> alter database open;
Database altered.
SQL> select * from test;
???????????????????????? A
---------------------------------------
???????????????????????? 1
這里可以發現,數據庫恢復成功,但在備份之后與崩潰之前的數據丟失了。
說明:
1
、非歸檔模式下的恢復方案可選性很小,一般情況下只能有一種恢復方式,就是數據庫的冷備
份的完全恢復,僅僅需要拷貝原來的備份就可以
(restore)
,不需要
recover
;
2
、這種情況下的恢復,可以完全恢復到備份的點上,但是可能是丟失數據的,在備份之后與崩潰之前的數據將全部丟失;
3
、不管毀壞了多少數據文件或是聯機日志或是控制文件,都可以通過這個辦法恢復,因為這個恢復過程是
Restore
所有的冷備份文件,而這個備份點上的所有文件是一致的,與最新的數據庫沒有關系,就好比把數據庫又放到了一個以前的
"
點
"
上;
4
、對于非歸檔模式下,最好的辦法就是采用
OS
的冷備份,建議不要用
RMAN
來作冷備份,效果不好,因為
RMAN
不備份聯機日志,
restore
不能根本解決問題;
5
、如果沒有備份聯機日志,如
RMAN
的備份,就需要利用不完全恢復
(until cancel)
的方法來重新創建聯機日志文件。
4.2
歸檔模式下丟失或損壞一個數據文件
4.2.1 OS
備份方案
在歸檔方式下損壞或丟失一個數據文件,如果存在相應的備份與該備份以來的歸檔日志,恢復還是比較簡單的,可以作到盡量少的
Down
機時間,并能作到數據庫的完全恢復。
1
、
?
連接數據庫,創建測試表并插入記錄
SQL> connect internal/password as sysdba;
Connected.
SQL> create table test(a int) tablespace users;
Table created
SQL> insert into test values(1);
1 row inserted
SQL> commit;
Commit complete
2
、
?
備份數據庫
SQL> @hotbak.sql
或在
DOS
下
svrmgrl @hotbak.sql
3
、
?
繼續在測試表中插入記錄
SQL> insert into test values(2);
1 row inserted
SQL> commit;
Commit complete
SQL> select * from test;
???????????????????????? A
??? --------------------------------------
???????????????????????? 1
???????????????????????? 2
SQL> alter system switch logfile;
System altered.
SQL> alter system switch logfile;
System altered.
4
、
?
關閉數據庫,模擬丟失數據文件
SQL> shutdown immediate;
Database closed.
Database dismounted.
Oracle instance shut down
C:\>del D:\Oracle\ORADATA\TEST\USERS01.DBF
模擬媒體毀壞。
5
、
?
啟動數據庫錯誤,脫機該數據文件:
SQL> startup
Oracle instance started.
Total System Global Area? 102020364 bytes
Fixed Size??????????????????? 70924 bytes
Variable Size????????????? 85487616 bytes
Database Buffers?????????? 16384000 bytes
Redo Buffers????????????????? 77824 bytes
ORA-01157: cannot identify/lock data file 3 - see DBWR trace file
ORA-01110: data file 3: 'D:\Oracle\ORADA