Oracle數(shù)據(jù)庫數(shù)據(jù)丟失?這幾種方法教你來恢復(fù)~
無論是開發(fā)、測試還是運維過程中,大家都可能會因為誤操作、連錯數(shù)據(jù)庫、用錯用戶、語句條件有誤等原因,導(dǎo)致錯誤刪除、錯誤更新等問題。當你恨不得剁掉按回車的那個指頭、捶胸頓足、或者嚇得腿軟時,肯定希望有辦法來恢復(fù)這些數(shù)據(jù)。剛好,oracle 提供了一些強大的方法或機制,可以讓你找到 “后悔藥”。
根據(jù) oracle 數(shù)據(jù)庫的特點和提供的工具,主要方法有以下幾種方法:
- 利用邏輯備份使用 import 工具丟失數(shù)據(jù)的表
- 利用物理備份來通過還原數(shù)據(jù)文件并進行不完全恢復(fù)
- 利用 dbms_logmnr 包從 redo log 文件中恢復(fù)
- 利用 flashback 特性恢復(fù)數(shù)據(jù)
為了方便使用方法的介紹,上述恢復(fù)方法都將基于以下場景進行:系統(tǒng)管理員在前一天晚上 11 點用 export 對數(shù)據(jù)庫做了全庫邏輯備份,然后對所有數(shù)據(jù)文件進行了熱備份。第二天上午 10 點,系統(tǒng)管理員在修改表 TFUNDASSET 的數(shù)據(jù)時,由于修改語句的條件寫錯了,導(dǎo)致一批記錄(幾千條)的 ztm 字段被修改成了錯誤的值,而且已經(jīng)提交。這個表是資產(chǎn)表,相對而言數(shù)據(jù)變化不頻繁。
一、利用邏輯備份使用 import 工具恢復(fù)丟失的數(shù)據(jù)
export/import 是 oracle 提供的用于對數(shù)據(jù)庫進行邏輯備份的工具。該工具適用于備份那些數(shù)據(jù)量不大、業(yè)務(wù)量不多的數(shù)據(jù)庫系統(tǒng)。因為如果在前一天晚上 11 點用 export 做了邏輯備份,那么當今天上午 10 點數(shù)據(jù)庫意外崩潰時,從備份起到數(shù)據(jù)庫崩潰的這段時間里的數(shù)據(jù)修改操作(包括 DDL 和 DML)都會丟失。如果丟失數(shù)據(jù)內(nèi)的表上的數(shù)據(jù)是相對比較穩(wěn)定,也就是說該表上基本沒有 DML 操作,例如標準代碼表、分區(qū)表里的歷史數(shù)據(jù),那么采用 import 來導(dǎo)入該表可以比較完整的恢復(fù)數(shù)據(jù)。如果該表是經(jīng)常變化的業(yè)務(wù)表,那么這些丟失的數(shù)據(jù)只能根據(jù)業(yè)務(wù)情況從紙質(zhì)記錄恢復(fù),或者其他途徑恢復(fù)。
▲示例如下:這個表是一個資產(chǎn)表。相對來說,今天系統(tǒng)運行中修改的數(shù)據(jù)較少,丟失的數(shù)據(jù)量可以承受或者可以從別的途徑恢復(fù)。那就可以用 import 來恢復(fù)。
方法一:
1、把這個表的數(shù)據(jù)備份到另一個表:
2、刪除該表的記錄:
3、執(zhí)行下面的命令:
這個命令中在關(guān)鍵字 tables 中指定需要導(dǎo)入的表名字,ignore=y 表示忽略表已經(jīng)存在的錯誤。
4、導(dǎo)入結(jié)束后,檢查表中的記錄,并用適當?shù)姆椒ɑ謴?fù)當天的修改。
方法二:
1、 把需要恢復(fù)的表導(dǎo)入到另一個用戶下面:
2、檢查數(shù)據(jù)以后,把原表記錄刪除:
3、然后從另一用戶表中插入回去:
4、 數(shù)據(jù)量比較大時可以采用如下方法:
二、利用物理備份來通過還原數(shù)據(jù)文件并進行不完全恢復(fù)
如果數(shù)據(jù)庫運行在歸檔模式下,那么可以通過使用以前的數(shù)據(jù)文件備份進行還原,然后利用歸檔日志進行前滾,直到回滾到錯誤操作的時間點前,然后重置日志文件打開數(shù)據(jù)庫。
可以通過下列方法確認是否是運行在歸檔模式:
如果是如上所示,那么就是運行在歸檔模式了。
▲假定在前一天晚上 11 點做了全庫物理備份,那么可以考慮如下恢復(fù):
1、關(guān)閉數(shù)據(jù)庫:
由于數(shù)據(jù)庫的不完全恢復(fù)必須在一個關(guān)閉的數(shù)據(jù)庫上實施,利用一個舊的數(shù)據(jù)庫的備份還原,然后用日志根據(jù)需要逐步前滾,而不能還原一個新的備份,再回退到某個時間點。
通知各客戶端數(shù)據(jù)庫將關(guān)閉,然后發(fā)出:
數(shù)據(jù)庫已經(jīng)關(guān)閉。
已經(jīng)卸載數(shù)據(jù)庫。
ORACLE 例程已經(jīng)關(guān)閉。
2、確定錯誤操作的時間:
可以根據(jù)操作員的估計來確定不完全恢復(fù)需要前滾停止的時間,也可以利用 LogMiner 來分析日志文件(這個工具將在后面介紹),找出錯誤操作的準確時間。
3、還原數(shù)據(jù)文件:
先對當前的數(shù)據(jù)庫文件進行備份,然后再用以前的最近一次備份覆蓋現(xiàn)有數(shù)據(jù)文件。注意:不覆蓋現(xiàn)有的控制文件。
4、基于時間點恢復(fù),啟動數(shù)據(jù)庫到裝配狀態(tài):
這樣數(shù)據(jù)庫就恢復(fù)到了 2015 年 10 月 20 日的 9 點 58 分零秒。
然后再利用業(yè)務(wù)資料補充這段時間內(nèi)的數(shù)據(jù)。
三、利用 dbms_logmnr 包從 log 文件中恢復(fù)
這個包是由 Oracle 提供,與 dbms_logmnr_d 包配合使用可以方便地分析聯(lián)機日志文件和歸檔日志文件,從這些日志文件中提取出所有對數(shù)據(jù)庫的更改操作。
在使用這個包之前,需要先做一些設(shè)置和修改:
1、打開 initorcl.ora,修改初始化參數(shù) utl_file_dir,設(shè)置 dbms_logmnr_d 包將要使用的數(shù)據(jù)字典文件的放置目錄。
然后重啟數(shù)據(jù)庫使參數(shù)生效。
2、以 sys 用戶連接到數(shù)據(jù)庫執(zhí)行 dbmslmd.sql 腳本重建 dbms_logmnr_d 這個包。
應(yīng)用 Logminer 分析重做日志文件的操作主要有以下步驟:
- 使用 dbms_logmnr_d 里的存儲過程 build 創(chuàng)建一個外部數(shù)據(jù)字典文件;
- 使用 dbms_logmnr 里的存儲過程 add_logfile 添加要分析的日志文件;
- 使用 dbms_logmnr 里的存儲過程 start_logmnr 啟動分析;
- 查詢與 dbms_logmnr 相關(guān)的幾個視圖來獲取日志文件內(nèi)容;
- 使用 dbms_logmnr 里的存儲過程 end_logmnr 結(jié)束分析。
▲下面詳細講述使用的過程
1)使用 dbms_logmnr_d 里的存儲過程 build 創(chuàng)建一個外部數(shù)據(jù)字典文件:
2)使用 dbms_logmnr 里的存儲過程 add_logfile 添加要分析的日志文件到待分析文件列表:
如果沒有運行在歸檔模式,那么由于重做日志文件的循環(huán)使用可能導(dǎo)致日志文件被覆蓋而無法獲取到所要尋找的恢復(fù)條目。如果運行在歸檔模式,則可以通過查看 $ORACLE_HOME\admin\orcl\bdump 目錄下的 alert_orcl.log 里日志文件歸檔的時間和錯誤操作的時間來確定加入哪些歸檔日志文件到待分析的文件列表中去。
注意:執(zhí)行以上過程時 logfilename 參數(shù)需要寫日志文件的全路徑,否則會報錯。重復(fù)以上操作直到把所有需要分析的文件都加到列表中去。這樣就可以啟動進行分析。
3)使用 dbms_logmnr 里的存儲過程 start_logmnr 啟動分析;
這樣就可以通過下面的查詢來獲取日志文件的內(nèi)容了。
4)查詢與 dbms_logmnr 相關(guān)的幾個視圖來獲取日志文件內(nèi)容;
這樣就可以找出要恢復(fù)所需的語句。注意:v$logmnr_contents 只對執(zhí)行 dbms_logmnr.start_logmnr 的會話有效,如果通過其他會話或者使用 dbms_logmnr.end_logmnr 終止了分析,都將不能訪問 v$logmnr_contents 的數(shù)據(jù)。如果要使其他會話也能獲取到這些數(shù)據(jù),可以通過另外建表來實現(xiàn),如:
create table undo_sql as select * from v$logmnr_contents。
再對 undo_sql 進行授權(quán),其他用戶就可以訪問 v$logmnr_contents 的數(shù)據(jù)了。
5)使用 dbms_logmnr 里的存儲過程 end_logmnr 結(jié)束分析。
使用完成以后用下面的命令來結(jié)束分析活動:exec dbms_logmnr.end_logmnr;
這樣就釋放了分配給 logminer 的資源(內(nèi)存和數(shù)據(jù)結(jié)構(gòu))。
從上面的過程可知,如果是更新的數(shù)據(jù)量比較大,而日志文件比較小,就可能會導(dǎo)致日志文件的切換。如果沒有及時去挖掘日志文件(沒有運行在歸檔模式),那么可能會由于日志文件的循環(huán)使用而導(dǎo)致數(shù)據(jù)不可恢復(fù)。如果運行在歸檔模式,也可能由于需要分析的日志文件比較多而時間較長。
四、利用 flashback 新特性恢復(fù)數(shù)據(jù)
Oracle9i 開始提供了閃回查詢(Flashback Query)功能,對于誤刪除或者誤更新并且已經(jīng) commit 了的情況提供了簡便快捷的恢復(fù)方法;而在 Oracle 提供閃回查詢之前,碰到這種情況只能通過備份來進行基于時間點的恢復(fù)或者使用 logmnr 挖掘日志來恢復(fù),無疑這比閃回查詢要麻煩而且費時。
使用這個 Flashback Query 特性的前提條件:
1. 數(shù)據(jù)庫必須處于 Automatic Undo Management 狀態(tài)。
2. ***可以閃回查詢的時間段由 UNDO_RETENTION 初始化參數(shù)(單位為秒)指定
可以通過 ALTER SYSTEM SET UNDO_RETENTION = <seconds>; 來動態(tài)修改參數(shù)值。
▲如何使用 Flashback Query 來恢復(fù)數(shù)據(jù)呢?
1)通過 SQL
使用 SELECT 語句的 AS OF 來進行閃回查詢,語法如下:
使用 AS OF 關(guān)鍵字來對表,視圖或者物化視圖進行 Flashback Query,如果指定了 SCN,那么 expr 部分必須是一個數(shù)字,如果指定了 TIMESTAMP,那么 expr 必須是一個 timestamp 類型的值。查詢結(jié)果將返回在指定的 SCN 或者時間點上的數(shù)據(jù)。
下面我們使用 scott 方案來作一個實驗。
如果想在 update 的子查詢部分使用 AS OF,那么該查詢只能返回一條記錄,否則將會報錯。
可以通過添加一個臨時表作為中轉(zhuǎn),然后再作更新,如下:
2)通過 DBMS_FLASHBACK 包來恢復(fù)
DBMS_FLASHBACK 包提供了以下幾個函數(shù):
- ENABLE_AT_TIME:設(shè)置當前 SESSION 的閃回查詢時間
- ENABLE_AT_SYSTEM_CHANGE_NUMBER:設(shè)置當前 SESSION 的閃回查詢 SCN
- GET_SYSTEM_CHANGE_NUMBER:取得當前數(shù)據(jù)庫的 SCN
- DISABLE:關(guān)閉當前 SESSION 的閃回查詢
當將一個 SESSION 設(shè)置為閃回查詢模式之后,后續(xù)的查詢都會基于那個時間點或者 SCN 的數(shù)據(jù)庫狀態(tài),如果 SESSION 結(jié)束,那么即使沒有明確指定 DISABLE,閃回查詢也會自動失效。
當 SESSION 運行在閃回查詢狀態(tài)時,不允許進行任何 DML 和 DDL 操作。如果要用 DML 操作來進行數(shù)據(jù)恢復(fù)就必須使用 PL/SQL 游標。
▲示例:
通過上面的例子可以看出,只要這個修改的時間不早于 sysdate- (UNDO_RETENTION 指定的秒數(shù)), 就可通過這種方式來恢復(fù)數(shù)據(jù)。
對于問題中的批量數(shù)據(jù),可以寫個過程來完成獲取到更改前的數(shù)據(jù):
然后再用這個臨時表里的數(shù)據(jù)來更新 TFUNDASSET 就可以了。
五、總結(jié)
比較以上幾種恢復(fù)數(shù)據(jù)的方法的使用過程,我們可以看出:
- exp/imp 只適合于數(shù)據(jù)變化不大的表的數(shù)據(jù)丟失的情況,即使用這種方法處理后也需要從業(yè)務(wù)辦理資料中修正數(shù)據(jù),否則導(dǎo)致數(shù)據(jù)丟失;
- 采用基于時間點的不完全恢復(fù)可以恢復(fù)丟失的數(shù)據(jù),但是需要關(guān)關(guān)閉數(shù)據(jù)庫,減少系統(tǒng)可用時間,而且也會丟失恢復(fù)時間點以后的數(shù)據(jù);
- 使用 LogMiner 可以較好的恢復(fù)數(shù)據(jù),但是要求數(shù)據(jù)庫盡可能運行在歸檔模式,否則也可能導(dǎo)致數(shù)據(jù)丟失。好處是不用關(guān)閉系統(tǒng),能夠從日志文件中得到所有的數(shù)據(jù)。
- 使用 Flashback 最方便和簡潔,可以直接得到修改前的數(shù)據(jù),但是需要依賴系統(tǒng)設(shè)置,并且需要占用大量的回滾表空間。
因此選擇什么樣的方法來恢復(fù)數(shù)據(jù),取決于你的系統(tǒng)環(huán)境和具體情況,不能生搬硬套。采用正確的方法才能***程度的減少數(shù)據(jù)的丟失。
當然,***是不需要用到這些恢復(fù)的辦法。前提是,你必須做好以下的工作:
- 為不同環(huán)境創(chuàng)建不同的數(shù)據(jù)庫用戶、不同密碼(如果不能用戶不同,一定要密碼不同);
- 將 owner 和應(yīng)用用戶分開,并做適度授權(quán);
- 在做 DML 前,先用同樣的條件做查詢,看根據(jù)結(jié)果集是否符合預(yù)期。