1. 
          

          1. 新聞動(dòng)態(tài)

            瘋了!一個(gè)rm-rf把公司整個(gè)數據庫刪沒(méi)了...

            常見(jiàn)問(wèn)題 發(fā)布者:cya 2019-12-18 08:58 訪(fǎng)問(wèn)量:87

            作者:zhouyu

            經(jīng)歷了兩天不懈努力,終于恢復了一次誤操作刪除的生產(chǎn)服務(wù)器數據。
            對本次事故過(guò)程和解決辦法記錄在此,警醒自己,也提示別人莫犯此錯。
            也希望遇到問(wèn)題的朋友能找到一絲靈感解決問(wèn)題。

            01
            事故背景

            安排一個(gè)妹子在一臺生產(chǎn)服務(wù)器上安裝 Oracle,妹子邊研究邊安裝,感覺(jué)裝的不對,準備卸載重新安裝。


            從網(wǎng)上找到卸載方法,其中要執行一行命令刪除 Oracle 的安裝目錄,命令如下:
            rm -rf $ORACLE_BASE/*


            如果 ORACLE_BASE 這個(gè)變量沒(méi)有賦值,那命令就變成了:
            rm -rf /*


            等等,妹子使用的可是 Root 賬戶(hù)啊。就這樣,把整個(gè)盤(pán)的文件全部刪除了,包括應用 Tomcat、MySQL 數據庫 and so on......


            MySQL 數據庫不是在運行嗎?Linux 能刪除正在執行的文件?反正是徹底刪除了,最后還剩一個(gè) Tomcat 的 Log 文件,估計是文件過(guò)大,一時(shí)沒(méi)有刪除成功。


            看著(zhù)妹子自責的眼神,又是因為這事是我安排她做的,也沒(méi)有跟她講清厲害關(guān)系,沒(méi)有任何培訓,責任只能一個(gè)人背了,況且怎么能讓美女背負這個(gè)責任呢?


            打電話(huà)到機房,將盤(pán)掛到另一臺服務(wù)器上,SSH 上去查看文件全部被清,這臺服務(wù)器運行的可是一個(gè)客戶(hù)的生產(chǎn)系統啊,已經(jīng)運行大半年了,得盡快恢復啊。


            于是找來(lái)脫機備份的數據庫,發(fā)現備份文件只有 1KB,里面只有幾行熟悉的 mysqldump 注釋?zhuān)y道是 Crontab 執行的備份腳本有問(wèn)題),最接近的備份也是 2013 年 12 月份的了,真是屋漏偏逢連夜雨啊。


            想起來(lái)一位領(lǐng)導說(shuō)過(guò)的案例:當一個(gè)生產(chǎn)系統掛掉以后,發(fā)現所有備份都有問(wèn)題,刻錄的光盤(pán)也有劃痕,磁帶機也壞了(一個(gè)業(yè)界前輩,估計以前還用光盤(pán)做備份了),沒(méi)想到今天真的應驗到我的身上了,怎么辦?


            部門(mén)領(lǐng)導知道情況后,已經(jīng)做了最壞的 B 計劃:領(lǐng)導親自帶隊和產(chǎn)品 AA 周日趕到客戶(hù)所在的地市,星期一去領(lǐng)導層溝通;BB 和 CC 去客戶(hù)管理員那邊想辦法說(shuō)服客戶(hù)......

            02
            救命稻草:ext3grep

            趕快到網(wǎng)上去查資料進(jìn)行誤刪數據恢復,還真找到一款 ext3grep 能夠恢復通過(guò) rm -rf 刪除的文件,我們磁盤(pán)也是 ext3 格式,且網(wǎng)上有不少的成功案例。


            于是燃起了一絲希望,趕快對盤(pán) umount,防止重新寫(xiě)入補刪文件扇區。下載 ext3grep,安裝(編譯安裝過(guò)程艱辛暫且不表)。


            先執行掃描文件名命令:
            ext3grep /dev/vgdata/LogVol00 --dump-names


            打印出了所有被刪除文件及路徑,心中狂喜,不用執行 B 計劃了,文件都在呢。


            這款軟件不能按目錄恢復文件,只能執行恢復全部命令:
            ext3grep /dev/vgdata/LogVol00 --restore-all


            結果當前盤(pán)空間不足,沒(méi)辦法只能恢復文件,嘗試了幾個(gè)文件,居然部分成功部分失?。?/span>
            ext3grep /dev/vgdata/LogVol00 --restore-file var/lib/mysql/aqsh/tb_b_attench.MYD


            心里不禁一涼,難道是刪除磁盤(pán)上被寫(xiě)過(guò)文件了?恢復機率不大了啊,能恢復幾個(gè)算幾個(gè)吧,說(shuō)不定重要數據文件剛好在能恢復的 MYD 文件中。


            于是先將所有文件名重定向到一個(gè)文件文件中:
            ext3grep /dev/vgdata/LogVol00 --dump-names >/usr/allnames.txt


            過(guò)濾出來(lái)所有 MySQL 數據庫的文件名存成 mysqltbname.txt。


            編寫(xiě)腳本恢復文件:
            while read LINE
            do
                echo "begin to restore file " $LINE
                ext3grep /dev/vgdata/LogVol00 --restore-file $LINE
                if [ $? != 0 ]
                then
                    echo "restore failed, exit"
                   # exit 1
                fi
            done < ./mysqltbname.txt


            執行,大概運行了 20 分鐘,恢復了 40 多個(gè)文件,但不夠啊,我們將近 100 張表,每張表 frm,myd,myi 三個(gè)文件,怎么說(shuō)也有 300 多個(gè)左右??!


            將找回來(lái)的文件附到現有數據庫上,更要文件權限為 777 后,重啟 MySQL,也算是找回一部分數據了,但客戶(hù)重要的考勤簽到數據、手機端上報數據(據說(shuō)客戶(hù)按這些數據做員工績(jì)效的)還沒(méi)找回來(lái)啊。


            咋辦?中間又試了另一款工具 extundelete,跟 ext3grep 語(yǔ)法基本一致,原理應該也一樣了,但是據說(shuō)能按目錄恢復。


            好吧,試一試:
            extundelete /dev/vgdata/LogVol00 --restore-directory var/lib/mysql/aqsh


            果然不出所料,恢復不出來(lái)?。。。。。。?!那些文件已被破壞了。跟領(lǐng)導匯報,執行 B 計劃吧......無(wú)奈之下下班回家。(周末了,回去休息一下,想想辦法吧)

            03
            靈機一動(dòng):Binlog

            第二天早晨一早就醒了(心里有事?。?,背上電腦,去公司(這個(gè)周末算是報銷(xiāo)了,不挨批,通報,罰款,開(kāi)除就不錯了,還過(guò)什么周末?。?。


            依舊運行 ext3grep,extundelete,也就那幾招啊,把系統架到測試服務(wù)器上,看看數據能不能想辦法補一補吧。


            在測試服務(wù)器上進(jìn)行 mysqldump,恢復文件,覆蓋恢復回來(lái)的文件,給文件加權限,重啟 MySQL。


            Wait,Wait,不是有 Binlog 嗎?我們服務(wù)都要求開(kāi)啟 Binlog,說(shuō)不定能通過(guò) Binlog 里恢復數據呢?


            于是從 Dump 出來(lái)的文件名里找到 Binlog 的文件,一共三個(gè):
            • mysql-binlog0001
            • mysql-bin.000009
            • mysql-bin.000010


            恢復一下 0001:
            ext3grep /dev/vgdata/LogVol00 --restore-file var/lib/mysql/mysql-bin.000001


            居然失敗了......再看另兩個(gè)文件,mysql-bin.000010 大概幾百 MB,應該靠譜一點(diǎn),執行還原命令,居然成功了!


            趕快 SCP 到測試服務(wù)器。執行 Binlog 還原:
            mysqlbinlog /usr/mysql-bin.000010 | mysql -uroot -p


            輸入密碼,卡住了(好現象),經(jīng)過(guò)漫長(cháng)的等待,終于結束了。打開(kāi)應用,哦,感謝 CCTV,MTV,數據回來(lái)了!

            04
            后記



            也希望謹記此次事故,以后不再犯同樣的錯誤。事故反思如下:

            • 本次安排 MM 進(jìn)行服務(wù)器維護時(shí)沒(méi)有提前對她進(jìn)行說(shuō)明厲害情況,自己也未重視,管理混亂,流程混亂。一個(gè)在線(xiàn)的生產(chǎn)系統,任何一個(gè)改動(dòng)一定要先謀而后動(dòng)。
            • 自動(dòng)備份出現問(wèn)題,沒(méi)有任何人檢查。脫機備份人員每次從服務(wù)器上下載 1K 的文件卻從未重視。需要明確大家在工作崗位上的責任。
            • 事故發(fā)生后,沒(méi)有及時(shí)發(fā)現,造成部分數據寫(xiě)入磁盤(pán),造成不可恢復問(wèn)題。需要編寫(xiě)應用監控程序,服務(wù)一旦有異常,短信告警相關(guān)責任人。
            • 根據評論提醒,再加一條:不能使用 Root 用戶(hù)來(lái)操作。應該在服務(wù)器上開(kāi)設不同權限級別的用戶(hù)。


            通過(guò)本次事故
            分享下本文所用到的工具鏈接:

            1.https://code.google.com/p/ext3grep/
            2.http://extundelete.sourceforge.net/

            功能跟 ext3grep 差不多,原理應該也差不多。編譯安裝依賴(lài)包比較多,可以到網(wǎng)上搜索如何安裝?!究上У氖亲髡呓o出的 howto 被墻了,我 FQ 將 howto 的 pdf 文檔下載下來(lái)了,讀完后你將會(huì )對 Linux 的文件系統有進(jìn)一步的認識?!?/span>


            這個(gè)工具有一個(gè) Bug,出錯后不會(huì )向下執行:
            ext3grep: init_directories.cc:534: void init_directories(): Assertion `lost_plus_found_directory_iter != all_directories.end()' failed.


            從而造成恢復失敗,作者放出了一個(gè)補丁,下載地址:補丁下載。

            最后希望各位同行的小伙伴們能謹記本文事件,開(kāi)心敲代碼,永遠不出錯~


            關(guān)鍵字: 數據庫 Binlog ext3grep 開(kāi)封網(wǎng)站建設

            文章連接: http://www.gostscript.com/cjwt/647.html

            版權聲明:文章由 晨展科技 整理收集,來(lái)源于互聯(lián)網(wǎng)或者用戶(hù)投稿,如有侵權,請聯(lián)系我們,我們會(huì )立即刪除。如轉載請保留

            双腿国产亚洲精品无码不卡|国产91精品无码麻豆|97久久久久久久极品|无码人妻少妇久久中文字幕
                1.