當前位置:編程學習大全網 - 源碼下載 - MySQL 常用備份工具流程解析

MySQL 常用備份工具流程解析

下面我們就看壹下常見的備份工具,以及目前最流行的 Percona XtraBackup 的備份流程。

MySQL 常見的備份工具主要分為三種:

這裏先說壹下 binlog 備份,它只是把 binlog 又復制了壹份,並且需要在邏輯備份或者物理備份的基礎上才能進行數據恢復,無法單獨進行數據恢復。

mysqldump 備份出的文件就是 sql 文件,其核心就是對每個表執行 select ,然後轉化成相應的 insert 語句。mysqldump 的備份流程大致如下:

從上面可以看出在 mysqldump 備份期間,備份到某個數據庫時,該數據庫下的表都會處於只讀狀態,無法對表進行任何變更,直到該庫下的表備份完畢,這對於線上環境壹般是無法接受的。若是指定了--master-data或者 --dump-slave 則會在備份開始時加全局讀鎖(FLUSH TABLES WITH READ LOCK),直到備份結束。當然我們可以選壹個從庫進行備份,這樣就不會影響線上業務。另外使用 mysqldump 備份還有壹個最大的好處,因為備份出來的是 sql 語句,所以它支持跨平臺和跨版本的數據遷移或者恢復,這是物理備份無法做到的。

但是也正是因為 mysqldump 備份出來的是 sql 語句,在使用時要更加註意,否則可能會釀成大禍。例如,使用 mysqldump 常見的問題有:

所以使用 mysqldump 時壹定要了解各個選項的作用,以及確認備份出來的 sql 文件裏會有什麽操作,會對現有數據造成什麽影響。

Mydumper 原理與 Mysqldump 原理類似,最大的區別是引入了多線程備份,每個備份線程備份壹部分表,當然並發粒度可以到行級,達到多線程備份的目的。這裏不再單獨介紹。

Percona XtraBackup 是 Percona 公司開發的壹個用於 MySQL 數據庫物理熱備的備份工具,是基於 InnoDB 的崩潰恢復功能來實現的。它的基本工作原理如下:

Percona XtraBackup 在進行恢復時會應用拷貝的 redo log ,應用已提交的事務,回滾未提交的事物,將數據庫恢復到壹致性狀態。因為 Percona XtraBackup 備份出來的是物理文件,所以在使用備份出的文件進行恢復或者遷移時,不會像 mysqldump 那樣會存在很多問題。

使用 XtraBackup 備份時根據備份參數設置不同,對數據庫的變更會造成不同程度的影響,具體影響會在下文分析。

通過對比發現,XtraBackup 具有對數據庫影響小,且能快速恢復的優點,在日常備份中是首選;mysqldump 使用相對更加靈活,但是使用是要註意對數據庫原有數據的影響。

備份策略主要有:全量備份和增量備份,再加上 binlog 備份。

目前去哪兒網數據庫備份主要采用 XtraBackup 全量備份 +binlog 備份。數據庫的重要級別不同,全量備份的頻率不同。備份程序主要架構如下:

說明:

Percona XtraBackup 是目前備份 MySQL 使用最廣泛的工具。在備份過程中,數據庫可以進行正常的讀寫或者其他變更操作,但是偶爾也會遇見備份引起的元數據鎖,或提交事務時發現被 binlog lock 阻塞等情況。下面我們就看壹下 Percona XtraBackup 的備份流程和加鎖時機。

說明:以下對 Percona XtraBackup 的分析都是基於 2.4.23 的版本,其他版本會略有差別,但是關鍵步驟基本相同。

XtraBackup 在備份開始時,會創建壹個後臺線程,專門用於拷貝數據庫的 redo log 。首先 XtraBackup 會掃描每組 redo log 的頭部,找出當前的 checkpoint lsn ,然後從該 lsn 後順序拷貝所有的 redo log ,包括後續新產生的 redo log 。該線程會壹直持續到將非事務表完全拷貝完成,才會安全退出。備份日誌輸出中會記錄拷貝開始時的 checkpoint lsn 。日誌輸出如下:

在拷貝ibd文件之前,會先掃描數據庫的數據文件目錄,獲取ibdata1,undo tablespaces及所有的ibd文件列表,並會記錄相應的 space id,因為在恢復時需要這些 space id來找到對應 doublewrite buffer裏頁面的內容,以及對應的redo log條目。然後開始循環拷貝ibdata1,undo tablespaces及所有的ibd文件。

這裏可通過設置--parallel進行多線程備份,提高物理文件的拷貝效率。不設置則默認為1。

在所有ibd文件拷貝完成後,XtraBackup開始備份非ibd文件。這壹部分的邏輯比較復雜,因為備份非ibd文件前需要加鎖,具體是否會加鎖主要受到--no-lock 參數設置的影響。

若是設置了--no-lock為TRUE,則不會使用"FLUSH TABLES WITH READ LOCK"去加全局讀鎖,但是若備份過程中對non-InnoDB表執行了DDL或者DML操作, 這會導致備份的不壹致,恢復出來的數據就會有問題。所以是不建議將--no-lock為TRUE,默認值是FALSE,也就是在不指定該選項的情況下會在備份非ibd文件前加全局讀鎖。

下面我們結合源碼來看看判斷是否加全局鎖這部分的具體流程邏輯:

流程圖如下:

總結來看:

1)若--no-lock為FALSE(默認值),則先施加全局讀鎖,然後再進行拷貝文件,另外若 --safe-slave-backup 設置為TRUE ,則會在加全局鎖之前關閉SQL_THREAD線程;

2)若--no-lock為TRUE,則不會施加鎖,直接進行拷貝文件。

加鎖的邏輯主要由lock_tables_maybe實現,先看壹下lock_tables_maybe源代碼,如下:

lock_tables_maybe 函數簡化處理流程如下:

1)若備份實例上已經加鎖( LOCK TABLES FOR BACKUP / FLUSH TABLES WITH READ LOCK)或者設置lock-ddl-per-table 則直接返回;

2)若支持備份鎖,則執行LOCK TABLES FOR BACKUP;

3)若不支持備份鎖,則執行 FLUSH TABLES WITH READ LOCK。根據相應選項設置,在執行該操作前會判斷是否有執行中的DDL/DML,以及等待超時時間,是否kill 對應的未結束的事務等。

從上文中我們還看到壹個參數--safe-slave-backup ,該參數的主要作用是:

若是在從庫執行的備份操作時設置了該參數,可以防止因從庫同步主庫操作,而導致XtraBackup長時間請求不到鎖而造成備份失敗。

若是設置了 --safe-slave-backup 為TRUE,那麽會執行"STOP SLAVE SQL_THREAD",並等待Slave_open_temp_tables 為零才開始拷貝非 ibd 文件,Slave_open_temp_tables 為零說明SQL thread執行的事務都已經完成,這樣就能保證備份的壹致性。並且此時也不會有在執行的事務阻塞 XtraBackup 施加全局鎖。

備份完非 ibd 文件後,將會備份 slave 和 binlog 信息。

mysql-bin.000004 2004 6b7bda9f-15f0-11ec-ba14-fa163ea367a4:1-83,9841546e-15f0-11ec-9557-fa163e736db4:1

需要註意,在支持備份鎖的實例上備份,指定了 --slave-info 或--binlog-info 均會先施加 binlog 備份鎖( LOCK BINLOG FOR BACKUP),這會阻塞任何會更改 binlog 位點的操作。

備份完數據庫的所有文件和binlog等相關信息,備份工作就基本完成了,之後主要執行的操作如下:

1)執行"FLUSH NO_WRITE_TO_BINLOG ENGINE LOGS",將所有的redo log刷盤;

2)停止redo log復制線程;

3)釋放全局讀鎖(備份鎖),binlog鎖;

4)開啟SQL_THREAD;

5)拷貝ib_buffer_pool和ib_lru_dump文件;

6)生成配置文件backup-my.cnf;

7)打印備份信息到xtrabackup_info文件,這些信息主要包含備份時使用的參數信息,備份起止時間,binlog位點信息,以及將會回到的lsn點。

下面是xtrabackup_info記錄的部分內容:

加鎖對應的函數是 mdl_lock_tables ,釋放鎖對應的函數是 mdl_unlock_all,主要是執行COMMIT,結束 mdl_lock_tables 中開啟的顯式事務,來釋放MDL鎖。mdl_lock_tables 流程如下:

上面參數--lock-ddl和--lock-ddl-per-table是在 Percona XtraBackup 2.4.8 之後添加的,因為 MySQL 5.7 新增了壹個叫做 Sorted Index Builds 的功能,這會導致某些 DDL 操作不記錄重做日誌而導致備份失敗。使用--lock-ddl或--lock-ddl-per-table 就會在備份開始時施加鎖,阻止 DDL 操作。

另外,若備份時指定了--lock-ddl或--lock-ddl-per-table,則在備份非 ibd 文件時就不是再有加鎖操作。

註意:LOCK TABLES FOR BACKUP和LOCK BINLOG FOR BACKUP 語句只有在支持備份鎖的實例上才會執行,Percona Server for MySQL已經在 5.6.16-64.0 版本開始支持這種更加輕量的備份鎖。

Q1: 使用 XtraBackup 備份的文件進行恢復時,恢復到哪個時間點? A1:恢復到執行 LOCK BINLOG FOR BACKUP 或 FLUSH TABLES WITH READ LOCK 的時間點,因為這時任何改變 binlog 位點的操作都會被阻塞,redo log和binlog 是壹致的。

Q2: 在開啟 binlog 的情況下,MySQL 的奔潰恢復是同時依賴 binlog 和 redo log 這兩種日誌的,為什麽XtraBackup 不用備份binlog?

A2:因為在備份中有執行LOCK BINLOG FOR BACKUP/FLUSH TABLES WITH READ LOCK,阻止了任何改變binlog位點的操作,這樣只需要根據redo log將有commit log 的事務提交,沒有commit log的事務進行回滾即可。

Q3: 使用Percona XtraBackup備份完成後redo的位點是和binlog是壹樣還是比binlog多壹些?

A3:通過分析備份流程可以發現備份 binlog 位點信息(加binlog鎖)是發生在停止 redo 拷貝線程前,而釋放鎖是在停止 redo 拷貝線之後,所以 redo log 會多壹些。鎖住了 binlog 保證了在該 binlog 位點前已經提交的事務的 redo log 都有 commit log 的信息,未提交的事物也就沒有對應的 commit log 的信息,即便在鎖住 binlog 後有 Innodb 表新的 DML 產生的 redo log ,但是事務無法提交,也就沒有 commit log 的信息的,最後在回放的過程中對沒有 commit log 的事務進行回滾就可以了。

Q4:Percona XtraBackup什麽時候會加鎖,以及影響加鎖時間長度的因素有哪些?

A4:上面進行了分析,加鎖操作只在備份非 ibd 文件時執行,加鎖時長主要和非事務表的數量和大小有關,非事務表的數量越多,體積越大,拷貝文件所用的時間越長,那麽加鎖時間也就越長。也會和 redo log 生成的速度有關,只是 redo log 刷盤受到多個因素的影響,未及時刷盤的 redo log 壹般很小。

Q5:Percona XtraBackup 和mysqldump選擇哪個更好?

A5:通過上面的的解析,若是整個實例備份,首先選擇 Percona XtraBackup ,因為對數據庫的影響最小。若只是備份某個庫表,這個就要視數據量而定,若數據量不大可以使用 mysqldump 。註意,對數據庫做備份時最好選擇業務連接最少的從庫,因為備份也會消耗壹定的資源,避免影響業務。

  • 上一篇:嵌入式linux調試方法嵌入式linux調試
  • 下一篇:從賣CD開始開發出巫師和賽博朋克2077的CDPR是如何發展至今的
  • copyright 2024編程學習大全網