MySQL 8.0.23中復(fù)制架構(gòu)從節(jié)點(diǎn)自動(dòng)故障轉(zhuǎn)移的問題
接觸MGR有一段時(shí)間了,MySQL 8.0.23的到來,基于MySQL Group Replicaion(MGR)的高可用架構(gòu)又提供了新的架構(gòu)思路。
災(zāi)備機(jī)房的slave,如何更好的支持主機(jī)房的MGR?
MGR 到底可以壞幾個(gè)節(jié)點(diǎn)?
這次我就以上2個(gè)問題,和大家簡(jiǎn)單聊下MGR的一些思想和功能。
一、MySQL Group Relication 成員數(shù)量的容錯(cuò)能力上面的表格相信大家不會(huì)陌生了,我經(jīng)常在面試?yán)飼?huì)問:“4個(gè)節(jié)點(diǎn)的MGR,最多壞幾個(gè)呢?” ,多數(shù)人回答:“最多壞1個(gè),壞2個(gè)就腦裂不能工作了。”
那我們來看看MGR的處理方式,是不是這個(gè)答案呢?
1)我們具有一個(gè)4節(jié)點(diǎn)MGR
埋一個(gè)問題:這個(gè)圖一看就是Single模式,但箭頭不是單向,是不是畫錯(cuò)了?
2)此時(shí),Second-04突然宕機(jī)了,那么MGR集群會(huì)成什么樣子呢?
集群此時(shí)狀態(tài)會(huì)變成:
那么重點(diǎn)來了,敲黑板
在Second-04,沒有被驅(qū)逐出去時(shí):
此時(shí)集群是(4節(jié)點(diǎn)-3健康-1壞),這個(gè)期間如果繼續(xù)壞1個(gè)節(jié)點(diǎn),那么集群變成(4節(jié)點(diǎn)-2健康-2壞),集群沒有滿足多數(shù)原則,每個(gè)節(jié)點(diǎn)都無法寫入了(除非人工干預(yù),強(qiáng)制指定集群成員List)。
在Second-04,被驅(qū)逐出去后:
此時(shí)集群是(3節(jié)點(diǎn)-3健康-0壞),4節(jié)點(diǎn)集群退化成3節(jié)點(diǎn)健康集群了,這個(gè)時(shí)候,集群依然可以繼續(xù)壞一個(gè)節(jié)點(diǎn),變成(3節(jié)點(diǎn)-2健康-1壞)
所以4節(jié)點(diǎn)集群是否可以壞1個(gè)還是2個(gè),具體要看集群處理過程哪個(gè)階段哦。
PS:
我們說說剛才埋的問題:這個(gè)圖一看就是Single模式,但箭頭不是單向,是不是畫錯(cuò)了?
首先Single模式,Second節(jié)點(diǎn)默認(rèn)是不能寫入的,但只是由于Second節(jié)點(diǎn)的super-read-only開啟了。
將Second節(jié)點(diǎn)super-read-only = 0,Second節(jié)點(diǎn)可以正常寫入,并可以同步其他節(jié)點(diǎn)(Primary和其他Second),傳輸還是基于Paxos協(xié)議的。
跑個(gè)火車:Second節(jié)點(diǎn)反向同步其他節(jié)點(diǎn),是不會(huì)經(jīng)過沖突檢測(cè)階段(理論效率要高于多寫模式),沒有驗(yàn)證,大家有興趣可以研究下。
二、 Asynchronous Connection FailoverMySQL 8.0.22,推出了異步復(fù)制連接故障轉(zhuǎn)移,很多朋友都發(fā)文做了介紹,這里我只簡(jiǎn)單描述下:
1)同機(jī)房1主1從,異地機(jī)房單獨(dú)放一個(gè)slave節(jié)點(diǎn)
2)Master 故障,將Slave-01變成Master,Slave-02無法連接原Master
3)如果對(duì)Slave-02配置了“異步連接故障轉(zhuǎn)移配置”,那么Slave-02在識(shí)別原Master故障后,會(huì)自動(dòng)嘗試按照預(yù)先定義好的配置,與原Slave-01(新Master)建立復(fù)制關(guān)系:
這個(gè)功能非常好,引用三方工具(例如MHA的修復(fù)主從關(guān)系)已經(jīng)可以被MySQL原生功能代替了。
但我測(cè)試完,又有了幾點(diǎn)疑慮:
1. “異步”復(fù)制故障轉(zhuǎn)移,難道不支持半同步架構(gòu)?不能確保數(shù)據(jù)不丟失,還是無法完全代替MHA啊?答:其實(shí)是支持增強(qiáng)半同步的。
2. 要預(yù)先配置故障轉(zhuǎn)移的Master List,那么A機(jī)房架構(gòu)變更,還要去維護(hù)機(jī)房B的節(jié)點(diǎn)嗎?答:是的。
3. 如果A機(jī)房是MGR,那么MGR的節(jié)點(diǎn)(master)異常,但服務(wù)沒有關(guān),可以訪問,機(jī)房B節(jié)點(diǎn)豈不是一直連接著?答:是的
然后,MySQL 8.0.23發(fā)布了,帶來了此功能的增強(qiáng):
Slave可以支持MGR集群,并且可以動(dòng)態(tài)識(shí)別MGR成員,來建立Master-Slave關(guān)系了
最后讓我們跑一圈:
1)首先我們有3節(jié)點(diǎn)的MGR集群,版本8.0.22(異步連接故障轉(zhuǎn)移,是作用在Slave的IO Thread上的,所以Slave是8.0.23版本就成)
+----------------------------+-------------+--------------+-------------+---------------------+| now(6) | member_host | member_state | member_role | VIEW_ID |+----------------------------+-------------+--------------+-------------+---------------------+| 2021-01-22 13:41:27.902251 | mysql-01 | ONLINE | SECONDARY | 16112906030396799:9 || 2021-01-22 13:41:27.902251 | mysql-02 | ONLINE | PRIMARY | 16112906030396799:9 || 2021-01-22 13:41:27.902251 | mysql-03 | ONLINE | SECONDARY | 16112906030396799:9 |+----------------------------+-------------+--------------+-------------+---------------------+
2)然后我們?cè)讵?dú)立Slave節(jié)點(diǎn),指定Slave上“對(duì)Master連接故障轉(zhuǎn)移列表”
SELECT asynchronous_connection_failover_add_managed(’ch1’, ’GroupReplication’, ’aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaa1’, ’mysql-02’, 3306, ’’, 80, 60);簡(jiǎn)單解釋下參數(shù):ch1:chanel名稱GroupReplication:強(qiáng)制寫死的參數(shù),目前支持MGR集群aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaa1:MGR組名(參數(shù) group_replication_group_name)mysql-02:MGR成員之一80:Primary節(jié)點(diǎn)的優(yōu)先級(jí)(0-100),多主相同優(yōu)先級(jí)則隨機(jī)選擇節(jié)點(diǎn)充當(dāng)master。60:Second節(jié)點(diǎn)的優(yōu)先級(jí)(0-100),基本就是給Single模式準(zhǔn)備的
3)為Slave指定復(fù)制通道信息
CHANGE REPLICATION SOURCE TO SOURCE_USER=’rpl_user’, SOURCE_PASSWORD=’123456’, SOURCE_HOST=’mysql-02’,SOURCE_PORT=3306,SOURCE_RETRY_COUNT=2,SOURCE_CONNECTION_AUTO_FAILOVER=1,SOURCE_AUTO_POSITION=1 For CHANNEL ’ch1’;
4)啟動(dòng)Slave,并查看“連接的可轉(zhuǎn)移列表”
不開啟io thread,是不會(huì)自動(dòng)識(shí)別MGR成員的。并且復(fù)制用戶
rpl_user需要在MGR節(jié)點(diǎn)對(duì)performance_schema具有select權(quán)限
start slave;SELECT * FROM performance_schema.replication_asynchronous_connection_failover;+--------------+----------+------+-------------------+--------+--------------------------------------+| CHANNEL_NAME | HOST | PORT | NETWORK_NAMESPACE | WEIGHT | MANAGED_NAME |+--------------+----------+------+-------------------+--------+--------------------------------------+| ch1 | mysql-01 | 3306 | | 60 | aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaa1 || ch1 | mysql-02 | 3306 | | 80 | aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaa1 || ch1 | mysql-03 | 3306 | | 60 | aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaa1 |+--------------+----------+------+-------------------+--------+--------------------------------------+
5)然后我們將mysql-02 stop group_replication(不是關(guān)閉服務(wù)),
Slave列表自動(dòng)淘汰mysql-02,重新與其他節(jié)點(diǎn)建立連接-- mysql-02(Primary):
stop group_replication;-- Slave:SELECT * FROM performance_schema.replication_asynchronous_connection_failover;+--------------+----------+------+-------------------+--------+--------------------------------------+| CHANNEL_NAME | HOST | PORT | NETWORK_NAMESPACE | WEIGHT | MANAGED_NAME |+--------------+----------+------+-------------------+--------+--------------------------------------+| ch1 | mysql-01 | 3306 | | 80 | aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaa1 || ch1 | mysql-03 | 3306 | | 60 | aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaa1 |+--------------+----------+------+-------------------+--------+--------------------------------------+show slave statusG*************************** 1. row ***************************Slave_IO_State: Waiting for master to send event Master_Host: mysql-01 Master_User: rpl_user Master_Port: 3306Connect_Retry: 60 Master_Log_File: mybinlog.000003 Read_Master_Log_Pos: 4904Relay_Log_File: mysql-01-relay-bin-ch1.000065Relay_Log_Pos: 439 Relay_Master_Log_File: mybinlog.000003 Slave_IO_Running: Yes Slave_SQL_Running: Yes ...
至此,配置完成。后面MGR節(jié)點(diǎn)增、減,Slave都可以自動(dòng)維護(hù)這個(gè)列表。不貼其他用例了。
PS:
如果想手工切換Slave已建立的Master節(jié)點(diǎn)(Primary)連接到其他節(jié)點(diǎn)(Second)上,只需要?jiǎng)h除“復(fù)制連接的可轉(zhuǎn)移列表”,重新調(diào)整Second優(yōu)先級(jí)加回即可。
-- 刪除配置SELECT asynchronous_connection_failover_delete_managed(’ch1’, ’aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaa1’);-- 重新添加,調(diào)整Second優(yōu)先級(jí)高于PrimarySELECT asynchronous_connection_failover_add_managed(’ch1’, ’GroupReplication’, ’aaaaaaaaaaaa-aaaa-aaaa-aaaaaaaaaaa1’, ’mysql-03’, 3306, ’’, 60, 80);
參考連接:
https://mysqlhighavailability.com/automatic-asynchronous-replication-connection-failover/
https://my.oschina.net/u/4591256/blog/4813037
https://dev.mysql.com/doc/refman/8.0/en/replication-functions-source-list.html
到此這篇關(guān)于MySQL 8.0.23中復(fù)制架構(gòu)從節(jié)點(diǎn)自動(dòng)故障轉(zhuǎn)移的文章就介紹到這了,更多相關(guān)MySQL自動(dòng)故障轉(zhuǎn)移內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. MySQL系列之三 基礎(chǔ)篇2. MySQL索引背后的數(shù)據(jù)結(jié)構(gòu)及算法原理3. Sql Server 壓縮數(shù)據(jù)庫日志文件的方法4. 用 SQL 查詢 DB2 XML 數(shù)據(jù)(1)5. 實(shí)例講解SQL Server中非常有用EXISTS結(jié)構(gòu)6. 詳細(xì)分析mysql MDL元數(shù)據(jù)鎖7. Oracle數(shù)據(jù)庫中獲取固定記錄數(shù)的實(shí)用方法8. MySQL CHAR和VARCHAR該如何選擇9. SQL Server 數(shù)據(jù)庫的更改默認(rèn)備份目錄的詳細(xì)步驟10. Oracle 11g透明數(shù)據(jù)加密安全特性解析
