主从复制就是对主站服务器的mysql数据库进行实时的备份了,我们只要是简单的做一下配置就可以了,但在配置中也碰到一些问题,下面一起来看看.
mysql主从复制,怎么安装mysql数据库,这里不说了,只说它的主从复制,步骤如下:
1、主从服务器分别作以下操作:
1.1、版本一致
1.2、初始化表,并在后台启动mysql
1.3、修改root的密码
2、修改主服务器master:
- #vi /etc/my.cnf
- [mysqld]
- log-bin=mysql-bin
- server-id=108
3、修改从服务器slave:
- #vi /etc/my.cnf
- [mysqld]
- log-bin=mysql-bin
- server-id=3
4、重启两台服务器的mysql
/etc/init.d/mysql restart
5、在主服务器上建立帐户并授权slave:
#/usr/local/mysql/bin/mysql -uroot -pmttang
mysql>GRANT REPLICATION SLAVE ON *.* to 'mysync'@'%' identified by 'q123456'; //一般不用root帐号,“%”表示所有客户端都可能连,只要帐号,密码正确,此处可用具体客户端IP代替,如192.168.1.3,加强安 全。
6、登录主服务器的mysql,查询master的状态:
- mysql>show master status;
- +------------------+----------+--------------+------------------+
- | File | Position | Binlog_Do_DB | Binlog_Ignore_DB |
- +------------------+----------+--------------+------------------+
- | mysql-bin.000001 | 251 | | |
- +------------------+----------+--------------+------------------+
- 1 row in set (0.00 sec)
注:执行完此步骤后不要再操作主服务器MYSQL,防止主服务器状态值变化
7、配置从服务器Slave:
- mysql>change master to aster_host='192.168.145.222',master_user='mysync',master_password='q123456',
- master_log_file='mysql-bin.000001',master_log_pos=251;
-
- Mysql>start slave;
8、检查从服务器复制功能状态:
- mysql> show slave statusG
-
- *************************** 1. row ***************************
-
- Slave_IO_State: Waiting for master to send event
-
- Master_Host: 192.168.2.222
-
- Master_User: mysync
-
- Master_Port: 3306
-
- Connect_Retry: 60
-
- Master_Log_File: mysql-bin.000001
-
- Read_Master_Log_Pos: 600
-
- Relay_Log_File: ddte-relay-bin.000003
-
- Relay_Log_Pos: 251
-
- Relay_Master_Log_File: mysql-bin.000001
-
- Slave_IO_Running: Yes
-
- Slave_SQL_Running: Yes
- ......
注:Slave_IO及Slave_SQL进程必须正常运行,即YES状态,否则都是错误的状态,如:其中一个NO均属错误,错误解答.以上操作过程,主从服务器配置完成.
9、主从服务器测试:
主服务器Mysql,建立数据库,并在这个库中建表插入一条数据,代码如下:
- mysql> create database hi_db;
- Query OK, 1 row affected (0.00 sec)
-
- mysql> use hi_db;
- Database changed
-
- mysql> create table hi_tb(id int(3),name char(10));
- Query OK, 0 rows affected (0.00 sec)
-
- mysql> insert into hi_tb values(001,'wf');
- Query OK, 1 row affected (0.00 sec)
-
- mysql> show databases;
- +--------------------+
- | Database |
- +--------------------+
- | information_schema |
- | hi_db |
- | mysql |
- | test |
- +--------------------+
- 4 rows in set (0.00 sec)
从服务器Mysql查询,代码如下:
- mysql> show databases;
-
- +--------------------+
- | Database |
- +--------------------+
- | information_schema |
- | hi_db |
- | mysql |
- | test |
- +--------------------+
- 4 rows in set (0.00 sec)
-
- mysql> use hi_db
- Database changed
- mysql> select * from hi_tb;
- +------+------+
- | id | name |
- +------+------+
- | 1 | wf |
- +------+------+
- 1 row in set (0.00 sec)
10、完成:编写一shell脚本,用nagios监控slave的两个“yes”,如发现只有一个或零个“yes”,就表明主从有问题了,发短信警报吧.
mysql 数据同步 出现Slave_IO_Running:No问题的解决方法小结
mysql replication 中slave机器上有两个关键的进程,死一个都不行,一个是slave_sql_running,一个是Slave_IO_Running,一个负责与主机的io通信,一个负责自己的slave mysql进程.
下面写一下,这两个要是有no了,怎么恢复。。如果是slave_io_running no了,那么就我个人看有三种情况,一个是网络有问题,连接不上,像有一次我用虚拟机搭建replication,使用了nat的网络结构,就是死都连不上,第二个是有可能my.cnf有问题,配置文件怎么写就不说了,网上太多了,最后一个是授权的问题,replication slave和file权限是必须的,如果不怕死就all咯.
一旦io为no了先看err日志,看看爆什么错,很可能是网络,也有可能是包太大收不了,这个时候主备上改max_allowed_packet这个参数。
如果是slave_sql_running no了,那么也有两种可能,一种是slave机器上这个表中出现了其他的写操作,就是程序写了,这个是会有问题的,今天我想重现,但是有时候会有问题,有 时候就没有问题,现在还不是太明了,后面再更新,还有一种占绝大多数可能的是slave进程重启,事务回滚造成的,这也是mysql的一种自我保护的措 施,像关键时候只读一样。
这个时候想恢复的话,只要停掉slave,set GLOBAL SQL_SLAVE_SKIP_COUNTER=1;再开一下slave就可以了,这个全局变量赋值为N的意思是:
This statement skips the next N events from the master. This is useful for recovering from replication stops caused by a statement.
This statement is valid only when the slave thread is not running. Otherwise, it produces an error.
呵呵,讲的比我清楚.
MYSQL镜像服务器因错误停止的恢复:下午主服务器,由于一些原因,导致死机,重启后,发现从服务器的数据没有跟上,配好MYSQL主从也才前几天的事,没多少经验,第一次碰上这问题,有点焦急,不过,自己试了下,还算解决了.
从服务器上:
Master_Log_File: mysqlhxmaster.000007
Read_Master_Log_Pos: 84285377
看一下主服务器:mysqlhxmaster.000007 | 84450528 |,已经过后很多了,确实没跟上.
show slave statusG
Slave_IO_Running: Yes
Slave_SQL_Running: No
有问题了,Slave_SQL_Running应该是Yes才对,再往下看,有错误的提示:
Last_Errno: 1053
Last_Error: Query partially completed on the master (error on master: 1053) and was aborted. There is a chance that your master is inconsistent at this point. If you are sure that your master is ok, run this query manually on the slave and then restart the slave with SET GLOBAL SQL_SLAVE_SKIP_COUNTER=1; START SLAVE; . Query: 'INSERT INTO hx_stat_record ......(一句SQL语句)'
这里有说明要怎么操作了,先stop slave,然后执行了一下提示的语句,再SET GLOBAL SQL_SLAVE_SKIP_COUNTER=1; START SLAVE;
show slave statusG
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
OK了,从服务器也在几分钟内把堆积的log处理完了,两边又同步了,从MYSQL服务器Slave_IO_Running:No的解决2.
早晨机房意外断电,导致了发现mysql从服务器同步异常,使用以前碰到的Slave_SQL_Running为No的解决办法无效,仍然无法同步.
查看一下状态show slave status
- Master_Log_File: mysqlmaster.000079
- Read_Master_Log_Pos: 183913228
- Relay_Log_File: hx-relay-bin.002934
- Relay_Log_Pos: 183913371
- Relay_Master_Log_File: mysqlmaster.000079
- Slave_IO_Running: No
- Slave_SQL_Running: Yes
主服务器show master statusG
File: mysqlmaster.000080
Position: 13818288
Binlog_Do_DB:
Binlog_Ignore_DB: mysql,test
mysql错误日志:
100512 9:13:17 [Note] Slave SQL thread initialized, starting replication in log 'mysqlmaster.000079' at position 183913228, relay log './hx-relay-bin.002934' position: 183913371
100512 9:13:17 [Note] Slave I/O thread: connected to master 'replicuser@192.168.1.21:3306', replication started in log 'mysqlmaster.000079' at position 183913228
100512 9:13:17 [ERROR] Error reading packet from server: Client requested master to start replication from impossible position ( server_errno=1236)
100512 9:13:17 [ERROR] Got fatal error 1236: 'Client requested master to start replication from impossible position' from master when reading data from binary log
100512 9:13:17 [Note] Slave I/O thread exiting, read up to log 'mysqlmaster.000079', position 183913228
这次是Slave_IO_Running为No,从日志上来看,服务器读mysqlmaster.000079这个Log的183913228这个位置时发生错误,这个位置不存在,于是无法同步.
查看一下这个Log的最后几行:
/*!40019 SET @@session.max_insert_delayed_threads=0*/;
/*!50003 SET @OLD_COMPLETION_TYPE=@@COMPLETION_TYPE,COMPLETION_TYPE=0*/;
# at 4
#100511 9:35:15 server id 1 end_log_pos 98 Start: binlog v 4, server v 5.0.27-standard-log created 100511 9:35:15
# Warning: this binlog was not closed properly. Most probably mysqld crashed writing it.
尝试从损坏之前的位置开始:
SLAVE STOP;
CHANGE MASTER TO MASTER_LOG_FILE='mysqlcncnmaster.000079', MASTER_LOG_POS=183913220;
SLAVE START;
无效!
只好从新的日志开始
SLAVE STOP;
CHANGE MASTER TO MASTER_LOG_FILE='mysqlcncnmaster.000080', MASTER_LOG_POS=0;
SLAVE START;
此时Slave_IO_Running恢复为Yes,同步进行了,观察了会儿,没有任何出错迹象,问题解决,另外,出现Slave_IO_Running:NO还有一个原因是slave上没有权限读master上的数据. |