Mysql复制模式的取舍。

现在想请教你关于Mysql复制模式:mixed,row,STATEMENT这三种模式的选择问题。

我们目前的实际环境中存在大量
需要对自增长字段增加的数据保持一致

因为主从同步有延时的时候,如果因为一些特殊原因延时特别严重,假设1小时或者几个小时。
如果采用mixed或者STATEMENT,主从两台机器数据就会不一致。
如果采用row方式应该不会产生数据不一致。但是采用row这种方式,产生的二进制文件数据量又会远大于mixed和STATEMENT这两种模式。

不知道这几种复制模式,在具体不同的运用场景下应该如何取舍。

假设在我叙述的环境中,我最好采用哪种模式。

如果我采用mixed或者STATEMENT模式,像遇到自增长字段添加数据;这种情况,我应该如何解决。

谢谢。

作者: lanbaibai   发布时间: 2011-05-20

我用MIXED,没有发现你说的自增字段的问题。

作者: zuoxingyu   发布时间: 2011-05-20

zz
http://apps.hi.baidu.com/share/detail/31674919


MySQL 5.1 中,在复制方面的改进就是引进了新的复制技术:基于行的复制。简言之,这种新技术就是关注表中发生变化的记录,而非以前的照抄 binlog 模式。从 MySQL 5.1.12 开始,可以用以下三种模式来实现:基于SQL语句的复制(statement-based replication, SBR),基于行的复制(row-based replication, RBR),混合模式复制(mixed-based replication, MBR)。相应地,binlog的格式也有三种:STATEMENT,ROW,MIXED。MBR 模式中,SBR 模式是默认的。

在运行时可以动态低改变binlog的格式,除了以下几种情况:

1. 存储过程或者触发器中间

2. 启用了NDB

3. 当前会话试用 RBR 模式,并且已打开了临时表

如果binlog采用了 MIXED 模式,那么在以下几种情况下会自动将binlog的模式由 SBR 模式改成 RBR 模式。

1. 当DML语句更新一个NDB表时

2. 当函数中包含 UUID() 时

3. 2个及以上包含 AUTO_INCREMENT 字段的表被更新时

4. 行任何 INSERT DELAYED 语句时

5. 用 UDF 时

6. 视图中必须要求使用 RBR 时,例如创建视图是使用了 UUID() 函数

设定主从复制模式的方法非常简单,只要在以前设定复制配置的基础上,再加一个参数:

binlog_format="STATEMENT"
#binlog_format="ROW"
#binlog_format="MIXED"

当然了,也可以在运行时动态修改binlog的格式。例如

mysql> SET SESSION binlog_format = 'STATEMENT';
mysql> SET SESSION binlog_format = 'ROW';
mysql> SET SESSION binlog_format = 'MIXED';

mysql> SET GLOBAL binlog_format = 'STATEMENT';
mysql> SET GLOBAL binlog_format = 'ROW';
mysql> SET GLOBAL binlog_format = 'MIXED';

现在来比较以下 SBR 和 RBR 2中模式各自的优缺点
SBR 的优点:

1. 历史悠久,技术成熟

2. binlog文件较小

3. binlog中包含了所有数据库更改信息,可以据此来审核数据库的安全等情况

4. binlog可以用于实时的还原,而不仅仅用于复制

5. 主从版本可以不一样,从服务器版本可以比主服务器版本高

SBR 的缺点:

1. 不是所有的UPDATE语句都能被复制,尤其是包含不确定操作的时候。

2. 调用具有不确定因素的 UDF 时复制也可能出问题

3. 使用以下函数的语句也无法被复制:
* LOAD_FILE()
* UUID()
* USER()
* FOUND_ROWS()
* SYSDATE() (除非启动时启用了 --sysdate-is-now 选项)

4. INSERT ... SELECT 会产生比 RBR 更多的行级锁

5. 复制需要进行全表扫描(WHERE 语句中没有使用到索引)的 UPDATE 时,需要比 RBR 请求更多的行级锁

6. 对于有 AUTO_INCREMENT 字段的 InnoDB表而言,INSERT 语句会阻塞其他 INSERT 语句

7. 对于一些复杂的语句,在从服务器上的耗资源情况会更严重,而 RBR 模式下,只会对那个发生变化的记录产生影响

8. 存储函数(不是存储过程)在被调用的同时也会执行一次 NOW() 函数,这个可以说是坏事也可能是好事

9. 确定了的 UDF 也需要在从服务器上执行

10. 数据表必须几乎和主服务器保持一致才行,否则可能会导致复制出错

11. 执行复杂语句如果出错的话,会消耗更多资源

RBR 的优点:

1. 任何情况都可以被复制,这对复制来说是最安全可靠的

2. 和其他大多数数据库系统的复制技术一样

3. 多数情况下,从服务器上的表如果有主键的话,复制就会快了很多

4. 复制以下几种语句时的行锁更少:
* INSERT ... SELECT
* 包含 AUTO_INCREMENT 字段的 INSERT
* 没有附带条件或者并没有修改很多记录的 UPDATE 或 DELETE 语句

5. 执行 INSERT,UPDATE,DELETE 语句时锁更少

6. 从服务器上采用多线程来执行复制成为可能

RBR 的缺点:

1. binlog 大了很多

2. 复杂的回滚时 binlog 中会包含大量的数据

3. 主服务器上执行 UPDATE 语句时,所有发生变化的记录都会写到 binlog 中,而 SBR 只会写一次,这会导致频繁发生


  binlog 的并发写问题

4. UDF 产生的大 BLOB 值会导致复制变慢

5. 无法从 binlog 中看到都复制了写什么语句

6. 当在非事务表上执行一段堆积的SQL语句时,最好采用 SBR 模式,否则很容易导致主从服务器的数据不一致情况发生

  另外,针对系统库 mysql 里面的表发生变化时的处理规则如下:

1. 如果是采用 INSERT,UPDATE,DELETE 直接操作表的情况,则日志格式根据 binlog_format 的设定而记录

2. 如果是采用 GRANT,REVOKE,SET PASSWORD 等管理语句来做的话,那么无论如何都采用 SBR 模式记录

注:采用 RBR 模式后,能解决很多原先出现的主键重复问题


作者: rucypli   发布时间: 2011-05-20