tencent cloud

文档反馈

腾讯云 MySQL 同步至自建或者第三方云厂商 MySQL

最后更新时间:2024-02-02 17:01:32
    本文为您介绍使用数据传输服务 DTS 从腾讯云 MySQL 同步数据至自建 MySQL 或者第三方友商 MySQL 的操作过程。
    本操作指导为单向同步的操作,如果您需要构建双向同步、多对一同步等复杂拓扑结构,请参考 构建双向同步数据结构构建多对一同步数据结构构建多活数据中心

    注意事项

    DTS 在执行全量数据同步时,会占用一定源端实例资源,可能会导致源实例负载上升,增加数据库自身压力。如果您数据库配置过低,建议您在业务低峰期进行。
    为了避免数据重复,请确保需要同步的表具有主键或者非空唯一键。
    默认采用无锁方式,同步过程中对源库不加全局锁(FTWRL),仅对无主键的表加表锁,其他不加锁。
    数据同步时,DTS 会使用执行同步任务的账号在源库中写入系统库 __tencentdb__,用于记录同步任务过程中的数据对比信息。
    为保证后续数据对比问题可定位,同步任务结束后不会删除源库中的 __tencentdb__
    __tencentdb__ 系统库占用空间非常小,约为源库存储空间的千分之一到万分之一(例如源库为50GB,则__tencentdb__系统库约为5MB - 50MB),并且采用单线程,等待连接机制,所以对源库的性能几乎无影响,也不会抢占资源。

    前提条件

    源数据库和目标数据库符合同步功能和版本要求,请参考 数据同步支持的数据库 进行核对。
    需要具备源数据库的权限如下:
    GRANT RELOAD,LOCK TABLES,REPLICATION CLIENT,REPLICATION SLAVE,SHOW VIEW,PROCESS,SELECT ON *.* TO '账号'@'%' IDENTIFIED BY '密码';
    GRANT ALL PRIVILEGES ON `__tencentdb__`.* TO '账号'@'%';
    FLUSH PRIVILEGES;
    需要具备目标数据库的权限:ALTER, ALTER ROUTINE, CREATE, CREATE ROUTINE, CREATE TEMPORARY TABLES, CREATE USER, CREATE VIEW, DELETE, DROP, EVENT, EXECUTE, INDEX, INSERT, LOCK TABLES, PROCESS, REFERENCES, RELOAD, SELECT, SHOW DATABASES, SHOW VIEW, TRIGGER, UPDATE。

    应用限制

    只支持同步基础表、视图、存储过程和函数。
    在同步视图、存储过程和函数时,DTS 会检查源库中 DEFINER 对应的 user1( [DEFINER = user1])和同步账号 user2 是否一致,如果不一致,同步后 DTS 会修改 user1 在目标库中的 SQL SECURITY 属性,由 DEFINER 转换为 INVOKER( [INVOKER = user1]),同时设置目标库中 DEFINER 为同步账号 user2([DEFINER = 同步账号 user2])。如果源库中视图定义过于复杂,可能会导致任务失败。
    源端如果是非 GTID 实例,DTS 不支持源端 HA 切换,一旦源端 MySQL 发生切换可能会导致 DTS 增量同步中断。
    只支持同步 InnoDB、MyISAM、TokuDB 三种数据库引擎,如果存在这三种以外的数据引擎表则默认跳过不进行同步。
    相互关联的数据对象需要一起同步,否则会导致同步失败。常见的关联关系:视图引用表、视图引用视图、主外键关联表等。
    增量同步过程中,若源库存在分布式事务或者产生了类型为 STATEMENT 格式的 Binlog 语句,则会导致同步失败。
    源数据库 Binlog 的 GTID 如果存在空洞,可能会影响同步任务的性能并导致任务失败。
    不支持同时包含 DML 和 DDL 语句在一个事务的场景,遇到该情况任务会报错。
    不支持 Geometry 相关的数据类型,遇到该类型数据任务报错。
    不支持 ALTER VIEW 语句,遇到该语句任务跳过不同步。

    操作限制

    同步过程中请勿进行如下操作,否则会导致同步任务失败。
    请勿修改、删除源数据库和目标数据库中用户信息(包括用户名、密码和权限)和端口号。
    请勿在源库上执行分布式事务。
    请勿在源库写入 Binlog 格式为 STATEMENT 的数据。
    请勿在源库上执行清除 Binlog 的操作。
    在同步增量阶段,请勿删除系统库表 __tencentdb__

    支持同步的 SQL 操作

    操作类型
    SQL 操作语句
    DML
    INSERT、UPDATE、DELETE
    DDL
    CREATE DATABASE、DROP DATABASE、ALTER DATABASE、CREATE TABLE、ALTER TABLE、DROP TABLE、TRUNCATE TABLE、RENAME TABLE、CREATE VIEW、DROP VIEW、CREATE INDEX、DROP INDEX
    说明:
    不支持同步涉及分区(Partition)的 DDL。

    环境要求

    类型
    环境要求
    源数据库要求
    源库和目标库网络能够连通。
    实例参数要求:
    源库 server_id 参数需要手动设置,且值不能设置为0。
    源库表的 row_format 不能设置为 FIXED。
    源库和目标库 lower_case_table_names 变量必须设置一致。
    源库变量 connect_timeout设置数值必须大于10。
    Binlog 参数要求:
    源端 log_bin 变量必须设置为 ON。
    源端 binlog_format 变量必须设置为 ROW。
    源端 binlog_row_image 变量必须设置为 FULL。
    MySQL 5.6 及以上版本 gtid_mode 变量不为 ON 时会报警告,建议打开 gtid_mode。
    不允许设置 do_db, ignore_db。
    源实例为从库时,log_slave_updates 变量必须设置为 ON。
    建议源库 Binlog 日志至少保留3天及以上,否则可能会因任务暂停/中断时间大于 Binlog 日志保留时间,造成任务无法续传,进而导致任务失败。
    外键依赖:
    外键依赖只能设置为 NO ACTION,RESTRICT 两种类型。
    部分库表同步时,有外键依赖的表必须齐全。
    环境变量 innodb_stats_on_metadata 必须设置为 OFF。
    目标数据库要求
    目标库的版本必须大于等于源库的版本。
    目标库需要有足够的存储空间,如果初始类型选择“全量数据初始化”,则目标库的空间大小须是源库待同步库表空间的1.2倍以上。
    目标库不能有和源库同名的表、视图等同步对象。
    目标库 max_allowed_packet 参数设置数值至少为4MB。

    操作步骤

    1. 登录 数据同步购买页,选择相应配置,单击立即购买
    参数
    描述
    计费模式
    支持包年包月和按量计费。
    源实例类型
    选择 MySQL,购买后不可修改。
    源实例地域
    选择源数据库所在地域,购买后不可修改。
    目标实例类型
    选择 MySQL,购买后不可修改。
    目标实例地域
    选择目标数据库所在地域,购买后不可修改。
    规格
    请根据业务诉求选择规格,规格越高,性能越好。详情请参考 计费概述
    2. 购买完成后,返回 数据同步列表,可看到刚创建的数据同步任务,刚创建的同步任务需要进行配置后才可以使用。
    3. 在数据同步列表,单击操作列的配置,进入配置同步任务页面。
    
    4. 在配置同步任务页面,配置源端实例、账号密码,配置目标端实例、账号和密码,测试连通性后,单击下一步
    设置项
    参数
    描述
    任务设置
    任务名称
    DTS 会自动生成一个任务名称,用户可以根据实际情况进行设置。
    运行模式
    支持立即执行和定时执行两种模式。
    源实例设置
    源实例类型
    购买时所选择的源数据库类型,不可修改。
    源实例地域
    购买时选择的源数据库所在地域,不可修改。
    服务提供商
    自建数据库(包括云服务器上的自建)或者腾讯云数据库,请选择“普通”;第三方云厂商数据库,请选择对应的服务商。本场景选择“普通”。
    接入类型
    本场景选择“云数据库”。
    是否跨账号
    本场景选择“本账号”。
    实例 ID
    源数据库实例 ID。
    账号
    源数据库账号,账号权限需要满足要求。
    密码
    源数据库账号的密码。
    目标实例设置
    目标实例类型
    购买时选择的目标数据库类型,不可修改。
    目标实例地域
    购买时选择的目标数据库地域,不可修改。
    接入类型
    自建数据库或者第三方云厂商数据库,一般可以选择公网方式,也可以选择 VPN 接入,专线或者云联网的方式,需要根据实际的网络情况选择。本场景以“公网”为例,不同接入类型的准备工作请参考 准备工作概述
    主机地址
    目标数据库的 IP 地址或域名。
    端口
    目标数据库端口。
    账号
    目标数据库账号,账号权限需要满足要求。
    密码
    目标数据库账号的密码。
    5. 在设置同步选项和同步对象页面,将对数据初始化选项、数据同步选项、同步对象选项进行设置,在设置完成后单击保存并下一步
    说明
    初始化类型仅选择全量数据初始化,系统默认用户在目标库已经创建了表结构,不会进行表结构同步,也不会校验源库和目标库是否有同名表,所以当用户同时在已存在同名表中选择前置校验并报错,则校验并报错功能不生效。
    如果用户在同步过程中确定会对某张表使用 rename 操作(例如将 table A rename 为 table B),则同步对象需要选择 table A 所在的整个库(或者整个实例),不能仅选择 table A,否则系统会报错。
    
    设置项
    参数
    描述
    数据初始化选项
    初始化类型
    结构初始化:同步任务执行时会先将源实例中表结构初始化到目标实例中。
    全量数据初始化:同步任务执行时会先将源实例中数据初始化到目标实例中。仅选择全量数据初始化的场景,用户需要提前在目标库创建好表结构。
    默认两者都勾上,可根据实际情况取消。
    已存在同名表
    前置校验并报错:存在同名表则报错,流程不再继续。
    忽略并继续执行:全量数据和增量数据直接追加目标实例的表中。
    数据同步选项
    冲突处理机制
    冲突报错:在同步时发现表主键冲突,报错并暂停数据同步任务。
    冲突忽略:在同步时发现表主键冲突,保留目标库主键记录。
    冲突覆盖:在同步时发现表主键冲突,用源库主键记录覆盖目标库主键记录。
    同步操作类型
    支持操作:Insert、Update、Delete、DDL。打开 “DDL 自定义”,可以根据需要选择不同的 DDL 同步策略。详情请参考 设置 SQL 过滤策略
    同步对象选项
    源实例库表对象
    选择待同步的对象,支持基础库表、视图、存储过程和函数。高级对象的同步是一次性动作,仅支持同步在任务启动前源库中已有的高级对象,在任务启动后,新增的高级对象不会同步到目标库中。详情请参考 同步高级对象
    已选对象
    支持库表映射(库表重命名),将鼠标悬浮在库名、表名上即显示编辑按钮,单击后可在弹窗中填写新的名称。
    选择高级对象进行同步时,建议不要进行库表重命名操作,否则可能会导致高级对象同步失败。
    支持同步 Online DDL 临时表(使用 gh-ost、pt-online-schema-change 工具),单击表的编辑按钮,在弹窗中即可选择临时表名。详情请参考 同步 Online DDL 临时表
    6. 在校验任务页面,完成校验并全部校验项通过后,单击启动任务。 如果校验任务不通过,可以参考 校验不通过处理方法 修复问题后重新发起校验任务。
    失败:表示校验项检查未通过,任务阻断,需要修复问题后重新执行校验任务。
    警告:表示检验项检查不完全符合要求,可以继续任务,但对业务有一定的影响,用户需要根据提示自行评估是忽略警告项还是修复问题再继续。
    
    7. 返回数据同步任务列表,任务开始进入运行中状态。
    说明
    选择操作列的更多 > 结束可关闭同步任务,请您确保数据同步完成后再关闭任务。
    
    8. (可选)您可以单击任务名,进入任务详情页,查看任务初始化状态和监控数据。
    
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持