tencent cloud

文档反馈

TDSQL-C MySQL 同步至 TDSQL-C MySQL

最后更新时间:2024-02-02 16:27:16
    本文介绍使用数据传输服务 DTS 从 TDSQL-C MySQL 数据库同步数据至 TDSQL-C MySQL 数据库的操作指导。
    如下场景与 TDSQL-C MySQL 到 TDSQL-C MySQL 的数据同步要求一致,可参考本场景相关内容。
    MySQL 到 TDSQL-C MySQL 的数据同步
    TDSQL-C MySQL 到 MySQL 的数据同步

    注意事项

    DTS 在执行全量数据同步时,会占用一定源端实例资源,可能会导致源实例负载上升,增加数据库自身压力。如果您数据库配置过低,建议您在业务低峰期进行。
    为了避免数据重复,请确保需要同步的表具有主键或者非空唯一键。
    默认采用无锁方式,同步过程中对源库不加全局锁(FTWRL),仅对无主键的表加表锁,其他不加锁。
    数据同步时,DTS 会使用执行同步任务的账号在源库中写入系统库__tencentdb__,用于记录同步任务过程中的数据对比信息。
    为保证后续数据对比问题可定位,同步任务结束后不会删除源库中的__tencentdb__
    __tencentdb__系统库占用空间非常小,约为源库存储空间的千分之一到万分之一(例如源库为50GB,则__tencentdb__系统库约为5MB - 50MB),并且采用单线程,等待连接机制,所以对源库的性能几乎无影响,也不会抢占资源。

    前提条件

    需要具备源数据库的权限如下:
    GRANT RELOAD,LOCK TABLES,REPLICATION CLIENT,REPLICATION SLAVE,SHOW VIEW,PROCESS,SELECT ON *.* TO '帐号'@'%' IDENTIFIED BY '密码';
    GRANT ALL PRIVILEGES ON `__tencentdb__`.* TO '迁移帐号'@'%';
    FLUSH PRIVILEGES;
    需要具备目标数据库的权限:ALTER, ALTER ROUTINE, CREATE, CREATE ROUTINE, CREATE TEMPORARY TABLES, CREATE USER, CREATE VIEW, DELETE, DROP, EVENT, EXECUTE, INDEX, INSERT, LOCK TABLES, PROCESS, REFERENCES, RELOAD, SELECT, SHOW DATABASES, SHOW VIEW, TRIGGER, UPDATE。
    源数据库和目标数据库符合同步功能和版本要求,请参考 数据同步支持的数据库 进行核对。

    应用限制

    只支持同步基础表、视图、存储过程和函数。
    在导出视图结构时,DTS 会检查源库中 DEFINER 对应的 user1( [DEFINER = user1])和同步用户的 user2 是否一致,如果不一致,则会修改 user1 在目标库中的 SQL SECURITY 属性,由 DEFINER 转换为 INVOKER( [INVOKER = user1]),同时设置目标库中 DEFINER 为同步用户的 user2([DEFINER = user2])。如果源库中视图定义过于复杂,可能会导致任务失败。
    源端如果是非 GTID 实例,DTS 不支持源端 HA 切换,一旦源端 TDSQL-C 发生切换可能会导致 DTS 增量同步中断。
    只支持同步 InnoDB、MyISAM、TokuDB 三种数据库引擎,如果存在这三种以外的数据引擎表则默认跳过不进行同步。其中,源库如果存在压缩模式的 TokuDB 引擎数据,需要目标库同步支持压缩模式才可以同步,否则任务会报错。
    增量同步过程中,若源库存在分布式事务或者产生了类型为 STATEMENT 格式的 Binlog 语句,则会导致同步失败。
    源数据库为阿里云 MySQL,则阿里云 MySQL 5.6 版本待同步表不能存在无主键表,MySQL 5.7 及以后版本不限制。源数据库为 AWS MySQL,则 AWS MySQL 待同步表不能存在无主键表。
    源数据库 Binlog 的 GTID 如果存在空洞,可能会影响同步任务的性能并导致任务失败。
    不支持同时包含 DML 和 DDL 语句在一个事务的场景,遇到该情况任务会报错。
    不支持 Geometry 相关的数据类型,遇到该类型数据任务报错。
    不支持 ALTER VIEW 语句,遇到该语句任务跳过不同步。

    操作限制

    同步过程中请勿进行如下操作,否则会导致同步任务失败。
    请勿修改、删除源数据库和目标数据库中用户信息(包括用户名、密码和权限)和端口号。
    请勿在源库上执行分布式事务。
    请勿在源库写入 Binlog 格式为 STATEMENT 的数据。
    请勿在源库上执行清除 Binlog 的操作。
    在同步增量阶段,请勿删除系统库表 __tencentdb__

    支持的 SQL 操作

    操作类型
    支持同步的 SQL 操作
    DML
    INSERT、UPDATE、DELETE
    DDL
    CREATE DATABASE、DROP DATABASE、ALTER DATABASE、CREATE TABLE、ALTER TABLE、DROP TABLE、TRUNCATE TABLE、RENAME TABLE、CREATE VIEW、DROP VIEW、CREATE INDEX、DROP INDEX
    说明:
    不支持同步涉及分区(Partition)的 DDL。
    暂不支持 CREATE TABLE 表名 AS SELECT 语句。

    环境要求

    类型
    环境要求
    源数据库要求
    源库和目标库网络能够连通。
    实例参数要求:
    源库 server_id 参数需要手动设置,且值不能设置为0。
    源库表的 row_format 不能设置为 FIXED。
    源库和目标库 lower_case_table_names 变量必须设置一致。
    源库变量 connect_timeout 设置数值必须大于10。
    Binlog 参数要求:
    源端 log_bin 变量必须设置为 ON。
    源端 binlog_format 变量必须设置为 ROW。
    源端 binlog_row_image 变量必须设置为 FULL。
    TDSQL-C MySQL 5.6 及以上版本 gtid_mode 变量不为 ON 时会报警告,建议打开 gtid_mode。
    不允许设置 do_db,ignore_db。
    源实例为从库时,log_slave_updates 变量必须设置为 ON。
    建议源库 Binlog 日志至少保留3天及以上,否则可能会因任务暂停/中断时间大于 Binlog 日志保留时间,造成任务无法续传,进而导致任务失败。
    外键依赖:
    外键依赖只能设置为 NO ACTION,RESTRICT 两种类型。
    部分库表同步时,有外键依赖的表必须齐全。
    环境变量 innodb_stats_on_metadata必须设置为 OFF。
    目标数据库要求
    目标库的版本必须大于等于源库的版本。
    目标库需要有足够的存储空间,如果初始类型选择“全量数据初始化”,则目标库的空间大小须是源库待同步库表空间的1.2倍以上。
    目标库不能有和源库同名的表、视图等同步对象。
    目标库 max_allowed_packet 参数设置数值至少为4M。

    操作步骤

    1. 登录 数据同步购买页,选择相应配置,单击立即购买
    参数
    描述
    计费模式
    支持包年包月和按量计费。
    源实例类型
    选择 TDSQL-C MySQL,购买后不可修改。
    源实例地域
    选择源实例所在地域,购买后不可修改。
    目标实例类型
    选择 TDSQL-C MySQL,购买后不可修改。
    目标实例地域
    选择目的实例所在地域,购买后不可修改。
    规格
    请根据业务诉求选择规格,规格越高,性能越好。详情请参考 计费概述
    2. 购买完成后,返回 数据同步列表,可看到刚创建的数据同步任务,刚创建的同步任务需要进行配置后才可以使用。
    3. 在数据同步列表,单击操作列的配置,进入配置同步任务页面。
    4. 在配置同步任务页面,配置源端实例、帐号密码,配置目标端实例、帐号和密码,测试连通性后,单击下一步
    设置项
    参数
    描述
    任务设置
    任务名称
    DTS 会自动生成一个任务名称,用户可以根据实际情况进行设置。
    运行模式
    支持立即执行和定时执行两种模式。
    自动重试
    设置后,迁移任务因网络异常等引起的任务临时中断,DTS 将在设置的时间范围内自动重试和恢复任务,不需要用户手动操作。 支持设置的时间范围为5分钟-720分钟。
    源实例设置
    源实例类型
    购买时所选择的云数据库实例类型,不可修改。
    源实例地域
    购买时选择的云数据库实例所在地域,不可修改。
    接入类型
    根据实际情况选择,本场景选择“云数据库”。
    公网:源数据库可以通过公网 IP 访问。
    云主机自建:源数据库部署在 腾讯云服务器 CVM 上。
    专线接入:源数据库可以通过 专线接入 方式与腾讯云私有网络打通。
    VPN接入:源数据库可以通过 VPN 连接 方式与腾讯云私有网络打通。
    云数据库:源数据库属于腾讯云数据库实例。
    云联网:源数据库可以通过 云联网 与腾讯云私有网络打通。
    私有网络 VPC:源数据和目标数据库都部署在腾讯云上,且有 私有网络
    对于第三方云厂商数据库,一般可以选择公网方式,也可以选择 VPN 接入,专线或者云联网的方式,需要根据实际的网络情况选择。不同接入类型的准备工作请参考 准备工作概述
    实例 ID
    源数据库实例 ID。
    帐号
    源数据库帐号。
    密码
    源数据库密码。
    连接方式
    SSL 安全连接指 DTS 与数据库通过 SSL(Secure socket layer)安全连接,对传输链路进行加密。
    选择 SSL 安全连接可能会增加数据库的连接响应时间,一般腾讯云内网链路相对较安全,无需开启 SSL 安全连接,采用公网/专线等传输方式,并且对数据安全要求较高的场景,需要开启 SSL 安全连接。选择 SSL 安全连接前,需要先在源数据库中开启 SSL 加密。
    目标实例设置
    目标实例类型
    所选择的目标实例类型,不可修改。
    目标实例地域
    选择的目标实例所在地域,不可修改。
    接入类型
    选择目标数据库类型。
    实例 ID
    目标数据库实例 ID。
    帐号
    目标数据库帐号。
    密码
    目标数据库密码。
    连接方式
    SSL 安全连接指 DTS 与数据库通过 SSL(Secure socket layer)安全连接,对传输链路进行加密。
    选择 SSL 安全连接可能会增加数据库的连接响应时间,一般腾讯云内网链路相对较安全,无需开启 SSL 安全连接,采用公网/专线等传输方式,并且对数据安全要求较高的场景,需要开启 SSL 安全连接。选择 SSL 安全连接前,需要先在源数据库中开启 SSL 加密。
    5. 在设置同步选项和同步对象页面,将对数据初始化选项、数据同步选项、同步对象选项进行设置,在设置完成后单击保存并下一步
    说明
    初始化类型仅选择全量数据初始化,系统默认用户在目标库已经创建了表结构,不会进行表结构迁移,也不会校验源库和目标库是否有同名表,所以当用户同时在已存在同名表中选择前置校验并报错,则校验并报错功能不生效。
    如果用户在同步过程中确定会对某张表使用 rename 操作(例如将 table A rename 为 table B),则同步对象需要选择 table A 所在的整个库(或者整个实例),不能仅选择 table A,否则系统会报错。
    设置项
    参数
    描述
    数据初始化选项
    初始化类型
    结构初始化:同步任务执行时会先将源实例中表结构初始化到目标实例中。
    全量数据初始化:同步任务执行时会先将源实例中数据初始化到目标实例中。仅选择全量数据初始化的场景,用户需要提前在目标库创建好表结构。
    默认两者都勾上,可根据实际情况取消。
    已存在同名表
    前置校验并报错:存在同名表则报错,流程不再继续。
    忽略并继续执行:全量数据和增量数据直接追加目标实例的表中。
    数据同步选项
    冲突处理机制
    冲突报错:在同步时发现表主键冲突,报错并暂停数据同步任务。
    冲突忽略:在同步时发现表主键冲突,保留目标库主键记录。
    冲突覆盖:在同步时发现表主键冲突,用源库主键记录覆盖目标库主键记录。
    同步操作类型
    支持操作:Insert、Update、Delete、DDL。勾选“DDL自定义”,可以根据需要选择不同的 DDL 同步策略。详情请参考 设置 SQL 过滤策略
    同步对象选项
    源实例库表对象
    选择待同步的对象,支持库级别和表及视图级别。
    已选对象
    支持库表映射(库表重命名),将鼠标悬浮在库名、表名上即显示编辑按钮,单击后可在弹窗中填写新的名称。
    选择高级对象进行同步时,建议不要进行库表重命名操作,否则可能会导致高级对象同步失败。
    是否同步 Online DDL 临时表
    如果使用 gh-ost、pt-osc 工具对源库中的表执行 Online DDL 操作,DTS 支持将 Online DDL 变更产生的临时表迁移到目标库。
    勾选 gh-ost,DTS 会将 gh-ost 工具产生的临时表名(`_表名_ghc`、`_表名_gho`、`_表名_del`)迁移到目标库。
    勾选 pt-osc, DTS 会将 pt-osc 工具产生的临时表名(`_表名_new`、 `_表名_old`)迁移到目标库。
    更多详情请参考 同步 Online DDL 临时表
    6. 在校验任务页面,完成校验并全部校验项通过后,单击启动任务。 如果校验任务不通过,可以参考 校验不通过处理方法 修复问题后重新发起校验任务。
    失败:表示校验项检查未通过,任务阻断,需要修复问题后重新执行校验任务。
    警告:表示检验项检查不完全符合要求,可以继续任务,但对业务有一定的影响,用户需要根据提示自行评估是忽略警告项还是修复问题再继续。
    7. 返回数据同步任务列表,任务开始进入运行中状态。
    说明
    选择操作列的更多 > 结束可关闭同步任务,请您确保数据同步完成后再关闭任务。
    8. (可选)您可以单击任务名,进入任务详情页,查看任务初始化状态和监控数据。
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持