华为云计算 云知识 MongoDB数据库迁移_其他云数据库迁移和同步场景
MongoDB数据库迁移_其他云数据库迁移和同步场景

数据复制服务 (Data Replication Service,简称DRS)支持将其他云MongoDB 数据库 数据迁移 到本云 文档数据库服务 (Document Database Service,以下简称DDS)实例。通过DRS提供的实时迁移任务,实现在 数据库迁移 过程中业务和数据库不停机,业务中断时间最小化。

本章节主要介绍了通过DRS将其他 云数据库 实时迁移至本云DDS的任务配置流程。包括以下迁移场景:

· 其他云MongoDB数据库实时迁移至本云DDS。

· 其他云内云主机自建自维护的MongoDB数据库迁移至本云DDS。

网络示意图

图1 其他云MongoDB数据库实时迁移示意图
 
图2 其他云自建MongoDB数据库实时迁移示意图

 

迁移流程

图3 迁移流程图
 

 

迁移建议(重要)

· 数据库迁移与环境多样性和人为操作均有密切关系,为了确保迁移的平顺,建议您在进行正式的数据库迁移之前进行一次演练,可以帮助您提前发现问题并解决问题,如何最小化对数据库的影响请参考如下建议。

· 强烈建议您在启动任务时选择“稍后启动”功能,将启动时间设置在业务低峰期,相对静止的数据可以有效提升一次性迁移成功率,避免迁移对业务造成性能影响。

 

迁移须知(重要)

须知:在创建迁移任务之前,请您务必仔细阅读迁移须知。参考《 数据复制 服务快速入门》中的“使用须知”章节。

 

迁移准备

1、权限准备:

当使用 DRS 将其他云MongoDB数据库的数据迁移到本DDS实例时,在不同迁移类型情况下,对源数据库和目标数据库的帐号权限要求如表1

表1 迁移帐号权限

迁移类型

全量迁移

全量+增量迁移

源数据库

· 副本集:连接源数据库的用户权限需要对admin数据库有readAnyDatabase权限。

· 集群:连接源数据库的用户权限需要对admin数据库有readAnyDatabase权限,对config数据库有read权限。

· 单节点:连接源数据库的用户权限需要对admin数据库有readAnyDatabase权限。

· 如果需要迁移源数据库用户和角色信息,连接源数据库的用户权限需要对admin数据库的系统表system.users,system.roles有读权限。

· 副本集:连接源数据库的用户权限需要对admin数据库有readAnyDatabase权限,对local数据库有read权限。

· 单节点:连接源数据库的用户权限需要对admin数据库有readAnyDatabase权限,对local数据库有read权限。

· 集群:连接源数据库mongos节点的用户权限需要对admin数据库有readAnyDatabase权限,对config数据库有read权限, 连接源数据库分片节点的用户权限需要对admin数据库有readAnyDatabase权限,对local数据库有read权限。

· 如果需要迁移源数据库用户和角色信息,连接源数据库的用户权限需要对admin数据库的系统表system.users,system.roles有读权限。

目标数据库

连接目标数据库的用户权限需要对admin数据库有readAnyDatabase权限,对目标数据库有readWrite权限。

 

· 源数据库权限设置:

需要确保源数据库MongoDB的帐号权限具备表1的要求。若权限不足,需要在源数据库端开通高权限的帐号。

目前DRS支持迁移的第三方云厂商有:阿里云,腾讯云。

以阿里云云数据库MongoDB迁移到本云DDS为例,阿里云MongoDB默认的初始帐号已经具备进行数据迁移的能力,使用初始帐号即可。

· 目标数据库权限设置:

本云DDS实例使用初始帐号即可。

 

2、网络准备:

源数据库需要开放公网访问。

· 源数据库的网络设置:

源数据库MongoDB实例需要开放公网 域名 的访问。

以阿里云云数据库MongoDB迁移到本云DDS实例为例,一般情况下,阿里云云数据库MongoDB不提供公网地址,需要通过申请公网地址来允许外部的应用对接,具体的操作及注意事项可以参考阿里云提供的相关指导。

· 目标数据库的网络设置:目标端不需要进行设置。

 

3、安全规则准备:

· 数据库安全 组规则设置:

源数据库MongoDB实例需要将具体的DRS迁移实例的 弹性公网IP 添加到其网络白名单中,确保源数据库MongoDB实例可以与上述弹性 公网IP 连通。

以阿里云云数据库MongoDB迁移到本云DDS为例,具体设置网络白名单的操作及注意事项可以参考相关指导。在设置网络白名单之前,需要先获取DRS迁移实例的弹性公网IP,具体操作如下:

迁移实例创建成功后,可在“源库及目标库”页面获取DRS迁移实例的弹性公网IP。如图4所示:

图4 迁移实例公网弹性IP

以上讲述的是精细配置白名单的方法,还有一种简单设置白名单的方法,在安全允许的情况下,可以将源数据库MongoDB实例的网络白名单设置为0.0.0.0/0,代表允许任何IP地址访问该实例。

上述的网络白名单是为了进行数据迁移设置的,迁移结束后可以删除。

· 目标数据库安全组规则设置:

目标数据库默认与DRS迁移实例处在同一个VPC,网络是互通的,DRS可以直接写入数据到目标数据库,不需要进行任何设置。

 

4、其他事项准备:

由于迁移过程不会迁移MongoDB数据库的用户信息以及相关参数,需要自行将上述信息导出后手动添加到目标DDS中。

 

迁移步骤

1、创建迁移任务

a)登录管理控制台,在服务列表中选择数据库 > 数据复制服务,进入数据复制服务信息页面。

b)在实时迁移管理”页面,单击右上角“创建迁移任务”,进入迁移任务信息页面。

c)在“迁移实例”页面,填选任务名称、通知收件人、描述和迁移实例信息。

图5 迁移实例信息

 

表2 任务和描述

参数

描述

区域

当前所在区域,可进行切换。

任务名称

任务名称在4-50位之间,必须以字母开头,不区分大小写,可以包含字母、数字、中划线或下划线,不能包含其他的特殊字符。

描述

描述不能超过256位,且不能包含! = < > & ' " \ 特殊字符。

任务异常通知设置

该项为可选参数,开启之后,选择对应的 SMN 主题,。当同步任务状态异常时,系统将发送通知。

SMN主题

“任务异常通知设置”项开启后可见,需提前在SMN上申请主题并添加订阅。

SMN主题申请和订阅可参考 消息通知 服务用户指南》。

时延阈值

在增量同步阶段,源数据库和目标数据库之间的同步有时会存在一个时间差,称为时延,单位为秒。

时延阈值设置是指时延超过一定的值后(时延阈值范围为1—3600s),DRS可以发送告警通知给指定收件人。告警通知将在时延稳定超过设定的阈值6min后发送,避免出现由于时延波动反复发送告警通知的情况。

说明:

· 首次进入增量同步阶段,会有较多数据等待同步,存在较大的时延,属于正常情况,不在此功能的监控范围之内。

· 设置时延阈值之前,需要设置任务异常通知。

任务异常自动结束时间(天)

设置任务异常自动结束天数,输入值必须在14-100之间。

说明:

异常状态下的任务仍然会计费,而长时间异常的任务无法续传和恢复。设置任务异常自动结束天数后,异常且超时的任务将会自动结束,以免产生不必要的费用。

 

表3 迁移实例信息

参数

描述

数据流动方向

选择“入云”

源数据库引擎

选择“MongoDB”

目标数据库引擎

选择“DDS”

网络类型

选择公网网络。

目标数据库实例

选择您所创建的本云DDS实例。

迁移实例所在子网

选择迁移实例所在的子网。也可以单击“查看子网”,跳转至“网络控制台”查看实例所在子网帮助选择。

默认值为当前所选数据库实例所在子网,请选择有可用IP地址的子网。为确保迁移实例创建成功,仅显示已经开启DHCP的子网。

迁移模式

· 全量

全量迁移为数据库一次性迁移,适用于可中断业务的数据库迁移场景,全量迁移将非系统数据库的全部数据库对象和数据一次性迁移至目标端数据库,包括:集合、索引等。

· 全量+增量

全量+增量迁移为数据库持续性迁移,适用于对业务中断敏感的场景,通过全量迁移过程完成目标端数据库的初始化后,增量迁移阶段通过解析日志等技术,将源端和目标端数据库保持数据持续一致。

源数据库实例类型

需要根据源数据库的具体来源进行设置。

· 当源库类型属于集群时,该项需要设置为集群

· 当源库类型属于副本集或者单节点时,该项需要设置为非集群。

· 当源库类型为MongDB集群4.0及以上版本,集群实例无法获取到分片节点的IP时,可选择集群(MongoDB 4.0+)。

源端分片个数

当源端实例类型设置为“集群”时,需要填写源端数据库实例个数。

源端数据库实例个数默认最小值为2,最大值为32,你需要根据源库实际的集群分片个数设置该值大小。

标签

可选配置,对迁移任务的标识。使用标签可方便管理您的迁移任务。每个任务最多支持10个标签配额。

d)在“源库及目标库”页面,迁移实例创建成功后,填选源库信息和目标库信息,建议您单击“源库和目标库”处的“测试连接”,分别测试并确定与源库和目标库连通后,勾选协议,单击“下一步”

 

图6 源库信息页面

 

表4 源库信息

参数

描述

mongosIP地址或域名

源数据库的IP地址或域名,格式为IP地址/域名:端口。其中源数据库服务端口,可输入范围为1~65534间的整数。

该输入框最多支持填写3组源数据库的IP地址或者域名信息,多个值需要使用英文逗号隔开。例如:192.168.0.1:8080,192.168.0.2:8080。同时需要确保所填写的多个IP地址或域名属于同一个分片集群。

说明:此处若填写的是多组IP地址或者域名信息,在进行测试连接的过程中,只要存在一组IP地址或者域名可以连通,那么测试连接就提示成功。所以需要您保证填写的IP地址或域名的正确性。

账号认证数据库

填写的数据库账号所属的数据库名称。例如:华为云DDS实例默认的账号认证数据库为admin。

mongos用户名

访问源数据库MongoDB的用户名。

mongos密码

访问源数据库MongoDB的用户名所对应的密码。

SSL安全连接

通过该功能,用户可以选择是否开启对迁移链路的加密。如果开启该功能,需要用户上传SSL CA根证书。

分片数据库

根据源库实际的集群分片个数,填写对应的分片数据库信息。

 

· 目标库信息配置

图7 目标库信息

 

表5 目标库信息

参数

描述

数据库实例名称

默认为创建迁移任务时选择的数据库实例,不可进行修改。

数据库用户名

目标数据库对应的数据库用户名。

数据库密码

目标数据库的登录密码。

 

e)在“迁移设置”页面,设置迁移对象,单击“下一步”

图8 设置迁移对象

 

表6 迁移对象

参数

描述

迁移用户

常见的迁移用户一般分为两类:支持迁移的用户和不支持迁移的用户。您可以根据业务需求选择“迁移”或者“不迁移”,其中,不支持迁移的账号或者未选择迁移的账号将在目标数据库中缺失,需要先确保业务不受影响。

· 迁移

当您选择迁移用户时,请参见《数据复制服务用户指南》中“迁移用户”章节进行数据库用户及角色的处理。

· 不迁移

迁移过程中,将不进行数据库用户及角色的迁移。

其他迁移选项

根据业务需求,选择全量迁移是否迁移用户自行创建的索引,基于_id的默认索引目标端会自动创建。如果不迁移索引,索引不参与对比。

迁移对象

您可以根据业务需求,选择全部对象迁移、表级迁移或者库级迁移。

· 全部迁移:将源数据库中的所有对象全部迁移至目标数据库,对象迁移到目标数据库实例后,对象名将会保持与源数据库实例对象名一致且无法修改。

· 表级迁移:将选择的表级对象迁移至目标数据库。

· 库级迁移:将选择的库级对象迁移至目标数据库。

如果有切换源数据库的操作或源库迁移对象变化的情况,请务必在选择迁移对象前单击右上角的,以确保待选择的对象为最新源数据库对象。

说明:

· 若选择部分数据库进行迁移时,由于存储过程、视图等对象可能与其他数据库的表存在依赖关系,若所依赖的表未迁移,则会导致迁移失败。建议您在迁移之前进行确认,或选择全部数据库进行迁移。

· 选择对象的时候,对象名称的前后空格不显示,中间如有多个空格只显示一个空格。

· 选择对象的时候支持搜索,以便您快速选择需要的数据库对象。

 

f)在“预检查”页面,进行迁移任务预校验,校验是否可进行任务迁移。

· 查看检查结果,如有不通过的检查项,需要修复不通过项后,单击“重新校验”按钮重新进行迁移任务预校验。

预检查不通过项处理建议请参见《数据复制服务用户指南》中的“预检查不通过项修复方法”。

· 预检查完成后,且所有检查项结果均通过时,单击“下一步”

 

图9 预检查

说明:所有检查项结果均通过时,若存在待确认项,需要阅读并确认详情后才可以继续执行下一步操作。

g)在“任务确认”页面,选择迁移任务的启动时间,勾选协议,单击“启动任务”,提交迁移任务。

说明:

· 迁移任务的启动时间可以根据业务需求,设置为“立即启动”或“稍后启动”。

· 预计迁移任务启动后,会对源数据库和目标数据库的性能产生影响,建议选择业务低峰期,合理设置迁移任务的启动时间。如果迁移不可避免业务高峰期,推荐使用迁移限速功能,即“流速模式”选择“限速”

h)迁移任务提交后,开始启动迁移任务,您可以返回实时迁移管理”页面,查看迁移任务状态。

 

2、任务管理

同步任务启动后,会经历全量同步和增量同步两个阶段,对于不同阶段的同步任务,您可以进行任务管理。

· 全量同步

查看同步进度:全量同步中的任务,您可单击任务名称,在“同步进度”页签下,查看全量同步进度,您可以查看结构、数据、索引同步的进度,也查看具体同步对象的同步进度。当全量同步进度显示为100%,表示全量同步已经完成。

· 增量同步

【查看时延监控】全量同步完成后,开始进行增量同步。对于增量同步中的任务,您可单击任务名称,在“同步进度”页签下,查看增量同步同步时延,当时延为0s时,说明源数据库和目标数据库的数据是实时同步的。您也可以使用“同步对比”页签进行一致性对比。

 

图10 查看时延监控

 

【查看同步对比】为了尽可能减少业务的影响和业务中断时间,增量同步中的任务,您可单击任务名称,在“同步对比”页签下创建对比任务。

具体的同步对比操作及注意事项请参考《数据复制服务用户指南》中“对比同步项”章节。

 

3、割接建议

建议您选择一个业务低峰期,开始正式系统割接流程。割接前,请您确认至少在业务低峰期有过一次完整的数据对比。可以结合数据对比的“稍后启动”功能,选择业务低峰期进行数据对比,以便得到更为具有参考性的对比结果。由于同步具有轻微的时差,在数据持续操作过程中进行对比任务,可能会出现少量数据不一致对比结果,从而失去参考意义。

a)先中断业务(如果业务负载非常轻,也可以尝试不中断业务)。

b)在源数据库端执行如下语句,并观察在1-5分钟内若无任何新会话执行SQL ,则可认为业务已经完全停止。

db.currentOp()

说明:上述语句查询到的进程列表中,包括DRS迁移实例的连接,您需要确认除DRS迁移实例的连接外无任何新会话执行SQL,即可认为业务已经完全停止。

c)通过DRS迁移任务监控页面进行观察同步时延,保持实时同步时延为0,并稳定保持一段时间;同时,您可以使用数据级对比功能,进行割接前的最后一次数据级对比,耗时可参考之前的对比记录。

· 如果时间允许,则选择全部对比。

· 如果时间不允许,则推荐对比活跃表,关键业务表,第二步对比多次存在差异的表等。

d)确定系统割接时机,业务系统指向本云数据库,业务对外恢复使用,迁移完成。

 

4、迁移结束

a)结束迁移任务:业务系统和数据库切换至本云后,为了防止源数据库的操作继续同步到目标数据库,造成数据覆盖问题,此时您可选择结束迁移任务,该操作仅删除了迁移实例,迁移任务仍显示在任务列表中,您可以进行查看或删除。结束迁移任务后,DRS将不再计费。

b)删除迁移任务:对于已结束的迁移任务,您可选择删除任务。该操作将一并删除迁移任务,删除迁移任务后,该任务将不会出现在任务列表中。

上一篇:VPC使用场景有哪些 下一篇:删除节点DeleteNode

数据库和应用迁移 UGO

数据库和应用迁移 UGO(Database and Application Migration UGO,简称UGO)是专注于异构数据库结构迁移和应用SQL转换的专业云服务。通过UGO的预迁移评估、自动化语法转换,帮助用户提前识别迁移风险,提升迁移效率,最大化降低用户的数据库迁移成本