华为云用户手册

  • 场景描述 在满足源Redis和目标Redis的网络相通、源Redis已放通SYNC和PSYNC命令这两个前提下,使用在线迁移的方式,将源Redis中的数据全量迁移或增量迁移到目标Redis中。 如果源Redis禁用了SYNC和PSYNC命令,请务必放通后再执行在线迁移,否则迁移失败,选择DCS Redis实例进行在线迁移时,会自动放开SYNC命令。 在线迁移不支持公网方式直接迁移。 进行在线迁移时,建议将源端实例的参数repl-timeout配置为300秒,client-output-buffer-limit配置为实例最大内存的20%。 源端仅支持Redis 3.0及3.0以上的Redis版本。
  • 前提条件 在迁移之前,请先阅读迁移方案概览,选择正确的迁移方案,了解当前DCS支持的在线迁移能力,选择适当的目标实例。 如果是单机/主备等多DB的源端实例迁移到Proxy集群实例,Proxy集群默认不开启多DB,仅有一个DB0,请先确保源端实例DB0以外的DB是否有数据,如果有,请先参考开启多DB操作开启Proxy集群多DB设置。 如果是单机/主备等多DB的源端实例迁移到Cluster集群实例,Cluster集群不支持多DB,仅有一个DB0,请先确保源端实例DB0以外的DB是否有数据,如果有,请将数据转存到DB0,否则会出现迁移失败,将数据转存到DB0的操作请参考使用Rump在线迁移。
  • 步骤:3:检查网络 检查源Redis、目标Redis、迁移任务资源所在VPC是否在同一个VPC内。 如果是,则执行步骤4:创建在线迁移任务;如果不是,执行2。 检查源Redis的VPC、目标Redis的VPC、迁移任务资源所在VPC的网络是否打通,确保迁移任务的虚拟机资源能访问源Redis和目标Redis。 如果已打通,则执行步骤4:创建在线迁移任务;如果没打通,则执行3。 执行相应操作,打通网络。 当源Redis和目标Redis都属于DCS同一region,请参考VPC对等连接说明,查看和创建对等连接,打通网络。 当源Redis和目标Redis属于DCS不同Region,请参考云连接,查看和创建云连接,打通网络。 当源Redis和目标Redis属于不同的云厂商,仅支持云专线打通网络,请参考云专线。
  • 步骤4:创建在线迁移任务 登录分布式缓存服务控制台。 单击左侧菜单栏的“数据迁移”。页面显示迁移任务列表页面。 单击右上角的“创建在线迁移任务”。 设置迁移任务名称和描述。 配置在线迁移任务虚拟机资源的VPC、子网和安全组。 创建在线迁移任务时,需要选择迁移虚拟机资源的VPC和安全组,并确保迁移资源能访问源Redis和目标Redis实例。 创建的在线迁移任务会占用一个租户侧IP,即控制台上迁移任务对应的“迁移IP”。如果源端Redis或目标端Redis配置了白名单,需确保配置了迁移IP或关闭白名单限制。 迁移任务所选安全组的“出方向规则”需放通源端Redis和目标端Redis的IP和端口(安全组默认情况下为全部放通,则无需单独放通),以便迁移任务的虚拟机资源能访问源Redis和目标Redis。
  • 为了减少大Key和热Key过大,有什么使用建议? string类型控制在10KB以内,hash、list、set、zset元素尽量不超过5000个。 Key的命名前缀为业务缩写,禁止包含特殊字符(比如空格、换行、单双引号以及其他转义字符)。 Redis事务功能较弱,不建议过多使用。 短连接性能差,推荐使用带有连接池的客户端。 如果只是用于数据缓存,容忍数据丢失,建议关闭持久化。 大Key/热Key的优化方法,请参考下表。 类别 方法 大Key 进行大Key拆分。 分为以下几种场景: 该对象为String类型的大Key:可以尝试将对象分拆成几个Key-Value, 使用MGET或者多个GET组成的pipeline获取值,分拆单次操作的压力。如果是集群实例,由于集群实例包含多个分片,拆分后的Key会自动平摊到集群实例的多个分片上,从而降低对单个分片的影响。 该对象为集合类型的大Key,并且需要整存整取:在设计上严格禁止这种场景的出现,因为无法拆分。有效的方法是将该大Key从Redis去除,单独放到其余存储介质上。 该对象为集合类型的大Key,每次只需操作部分元素:将集合类型中的元素分拆。以Hash类型为例,可以在客户端定义一个分拆Key的数量N,每次对HGET和HSET操作的field计算哈希值并取模N,确定该field落在哪个Key上,实现上类似于Redis Cluster的计算slot的算法。 将大Key单独转移到其余存储介质。 无法拆分的大Key建议使用此方法,将不适用Redis能力的数据存至其它存储介质,如SFS或者其余NoSQL数据库,并在Redis中删除该大Key。 注意: 禁止使用DEL直接删除大Key,可能会造成Redis阻塞,甚至主备倒换。 合理设置过期时间并对过期数据定期清理。 合理设置过期时间,避免历史数据在Redis中大量堆积。由于Redis的惰性删除策略,过期数据可能并不能及时清理,如果发现Redis过期Key清理较慢,建议配置过期Key扫描。 热Key 使用读写分离。 如果热Key主要是读流量较大,则可以在客户端配置读写分离,降低对主节点的影响。还可以增加多个副本以满足读需求,但是备机较多也有相应的影响,DCS主备节点之间使用的是星型复制,即所有的备节点都直接和主节点保持同步,这样能保证备节点之间相互独立,且复制延迟较小。缺点是在备节点数量较多的情况下,主节点的CPU和网络负载会较高。 使用客户端缓存/本地缓存。 该方案需要提前了解业务的热点Key有哪些,设计客户端/本地和远端Redis的两级缓存架构,热点数据优先从本地缓存获取,写入时同时更新,这样能够分担热点数据的大部分读压力。缺点是需要修改客户端架构和代码,改造成本较高。 设计熔断/降级机制。 热Key极易造成缓存击穿,高峰期请求都直接透传到后端数据库上,从而导致业务雪崩。因此热Key的优化一定需要设计系统的熔断/降级机制,在发生击穿的场景下进行限流和服务降级,保护系统的可用性。 父主题: 大Key/热Key分析/过期Key扫描
  • DCS实例的CPU规格是怎么样的 Redis基础版: 使用DCS Redis基础版实例的用户无需关心CPU规格的指标,仅需关心QPS,带宽,内存大小等核心指标。 Redis基础版的实例基于开源Redis构造,开源Redis使用单个主线程处理命令,只能利用一个核的CPU,因此,只需认为单个Redis节点仅使用1核CPU即可。提升基础版Redis实例的内存大小,CPU规格不变。 Redis基础版由于社区版单线程处理模型的限制,如需增加实例CPU处理性能,请使用集群类型的Redis实例,通过增加分片的方式,来增加整个集群的处理性能。集群实例每个节点默认分配1核CPU进行处理。 Redis企业版: DCS Redis企业版为多线程版本,企业版Redis线程数请参考表1。企业版Redis的CPU最大使用率=线程数x100%,例如线程数为3的企业版Redis,最大CPU使用率为300%。 表1 企业版Redis线程数 实例内存规格 线程数(企业版高性能型主备实例) 线程数(企业版存储型主备实例) 8 GB 3 3 16 GB 4 6 32 GB 4 7 64 GB 4 - 父主题: 实例特性
  • DCS实例支持公网访问吗? Redis 3.0实例 目前只有Redis 3.0版本密码模式的实例支持公网访问,且可选择是否通过SSL方式来访问DCS缓存实例。建议使用前先下载CA证书,并使用CA证书来验证DCS缓存实例的证书,以确保缓存数据的安全。具体可参考公网连接Redis实例。 Redis 4.0及以上版本实例 Redis 4.0&5.0&6.0实例暂不支持公网访问,如单机、主备、Proxy集群实例确有公网访问场景,可使用Nginx方案,利用与Redis实例相同VPC与安全组的ECS做跳转。具体方案,请参考使用Nginx实现公网访问Redis4.0/5.0/6.0实例。 Cluster集群暂无公网访问的Nginx方案。 使用华为云ELB可以对不同类型的DCS实例实现公网访问,具体方案,请参考使用华为云ELB公网连接DCS。 Memcached实例 暂不支持公网访问,您必须通过同一虚拟私有云下的弹性云服务器来访问缓存实例,以确保缓存数据的安全。如果您在应用开发调试阶段,可以通过ssh代理方式,实现本地环境访问实例。具体操作参考使用SSH隧道代理机制实现公网访问DCS实例。 父主题: 客户端和网络连接
  • 事件监控支持的事件说明 表1 云数据库 GeminiDB事件监控支持的事件说明 事件来源 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 NoSQL 创建实例业务失败 NoSQLCreateInstanceFailed 重要 一般是由于实例配额不足或底层资源不足等原因导致。 先释放不再使用的实例再尝试重新发放,或者提交工单调整配额上限。 无法创建数据库实例。 变更规格失败 NoSQLResizeInstanceFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源再重试规格变更操作。 业务中断。 添加节点失败 NoSQLAddNodesFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源,删除添加失败的节点,重新尝试添加新节点。 无 删除节点失败 NoSQLDeleteNodesFailed 重要 一般是由于底层释放资源失败导致。 重新尝试删除节点。 无 扩卷失败 NoSQLScaleUpStorageFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源再重试扩卷操作。 如果磁盘满,会导致业务中断。 重置密码失败 NoSQLResetPasswordFailed 重要 一般是由于重置密码命令超时导致。 重新尝试重置密码操作。 无 修改参数模板失败 NoSQLUpdateInstanceParamGroupFailed 重要 一般是由于修改参数模板命令超时导致。 重新尝试修改参数模板操作。 无 设置备份策略失败 NoSQLSetBackupPolicyFailed 重要 一般是由于数据库连接异常导致。 重新重试设置备份策略操作。 无 创建手动备份失败 NoSQLCreateManualBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 创建自动备份失败 NoSQLCreateAutomatedBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 实例运行状态异常 NoSQLFaultyDBInstance 重要 由于灾难或者物理机故障导致实例故障时,会上报该事件,属于关键告警事件。 提交工单。 可能导致数据库服务不可用。 实例运行状态异常已恢复 NoSQLDBInstanceRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 节点运行状态异常 NoSQLFaultyDBNode 重要 由于灾难或者物理机故障导致数据库节点故障时,会上报该事件,属于关键告警事件。 检查数据库服务是否可以正常使用,并提交工单。 可能导致数据库服务不可用。 节点运行状态异常已恢复 NoSQLDBNodeRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 实例主备切换 NoSQLPrimaryStandbySwitched 重要 在手动触发的主备倒换或节点故障自动触发的故障倒换场景下,会上报该事件。 不需要处理。 无 出现热点分区键 HotKeyOccurs 重要 客观上是因为主键设置不合理,使得热点数据集中分布在一个分区。客户端不合理的应用程序设计,造成对某一key的频繁读写。 1. 选择合理的分区键。 2. 业务增加缓存,业务应用先从缓存中读取热点数据。 影响业务请求成功率,存在影响集群性能及稳定性的风险。 出现超大分区键 BigKeyOccurs 重要 主键设计不合理,单个分区的记录数或数据量过大,引起了节点负载不均。 1. 选择合理的分区键 2. 基于现有分区键,增加分区键散列。 随着数据量增长,集群稳定性会下降。 数据盘空间不足 NoSQLRiskyDataDiskUsage 重要 数据盘空间不足,产生此告警。 请参见对应服务用户指南中“扩容磁盘”的内容,进行磁盘扩容。 实例被设为只读模式,数据无法写入。 数据盘空间已扩容并恢复可写 NoSQLDataDiskUsageRecovered 重要 数据盘空间已扩容并恢复可写,产生此事件。 无需处理。 无 创建索引失败 NoSQLCreateIndexFailed 重要 业务负载超过实例规格瓶颈,此时再创建索引会耗费更多实例资源,导致响应变慢甚至卡顿,最终超时,引起索引创建失败。 1、根据业务负载,选择匹配的实例规格 2、在业务低峰期创建索引 3、使用后台方式创建索引 4、索引字段,结合业务进行合理选择。 索引创建失败或不完整,导致索引无效,需要删掉索引重新创建。 发生写入降速 NoSQLStallingOccurs 重要 写入速度快,接近集群规模和实例规格范围允许最大写能力,从而触发数据库自身的限流机制,会发生请求失败情况 1. 根据业务的最大写请求速率,调整集群规模或者节点规格 2. 衡量业务的最大写请求速率,分散业务写峰值速率 影响业务的请求的成功率 发生写入停止 NoSQLStoppingOccurs 重要 写入速度过快,达到集群规模和实例规格范围允许最大写能力,从而触发数据库自身的限流机制,会发生请求失败情况 1. 根据业务的最大写请求速率,调整集群规模或者节点规格 2. 衡量业务的最大写请求速率,分散业务写峰值速率 影响业务的请求的成功率 重启数据库失败 NoSQLRestartDBFailed 重要 一般是由于实例状态异常等原因导致。 提交工单让运维处理。 数据库实例状态可能存在异常。 恢复到新实例失败 NoSQLRestoreToNewInstanceFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源,重新尝试添加新节点。 无法恢复到新的数据库实例。 恢复到已有实例失败 NoSQLRestoreToExistInstanceFailed 重要 一般是由于备份文件下载或恢复失败等原因导致。 提交工单让运维处理。 当前数据库实例可能处于不可用状态。 删除备份文件失败 NoSQLDeleteBackupFailed 重要 一般是由于备份文件从obs删除失败导致。 重新尝试删除备份文件。 无 切换慢日志明文开关失败 NoSQLSwitchSlowlogPlainTextFailed 重要 一般是由于接口不支持切换等原因导致。 请查阅NoSQL用户指南,确认接口支持打开慢日志明文开关。提交工单让运维处理。 无 绑定EIP失败 NoSQLBindEipFailed 重要 一般是由于节点状态不正常,节点已经绑定EIP或EIP非法等原因导致。 检查节点是否正常,EIP是否合法。 无法通过公网访问数据库实例。 解绑EIP失败 NoSQLUnbindEipFailed 重要 一般是由于节点状态不正常,节点已经未绑定EIP等原因导致。 检查节点和EIP状态是否正常。 无 修改参数失败 NoSQLModifyParameterFailed 重要 一般是由于参数取值非法等原因导致。 排查参数值是否符合在合法范围内,提交工单让运维处理。 无 参数模板应用失败 NoSQLApplyParameterGroupFailed 重要 一般是由于实例状态异常导致参数模板无法应用等原因导致。 提交工单让运维处理。 无 开启或关闭SSL失败 NoSQLSwitchSSLFailed 重要 一般是由于修改SSL命令超时导致。 重新提交一次或者提交工单处理,并先保持切换之前使用SSL的连接方式。 是否使用SSL连接。 单行数据量太大 LargeRowOccurs 重要 用户单行数据量过大,可能会导致查询超时,进而节点OOM异常等各种故障发生。 1. 对每列和每行的写入长度做限制,遵从规范,使得单行的的key和value长度和不超过阈值。 2. 排查业务是否出现异常写入和异常编码,导致写入大row。 过大的单行记录,随着数据量增长,集群稳定性会下降。 父主题: 事件监控
  • GeminiDB Mongo内核版本发布说明 本章节介绍GeminiDB Mongo的内核版本更新说明。 表1 GeminiDB Mongo版本说明 版本 日期 特性描述 4.0 2023-09-30 新特性及性能优化: 新增数据库死锁告警,当数据库死锁时上报告警,及时发现并规避问题。 问题修复: 修复只读状态下,可执行Distict命令的问题。 2023-07-30 新特性及性能优化: 支持设置“只写”状态,禁止特定读命令执行。 支持主节点被动触发Compaction时,同步到备节点执行该Compaction,避免备节点因磁盘占满与主节点脱节。 2023-06-30 新特性及性能优化: 支持客户端断开时,自动Kill该客户端关联的执行中的op,避免无效op占用系统资源。 优化TTL、删除操作等产生大量脏数据场景下的Compaction策略,使系统更加稳健。 添加配置参数,支持启动时触发全量Compaction,加速实例在大量脏数据场景下的启动速度。 2023-04-30 新特性及性能优化: 新增检测到磁盘故障时,会自动主备倒换,使数据库更加稳定地运行。 问题修复: 修复SERVER-37686漏洞。 2023-01-30 新特性及性能优化: 新增接口,在删除数据后,可主动释放存储空间。 父主题: 版本发布说明
  • GeminiDB Influx内核版本发布说明 本章节介绍GeminiDB Influx的内核版本更新说明。 表1 GeminiDB Influx版本说明 版本 日期 特性描述 1.7 2023-06-30 新特性及性能优化: 单节点实例支持选购冷存储,通过极简配置实现冷热数据分离,从而降低存储成本。 当单节点实例申请的冷存储空间不能满足业务需求时,支持扩容冷存储。 事件监控提供了事件类型数据上报、查询和告警的功能。 2023-04-30 新特性及性能优化: 云数据库 GeminiDB管理控制台购买InfluxDB单节点的数据库实例。 2023-03-30 新特性及性能优化: 支持操作系统更新,以提高数据库性能和数据库的整体安全状况。 2022-01-30 新特性及性能优化: 支持批量续费、退订、按需计费转包年/包月、包年/包月转按需计费操作。 2021-07-30 新特性及性能优化: 支持选购冷存储,通过极简配置实现冷热数据分离,从而降低存储成本。 当实例申请的冷存储空间不能满足业务需求时,支持扩容冷存储。 2021-06-30 新特性及性能优化: 购买集群实例时,实例名称支持中文。 支持修改安全组。 2021-04-30 新特性及性能优化: 支持数据备份和恢复,以保证数据可靠性。 2021-01-30 新特性及性能优化: 支持通过实例操作列执行规格变更、添加节点和磁盘扩容操作。 2020-11-30 新特性及性能优化: 支持实例添加节点,满足业务需求。 支持修改用户创建的数据库参数模板中的参数值,确保数据库实例发挥出最优性能。 2020-10-30 新特性及性能优化: 扩容磁盘支持每次至少选择1GB扩容量。 2020-09-30 新特性及性能优化: 如果资源配额限制无法满足使用需要时,支持申请扩大配额。 根据可能需要支持重启数据库实例。 2020-08-30 新特性及性能优化: 以方便区分和识别实例,支持修改数据库实例名称。 支持将删除的实例,加入回收站管理,可以在回收站中重建实例恢复数据。 支持包周期计费模式。 支持查看实例的各项监控指标。 2020-07-30 新特性及性能优化: 支持通过公网方式连接实例。 支持跨AZ级容灾。 父主题: 版本发布说明
  • GeminiDB Influx各版本的生命周期规划 EOM:End of Marketing,停止该版本的销售。 EOS:End of Service & support,停止该版本的服务,建议您在执行作业时选择最新版本的引擎。在该日期之后,不再提供该软件版本的任何技术服务支持。 表1 GeminiDB Influx各版本生命周期规划表 版本 当前状态 华为云商用时间 计划EOM时间 计划EOS时间 1.7 已商用 2020年1月 暂无计划 持续运营 1.8 已商用 2023年7月 暂无计划 持续运营
  • Foxmail 7.2 客户端绑定华为云企业邮箱 绑定账号前,请确保已在邮箱个人设置-账号安全,生成客户端密码(可参考第三方客户端绑定专有密码生成)。随后进入Foxmail客户端,在Foxmail窗口右上角单击菜单入口,点击账号管理 点击左下角的新建按钮,弹窗出“新建账号”,点击手动设置,在弹出页面中填写您的邮箱地址和密码,进入配置页面。 接收服务器类型建议选择IMAP (可同步全部邮件数据),如选择POP3类型,只能同步收件箱数据。 邮件账号为邮箱地址,密码为客户端专有密码。 (1)对于国内用户: 邮件账号为邮箱地址,密码为客户端专有密码。 IMAP 服务器:imap.sparkspace.huaweicloud.com 端口:993 (需勾选SSL) SMTP服务器:smtp.sparkspace.huaweicloud.com 端口:465 (需勾选SSL) 如若选择POP3接收服务器类型,参数如下: POP服务器:pop3.sparkspace.huaweicloud.com 端口:995(需勾选SSL) (2)对于海外用户: 邮件账号为邮箱地址,密码为客户端专有密码。 IMAP 服务器:imap-global.sparkspace.huaweicloud.com 端口:993 (需勾选SSL) SMTP服务器:smtp-global.sparkspace.huaweicloud.com 端口:465 (需勾选SSL) 如若选择POP3接收服务器类型,参数如下: POP服务器:pop3-global.sparkspace.huaweicloud.com 端口:995(需勾选SSL) 完成配置后,即可使用该客户端收发邮件。
  • 试用版邮箱如何转商? 免费试用订单到期前,如您满意可以在订单详情选择转商用;如您试用订单到期后未转商用,则试用订单数据将彻底删除。 标准版免费试用时长为15天,您可以在到期的15天内在后台选择转商。 试用转商操作步骤: 方法一:进入“买家中心-我的云商店-已购买的服务” 查看“华为云企业邮箱”商品的资源详情,即可查看右上角有“转商用”,点击后即可到转商支付页面,选择商用时长,点击支付。 方法二:进入“买家中心-我的云商店-已购买的服务” 查看“华为云企业邮箱”商品的右侧点击“更多”的“转商用”,点击后即可到转商支付页面,选择商用时长,点击支付。 父主题: 邮箱开通及登录使用
  • 步骤一:建设四层指标体系 接入业务层指标。 登录AOM 2.0控制台。 在左侧导航栏中选择“接入中心”。 在右侧“业务层”面板单击需要接入的指标卡片。 接入ELB 日志指标 系统可自动接入,无需用户手动操作。 在左侧导航栏,选择已创建的仪表盘,单击页面右上角的,输入对应SQL语句,即可在仪表盘中查看该日志指标。以查看流量指标为例,输入对应SQL语句,单击“查询”,如图2所示。 图2 查看流量指标 接入APM事务指标 为工作负载安装APM探针,具体操作请参见安装APM探针。 安装完成后,请登录安装探针的服务对应的控制台界面,执行操作触发APM事务指标的采集。以本实践场景中的商城服务为例,可以在商城操作界面将对应商品添加到购物车。 登录AOM 2.0控制台。 在左侧导航栏选择“指标浏览”。在右侧区域通过选择指标的方式查看接入的APM指标。 接入应用层指标。 为工作负载安装APM探针,具体操作如下: 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“工作负载 ”,选择需要上报到AOM的工作负载类型。 单击工作负载名称,选择“性能管理配置”,单击右下角“编辑”,修改“性能管理配置”相关信息。 选择“APM 2.0探针”,设置“探针版本”为“latest-x86”,“APM环境”为“phoenixenv1”,从“APM应用”的下拉列表中选择创建的“phoenixapp1”应用。 设置完成后,单击“保存”。 安装完成后,请登录安装探针的服务对应的控制台界面,执行操作触发应用层指标的采集。以本实践场景中的商城服务为例,可以在商城操作界面将对应商品添加到购物车。 登录AOM 2.0控制台。 在左侧导航栏选择“指标浏览”。在右侧区域通过选择指标的方式查看接入的应用层指标。 接入中间件指标。 将数据上传到ECS服务器。 下载mysqld_exporter-0.14.0.linux-amd64.tar.gz软件包,下载地址:https://prometheus.io/download/。 以root用户登录ECS服务器,将下载的Exporter软件包上传到ECS服务器并解压。 登录RDS 控制台,在“实例管理”界面实例列表中单击一个RDS实例名。在“基本信息”界面查看RDS安全组。 图3 查看RDS安全组 检查RDS的安全组是否已开放3306端口。 图4 检查RDS端口是否开放 执行以下命令,进入解压文件夹,并在ECS服务器上配置mysql.cnf文件。 cd mysqld_exporter-0.14.0.linux-amd64 vi mysql.cnf 例如,在mysql.cnf文件中添加如下内容: [client] user=root(rds用户名) password=****(rds密码) host=192.168.0.198(rds公网IP) port=3306(端口) 执行以下命令,启动mysqld_exporter工具。 nohup ./mysqld_exporter --config.my-cnf="mysql.cnf" --collect.global_status --collect.global_variables & 执行以下命令,确认工具是否正常启动。 curl http://127.0.0.1:9104/metrics 如果回显信息如图5所示,能够查看到指标则说明工具启动正常。 图5 查看指标 通过虚机接入方式接入中间件指标。 登录AOM 2.0控制台。 在左侧导航栏中选择“接入中心”,在右侧“中间件”面板单击需要接入的指标卡片。 在“虚机接入”界面为ECS服务器安装UniAgent采集工具,具体操作请参见手动安装UniAgent。 为创建的“phoenixenv1”环境创建中间件采集任务。在左侧导航栏中,选择“采集任务”,单击“新增采集任务”。 图6 创建采集任务 在创建采集任务页面中,配置相关参数信息。 关键配置项说明如下: Exporter地址/REDIS_Exporter地址/MySQL_Exporter地址:安装Exporter/REDIS_Exporter/MySQL_Exporter的主机IP地址和端口号。格式为IP:Port,例如:127.0.0.1:9104。 中间件地址/REDIS 地址/MySQL 地址:Exporter/REDIS_Exporter/MySQL_Exporter启动实例监控的主机/REDIS/MySQL,通常填写主机/REDIS/MySQL的IP地址。 指标:待采集的指标。默认为:''(单引号)表示输出原本的所有指标。如果需对采集指标进行过滤,则按如下格式进行填写,例如:'metric1, metric2'。 指标维度:新增采集指标维度。单击,输入指标维度名和指标维度值,字符长度不超过20个字符。最多可添加10个标签。例如:指标维度名为label1,指标维度值为label2,则添加成功后为label1:"label2"。 图7 配置采集参数-1 图8 配置采集参数-2 完成后,单击“立即创建”。 接入完成后,在左侧导航栏,选择“指标浏览”。在右侧区域通过选择指标的方式查看接入的中间件指标。 接入基础设施层指标。 登录AOM 2.0控制台。 在左侧导航栏中选择“接入中心”。 在右侧“运行环境”与“云服务”面板单击需要接入的指标卡片。 选择容器指标卡片: 以选择“云容器引擎CCE”卡片为例,具体操作如下: 在“插件市场”界面搜索找到云原生监控插件,单击“安装”。 图9 查找云原生监控插件 设置集群名称、规格信息。 开启对接第三方开关,将普罗数据上报至AOM,填写上报AOM的地址及token,并跳过证书认证。 图10 设置对接第三方参数 参数说明如下: 数据上报地址 :https://aom-internal-access.{region_name}.myhuaweicloud.com:8443/v1/{project_id}/push,其中region_name为指定承载REST服务端点的服务器域名或IP,project_id 为项目的ID,您可以单击右上方的用户名称,在下拉列表中选择“我的凭证”。在“我的凭证”页面中选择“API凭证”页签。从右侧项目列表的“项目”和“项目ID”信息中获取。例如AOM服务在“华北-北京一”区域名称为“cn-north-1”。 Token:登录AOM 2.0控制台,在左侧导航栏选择“设置”,单击“认证管理”,从右侧AccessCode列表的“ID”信息中获取。 设置完成后,单击“安装”。安装完后单击插件查看安装状态,当状态都为“运行中”则表示插件安装成功。 图11 安装kube-prometheus-stack插件 选择云服务监控指标卡片: 在弹出的“云服务接入”对话框中选择需要监控的云服务。例如RDS或DCS服务。 单击“确定”完成接入。 接入完成后,系统自动跳转至“云服务监控”页面,即可查看已选择的云服务运行状态等信息。 接入完成后,在左侧导航栏选择“指标浏览”。在右侧区域通过选择指标的方式查看接入的基础设施层指标。
  • 解决方案 AOM能够实现云上应用的一站式立体化运维管理,在接入中心中可以接入需要监控的业务层、应用层、中间件层、基础设施层指标,在仪表盘中实现个性化监控,以及通过统一告警入口配置告警规则,实现业务的日常巡检,保障业务的正常运行。 AOM提供多场景、多层次、多维度指标数据的监控能力,建立了从基础设施层指标、中间件层指标、应用层指标到业务层指标的四层指标体系,将1000+种指标数据全方位呈现,数据丰富全面。 表1 AOM支持的四层指标体系 类型 来源 指标举例 如何接入 业务层指标 通常来源于端侧日志SDK、提取的ELB日志。 访问UV、访问PV、访问延时、访问失败率、访问流量情况等 接入业务层指标 通常来源于事务监控或上报的自定义指标。 URL的调用次数、URL的最大并发数、URL的最大响应时间等 应用层指标 通常来源于组件性能图表或接口性能数据。 接口调用次数、请求平均时延、错误调用次数、请求吞吐量等 接入应用层指标 中间件指标 通常来源于原生中间件或云中间件数据。 文件系统容量、文件系统使用率等 接入中间件指标 基础设施层指标 通常来源于容器或云服务相关数据,例如计算、存储、网络、数据库等。 CPU使用率、内存使用率、健康状态等 接入基础设施层指标 接入容器指标 接入云服务指标 图1 AOM四层指标体系
  • 步骤二:开启AOM可信服务并设置委托管理员(若进行监控的账号为组织管理员,可跳过此步骤) 使用组织中的管理员账号登录组织Organizations控制台。 在左侧导航栏选择“可信服务”。 在可信服务列表中,单击“应用运维管理服务(AOM)”操作列的“启用”,开启AOM可信服务。 单击“应用运维管理服务(AOM)”操作列的“设置委托管理员”,选择需要设置为委托管理员的账号,单击“确定”。如图5所示,将paas_aom设置为委托管理员。 图5 设置委托管理员
  • 前提条件 监控账号与被监控账号均已加入组织。监控账号需为组织管理员,非组织管理员的组织成员需进行步骤二,授权委托管理员身份。 被监控账号当前支持汇聚的包括“Prometheus for 云服务”可接入的18个云服务指标(FunctionGraph,EVS,CBR,OBS,VPC,ELB,DC,NAT,DMS,DCS,RDS,DDS,DRS,LakeFormation,MRS,GaussDB DWS,CSS,WAF)以及ICAgent采集的CCE和ECS指标。
  • 请求示例 迁移备份资源从源存储库到目标存储库且不删除源备份。 POST https://{endpoint}/v3/f841e01fd2b14e7fa41b6ae7aa6b0594/vaults/79bd9daa-884f-4f84-b8fe-235d58cd927d/migrateresources { "resource_ids" : [ "abcdde3f-e0e3-403a-b690-fc259dd70008" ], "destination_vault_id" : "fe578a6c-d1a8-4790-bd52-5954af4d446c" }
  • 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。 通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。 表3 请求Body参数 参数 是否必选 参数类型 描述 destination_vault_id 是 String 目标存储库 resource_ids 是 Array of strings 待迁移的资源ID
  • 请求示例 执行存储库资源自动备份,生成备份还原点。 POST https://{endpoint}/v3/f841e01fd2b14e7fa41b6ae7aa6b0594/checkpoints { "checkpoint" : { "parameters" : { "auto_trigger" : true, "description" : "backup_description", "incremental" : true, "name" : "backup_name", "resources" : [ "94eba8b2-acc9-4d82-badc-127144cc5526" ] }, "vault_id" : "3b5816b5-f29c-4172-9d9a-76c719a659ce" } }
  • 响应示例 状态码: 200 OK { "checkpoint" : { "status" : "protecting", "created_at" : "2019-05-10T07:59:12.733+00:00", "vault" : { "skipped_resources" : [ ], "id" : "3b5816b5-f29c-4172-9d9a-76c719a659ce", "resources" : [ { "name" : "ecs-1f0f-0002", "resource_size" : 40, "protect_status" : "available", "type" : "OS::Nova::Server", "id" : "94eba8b2-acc9-4d82-badc-127144cc5526" } ], "name" : "vault-be94" }, "project_id" : "4229d7a45436489f8c3dc2b1d35d4987", "id" : "8b0851a8-adf3-4f4c-a914-dead08bf9664", "extra_info" : { "retention_duration" : -1, "name" : "backup_name", "description" : "backup_description" } } }
  • 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。 表3 请求Body参数 参数 是否必选 参数类型 描述 checkpoint 是 VaultBackup object 存储库执行备份参数 表4 VaultBackup 参数 是否必选 参数类型 描述 parameters 否 CheckpointParam object 参数 vault_id 是 String 存储库ID 表5 CheckpointParam 参数 是否必选 参数类型 描述 auto_trigger 否 Boolean 是否自动触发,true:自动触发,false:非自动触发。 缺省值:false description 否 String 备份描述 最小长度:0 最大长度:255 incremental 否 Boolean 是否增量备份,true:增量备份,false:非增量备份。 缺省值:true name 否 String 备份名称,只能由数字、中文、英文大小写字母,以及下划线"_"和中横线 "-" 字符构成。 最小长度:1 最大长度:64 resources 否 Array of strings 待备份的资源id列表:uuid resource_details 否 Array of Resource objects 资源详情 数组长度:0 - 256 表6 Resource 参数 是否必选 参数类型 描述 extra_info 否 ResourceExtraInfo object 资源附加信息 id 是 String 待备份资源id name 否 String 待备份资源名称,长度限制:0-255 最小长度:0 最大长度:255 type 是 String 待备份资源的类型: OS::Nova::Server, OS::Cinder::Volume, OS::Ironic::BareMetalServer, OS::Native::Server, OS::Sfs::Turbo, OS::Workspace::DesktopV2 表7 ResourceExtraInfo 参数 是否必选 参数类型 描述 exclude_volumes 否 Array of strings 需要排除备份的卷id。仅在多盘备份特性中有效,排除不需要备份的磁盘。当虚拟机新绑定磁盘时,也能继续排除之前设置不用备份的卷。
  • 响应参数 状态码: 200 表8 响应Body参数 参数 参数类型 描述 checkpoint CheckpointCreate object 还原点信息 表9 CheckpointCreate 参数 参数类型 描述 created_at String 创建时间,例如:"2020-02-05T10:38:34.209782" id String 还原点ID project_id String 项目ID status String 状态 available: 可用 deleting: 删除中 protecting: 保护中 deleted: 已删除 error-deleting:删除异常 error: 异常 vault CheckpointPlanCreate object 存储库信息 extra_info CheckpointExtraInfoResp object 扩展信息 表10 CheckpointPlanCreate 参数 参数类型 描述 id String 存储库id name String 存储库名称 resources Array of CheckpointResourceResp objects 备份对象 skipped_resources Array of CheckpointCreateSkippedResource objects 备份时跳过的资源列表 表11 CheckpointResourceResp 参数 参数类型 描述 extra_info String 资源附加信息 id String 待备份资源id name String 待备份资源名称 protect_status String 保护状态 available: 可用 error: 异常 protecting: 保护中 restoring: 恢复中 removing: 删除中 resource_size String 资源已分配容量,单位为GB type String 待备份资源的类型: OS::Nova::Server, OS::Cinder::Volume, OS::Ironic::BareMetalServer, OS::Native::Server, OS::Sfs::Turbo, OS::Workspace::DesktopV2 backup_size String 副本大小 backup_count String 副本数量 表12 CheckpointCreateSkippedResource 参数 参数类型 描述 id String 资源ID type String 资源类型 name String 资源名称 code String 请参见错误码。 reason String 跳过原因,例如:该资源正在备份中。 表13 CheckpointExtraInfoResp 参数 参数类型 描述 name String 备份名称 description String 备份描述 retention_duration Integer 备份保留天数
  • 响应示例 状态码: 200 OK { "count" : 2, "limit" : 1000, "offset" : 0, "agents" : [ { "created_at" : "2022-01-30T09:28:09.334+00:00", "agent_id" : "489654f2-363b-4ebf-966a-bdf079d97114", "host_name" : "eBackup", "host_ip" : "18.9.158.36", "status" : "normal", "last_active_time" : "2022-01-30T09:28:08.960+00:00" }, { "created_at" : "2022-01-14T06:47:17.524+00:00", "updated_at" : "2022-01-28T05:01:32.739+00:00", "agent_id" : "fb711278-e872-4224-b442-8dafc36a543d", "host_name" : "ecs-00001", "host_ip" : "10.10.0.1", "status" : "normal", "last_active_time" : "2022-01-28T05:01:32.000+00:00", "paths" : [ { "id" : "6c3d1ed6-b7d7-4e27-94ee-321431e84c5c", "dir_path" : "/home/hcp", "status" : "available", "agent_id" : "fb711278-e872-4224-b442-8dafc36a543d" }, { "id" : "e2af0fdd-9644-4db8-986e-5a6a2395c390", "dir_path" : "/opt/workspace", "status" : "available", "agent_id" : "fb711278-e872-4224-b442-8dafc36a543d" } ] } ] }
  • URI GET /v3/{project_id}/agents 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID 表2 Query参数 参数 是否必选 参数类型 描述 agent_id 否 String 客户端ID limit 否 String 每页显示条目数,正整数 最小长度:1 最大长度:1000 offset 否 Integer 偏移值,正整数 status 否 String 状态
  • 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 agents Array of Agent objects 客户端实例列表 count Integer 客户端个数 limit Integer 每页显示的条目数量 offset Integer 偏移量,表示从此偏移量开始查询 表5 Agent 参数 参数类型 描述 created_at String 客户端创建时间 updated_at String 客户端更新时间 agent_id String 客户端ID agent_version String 客户端版本号 agent_type String 客户端类型 host_name String 客户端所在的主机名 host_nickname String 客户端所在的主机昵称 host_ip String 客户端所在主机的IP host_os String 客户端主机所在的操作系统 status String 客户端状态 last_active_time String 客户端上次激活时间 paths Array of Path objects 客户端的备份路径 表6 Path 参数 参数类型 描述 id String 路径ID status String 路径状态,有available和remove两种状态 agent_id String 该路径所属于的客户端ID dir_path String 路径详情
  • 请求示例 注册客户端由agent安装时自动触发,无需客户手动调用。 POST https://{endpoint}/v3/f841e01fd2b14e7fa41b6ae7aa6b0594/agents { "agent" : { "agent_id" : "489654f2-363b-4ebf-966a-bdf079d97114", "host_name" : "ecs-00002", "host_ip" : "10.10.0.2", "host_os" : "linux", "agent_version" : "1.0.0", "agent_type" : "native" } }
  • 响应示例 状态码: 200 OK { "agent" : { "created_at" : "2022-01-30T09:28:09.334+00:00", "updated_at" : "2022-01-30T09:28:09.334+00:00", "agent_id" : "489654f2-363b-4ebf-966a-bdf079d97114", "agent_version" : "1.0.0", "agent_type" : "native", "host_name" : "ecs-0001", "host_nickname" : "", "host_ip" : "192.168.10.144", "host_os" : "linux", "status" : "normal", "last_active_time" : "2022-01-30T09:28:08.960+00:00" } }
  • 响应参数 状态码: 200 表5 响应Body参数 参数 参数类型 描述 agent Agent object 客户端详情 表6 Agent 参数 参数类型 描述 created_at String 客户端创建时间 updated_at String 客户端更新时间 agent_id String 客户端ID agent_version String 客户端版本号 agent_type String 客户端类型 host_name String 客户端所在的主机名 host_nickname String 客户端所在的主机昵称 host_ip String 客户端所在主机的IP host_os String 客户端主机所在的操作系统 status String 客户端状态 last_active_time String 客户端上次激活时间 paths Array of Path objects 客户端的备份路径 表7 Path 参数 参数类型 描述 id String 路径ID status String 路径状态,有available和remove两种状态 agent_id String 该路径所属于的客户端ID dir_path String 路径详情
  • 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 通过调用IAM服务获取用。 表3 请求Body参数 参数 是否必选 参数类型 描述 agent 是 AgentRegister object 客户端注册参数 表4 AgentRegister 参数 是否必选 参数类型 描述 agent_id 是 String 客户端ID host_name 是 String 客户端所在的主机名 host_ip 是 String 客户端所在主机的IP host_os 是 String 客户端所在主机的操作系统 host_nickname 否 String 客户端所在主机的主机别名 agent_version 否 String 客户端版本 agent_type 否 String 客户端类型,分本地客户端和云上客户端(cloud/native)
共100000条