华为云用户手册

  • 创建模型实例数据 应用服务器可调用此接口创建数字工厂平台的模型实例数据。 输入参数 用户配置该执行动作,需要配置相关参数,参数说明请参考表2。 表2 创建模型实例数据输入参数说明 参数 类型 是否必填 说明 默认值 示例值 project_id String 是 项目ID。获取方法请参见获取对接信息。 无 abc***fffff model_id String 是 模型ID。获取方法请参见获取模型ID。 无 abc***fffff record Object 是 模型动态信息数据,JSON格式。 无 { "id": "id1", "name": "name1", "status": "enabled" } parent_record_id String 否 上级模型实例数据唯一标识,创建子模型实例数据时必填。获取方法请参见获取模型ID。 无 xxx 输出参数 用户可以在之后的执行动作中调用该输出参数,参数说明请参考表3。 表3 创建模型实例数据输出参数说明 参数 类型 说明 默认值 示例值 record_id String 模型实例数据ID。 无 aaabxxsax record Object 模型实例数据结构体,JSON格式。 无 { "id": "id1", "name": "name1", "status": "enabled" }
  • 连接参数 连接器使用数字工厂分配的client_id和client_secret认证方式,连接前需要先登录数字工厂平台应用集成界面创建一个新应用,并获取到认证信息,请参考获取认证信息。 连接器验证,需要配置相关参数,参数说明请参考表1。 表1 连接器认证参数说明 参数 类型 是否必填 说明 默认值 示例值 应用标识 String 是 注册应用后,分配的client_id。获取方法请参见获取认证信息。 无 YVMBE***QIJCR 应用密钥 String 是 注册应用后,分配的client_secret。获取方法请参见获取认证信息。 无 ****** 实例ID String 是 实例ID。获取方法请参见获取对接信息。 无 aaa***bbb 站点编码 String 否 站点编码。企业层调用时必填,行业层调用时不需要填写。获取方法请参见获取对接信息。 无 DefaultSite
  • 查询模型实例数据列表 应用服务器可调用此接口查询数字工厂平台的模型实例数据列表,了解模型实例数据的概要信息。 输入参数 用户配置该执行动作,需要配置相关参数,参数说明请参考表4。 表4 查询模型实例数据列表输入参数说明 参数 类型 是否必填 说明 默认值 示例值 project_id String 是 项目ID。获取方法请参见获取对接信息。 无 abc***fffff model_id String 是 模型ID。获取方法请参见获取模型ID。 无 abc***fffff limit Integer 否 分页查询时每页显示的记录数。取值范围:1~50的整数。 10 50 marker String 否 上一次分页查询结果中最后一条记录的ID。 ffffffffffffffffffffffff ffffffffffffffffffffffff parent_record_id String 否 上级模型实例数据唯一标识,查询子模型实例数据时必填。 无 aaabxxsax condition_type String 否 查询条件类型,所有条件(AND)、任意条件(OR)。 无 OR conditions Array 否 查询条件。 无 [ { "code":"id", "op":"equal", "value": "abceddddddd" } ] 输出参数 用户可以在之后的执行动作中调用该输出参数,参数说明请参考表5。 表5 查询模型实例数据列表输出参数说明 参数 类型 说明 默认值 示例值 records Array 模型实例数据列表。 无 aaabxxsax page Object 列表分页信息。 无 { "id": "id1", "name": "name1", "status": "enabled" }
  • 管理我收藏的应用 在“我的Agent”页面的“应用列表”区域,选择“我收藏的”页签。 在收藏的应用列表中,单击应用所在行的“操作”列的“取消收藏”,可从收藏的应用列表中移除我已收藏的应用。 单击“操作”列的“体验”,进入“应用体验”页面。 在“应用体验”页面,参照表7进行相关参数和请求体配置。 表7 应用体验参数配置 参数名称 参数说明 参数配置 API 无需配置,默认为调用应用的URL。 选择应用部署 无需配置,由系统自动部署生成。 选择应用 无需配置,默认为当前应用。 选择接口API 仅体验平台预置的应用时,需要配置此参数。 无需配置,默认为当前应用的接口API。 请求体 输入应用接口中的请求体内容。 示例如下: { "query": "请详细说明AppStage平台有哪些大模型", "file_id": [] } 在“应用体验”页面右侧“API调测”区域,单击查看调测结果。 对话框中输入API调试语句也可进行调测。
  • 节气信息查询 根据输入的节气名称和年份信息,给出该节气的日期范围,介绍,习俗等。 输入参数 用户配置节气信息查询执行动作,相关参数说明如表2所示。 表2 节气信息查询输入参数说明 参数 必填 说明 示例值/默认值 节气名称 是 24节气名称。 立春 年份 否 指定年份。 2020 输出参数 用户可以在之后的执行动作中调用该输出参数,输出参数说明请参考表3。 表3 节气信息查询输出参数说明 参数 说明 示例值/默认值 节气名称 查询的节气名称。 立春 节气图 该节气的节气图。 lichun.jpg 日期范围 日期范围。 2月4日或5日 公历日期 公历日期。 2020-02-04 农历日期 农历日期。 2020-1-11 农历年 农历年。 庚子 农历月 农历月。 正月 农历日 农历日。 十一 农历生肖 农历生肖。 鼠 诗句 该节气相关的诗句。 东风带雨逐西风,大地阳和暖气生。万物苏萌山水醒,农家岁首又谋耕。 介绍 该节气的介绍。 立春不仅是农历二十四节气中的第一个节气...... 习俗 该节气的习俗。 立春后,人们在春暖花开的日子里,喜欢外出游春...... 美食 该节气的美食。 立春时的食品主要是春饼、萝卜、五辛盘等,在南方则流行吃春卷...... 宜忌 该节气的宜忌。 立春后是疾病多发的季节。春天的多发病有肺炎、肝炎、流脑、麻疹......
  • Token校验 客户端在使用Token校验的流程如下。 已获取大屏分享链接和Token。 例如,分享链接https://console.ulanqab.huawei.com/sve/preview.html?region=cn-north-7#/screen/share/18cd21df7bc-WPgj_GqRc。其中“region”的值为“cn-north-7”,“pageId”的值为“18cd21df7bc-WPgj_GqRc”。 使用代码开发工具将大屏分享链接中的pageId和region拼接成如下格式的字符串。 pageId|region; 使用HmacSHA256算法对拼接的字符串进行签名,并将签名后的字符串使用Base64进行转换。签名时需要使用对应的Token。 HmacSHA256签名和Base64转换的示例如下: import java.security.*; import javax.crypto.*; import javax.crypto.spec.SecretKeySpec; import org.apache.commons.codec.binary.Base64; import java.net.URLEncoder; public class ShareWithTokenTest { public static void main(String[] args) throws Exception { System.out.println(getShareUrlWithToken("********722467a9477b5b*******", "cn-7", "*******r1tyy1C7Jenni3p*********")); } public static String getShareUrlWithToken(String pageId, String region, String token){ String data = pageId + "|" + region; String signature = HMACSHA256(data.getBytes(), token.getBytes()); String url = "https://console.huaweicloud.com/sve/share/page.html?id=" + pageId + "®ion=" + region + "&sve_signature=" + signature; return url; } //采用HmacSHA256进行签名并进行Base64转换 public static String HMACSHA256(byte[] data, byte[] key) { try { SecretKeySpec signingKey = new SecretKeySpec(key, "HmacSHA256"); Mac mac = Mac.getInstance("HmacSHA256"); mac.init(signingKey); return URLEncoder.encode(Base64.encodeBase64String(mac.doFinal(data))); } catch (NoSuchAlgorithmException e) { e.printStackTrace(); } catch (InvalidKeyException e) { e.printStackTrace(); } return null; } } 将转换后的字符串赋值给sveSignature,sveSignature参数拼接到大屏分享链接中获取新的访问链接。 例如,新的访问链接https://console.ulanqab.huawei.com/sve/preview.html?sveSignature=1OP99N6yxCDmEiH4aNMU1GAwtKspSg4fJ/zh0679k=®ion=cn-north-7#/screen/share/18cd21df7bc-WPgj_GqRc
  • 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,在“批量ECS操作”模块中单击“重装操作系统”,进入“重装操作系统”页面。 在“重装操作系统”页面,选择“添加实例”。 图1 重装展示操作页 选择“分批策略”。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 输入登录凭证。 登录凭证: 密码:用户可使用云服务器原密码或重新设置密码,请输入并牢记密码。 密钥对:用户可以选择 密钥对管理 中对应的密钥对。 创建后设置:用户在登录云服务器前,需要先通过重置密码的方式设置密码。 单击“提交”。 图2 重装展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确定执行 查看执行结果。 图4 查询执行结果
  • 补丁管理 补丁管理提供了用户能够管理ECS或CCE实例上补丁的能力。通过补丁管理能力,用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 在执行补丁管理操作之前,请确认执行机器操作系统为现补丁管理支持操作系统,机器上具备补丁管理依赖的二方包并且功能无损,否则可能会导致执行失败。 补丁管理现支持操作系统以及版本号表1。 补丁管理现依赖的环境见表2。 表1 补丁管理支持操作系统及版本 操作系统 产品 Huawei Cloud EulerOS Huawei Cloud EulerOS 1.1 Huawei Cloud EulerOS 2.0 CentOS CentOS 7.2 CentOS 7.3 CentOS 7.4 CentOS 7.5 CentOS 7.6 CentOS 7.7 CentOS 7.8 CentOS 7.9 CentOS 8.0 CentOS 8.1 CentOS 8.2 EulerOS EulerOS 2.2 EulerOS 2.5 EulerOS 2.8 EulerOS 2.9 EulerOS 2.10 表2 补丁管理依赖 依赖类型 依赖项 Python环境 Python(Python2或Python3) dnf软件包(Huawei Cloud EulerOS2.0、CentOS8.0及以上版本、EulerOS2.9及以上版本依赖) yum软件包(Huawei Cloud EulerOS1.1、CentOS8.0以下版本、EulerOS2.9以下版本依赖) lsb-release软件包 软件包管理工具 rpm 补丁基线 补丁扫描 补丁修复 补丁合规性报告详情摘要 补丁自动化操作 父主题: 资源运维
  • 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,在“批量ECS操作”模块中单击“批量开机”,进入“批量开机”页面。 在“批量开机”页面,单击“添加实例”。 图1 选择实例 选择“分批策略”。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 开机展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查询结果
  • 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,单击“补丁管理”,进入“补丁管理”页面。 选择“补丁扫描”页签,查看合规性报告列表。 图1 合规性报告列表 单击“创建扫描任务”。 图2 创建扫描任务 单击“添加实例”。 图3 选择实例 选择需要进行扫描的ECS或CCE实例。 图4 选择需要扫描的ECS实例 图5 选择需要扫描的CCE实例 设置分批策略。 分批策略: 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 图6 选择分批策略 设置熔断策略。 熔断阈值:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 图7 熔断策略 单击“提交”。 图8 单击提交后执行界面 确认执行信息,若无误则单击“确定”。 扫描工单执行完成后单击“合规性报告”按钮则可跳转到合规性报告页面,查看ECS实例合规性状态。 图9 扫描工单界面 图10 合规性报告界面
  • 查看定时任务 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“定时运维”,进入“定时运维”页面。 图20 查询列表 单击搜索框,弹出搜索条件列表;选择对应的搜索条件,输入对应的值,单击回车按钮即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 单击列表数据中对应任务名称,进入查看定时任务详情。 图21 查看定时任务详情 定时任务详情界面中,单击“执行脚本”或“作业ID”,右侧弹窗查看脚本或作业详情。 图22 查询详情 系统租户隔离,仅能查看租户账号或子账号创建的定时任务。
  • 审批定时运维 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“定时运维”,进入“定时运维”页面。选择“状态”列为待审批的数据,单击任务名称,进入“定时任务详情”页面。 图26 审批定时任务 单击右上角“审批”,弹出审批结果弹窗,选择审批结果,输入审批意见。单击“确定”,即可完成审批操作。 图27 审批定时任务 仅能审批“审批人”列为当前登录账号的数据。审批通过的定时任务才可以被启用。
  • 启用、禁用定时任务 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“定时运维”,进入“定时运维”页面。 单击列表“操作”列的“启用”、“禁用”,对定时任务进行启用或禁用。 图23 查看列表 1、用户仅能启用/禁用自己创建的定时任务。可查看当前租户账号下其他用户创建的定是任务。 2、任务启用后,开始生效,在后台创建定时调度,到达执行时间时开始执行。禁用后,在后台删除定时调度,不再执行。
  • 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面 选择“自定义作业”页签,单击“创建作业”,进入“创建作业”页面。 图2 单击创建作业 填写作业基本信息,包含作业名称,企业项目,描述和标签。可按照标签管理中的步骤创建标签,填写完成后单击“下一步”。 图3 填写作业基本信息 选择作业模板,如果没有合适的模板,选择“自定义”,单击“下一步”。 图4 选择作业模板 进行作业编排,作业编排由全局参数、作业步骤组成。 图5 作业编排 单击“+添加参数”,添加全局参数,配置后单击“完成”。 全局参数支持自定义、从参数仓库获取两种。选择自定义时需要自行填写参数名称、默认值和参数描述;从参数仓库获取时需要选择参数所在区域、参数名称和参数联动模式。 图6 选择自定义并添加全局参数 图7 从参数仓库获取并添加全局参数 表1 参数联动模式说明表 参数联动模式 说明 所有环境使用当前参数值 作业执行时使用该参数,参数值为创建作业添加参数时该参数基本信息中显示的参数值 使用对应环境最新参数值 作业执行时使用该参数,参数值为实时从参数仓库中获取的最新参数值 单击,在步骤间添加新步骤。 图8 新增步骤 单击步骤名称或者,可以修改步骤名称。 图9 修改步骤名称 对于已添加的作业步骤,单击,删除不需要的步骤。 图10 删除步骤 单击“+添加任务”,为步骤添加任务。任务添加完成后,单击“完成”。所有任务添加完成后,单击“确定”。 图11 添加任务 单击“+操作类型”,设置当前任务的操作类型,操作类型分为云服务API、控制、自定义脚本三种。 云服务API:包含ECS相关操作原子、执行API和等待API调用结果。ECS操作详见:ECS操作。 控制:包含审批、暂停和睡眠。 自定义脚本:支持选择自定义脚本类型和执行命令。自定义脚本创建后,会自动注册一条自定义原子记录。 图12 选择操作类型 根据选择的操作类型,填写名称、操作描述等基本信息,参数信息和异常处理策略,填写完成后单击“完成”。 图13 填写基本信息 图14 填写输入 图15 填写异常处理 作业编排完成后,根据操作风险,确定作业的风险等级,选择“排班”和“通知渠道”后,单击“提交”。 设置作业入库人工审核策略,风险等级为“高”的作业默认开启人工审批。 在“审核人配置”行选择“排班”,则指定当前排班中的用户为审批人;选择“个人”,则指定某些用户为审批人。 选择“通知渠道”,审核请求将通过指定渠道通知到审核人。 图16 更多配置
  • 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,单击“补丁管理”,进入“补丁管理”页面。 选择“补丁基线”页签,查看基线列表。 图1 补丁基线列表 单击“创建补丁基线”。 图2 创建补丁基线 根据界面提示,填写补丁基线相关内容。 图3 填写补丁基线内容 操作系统安装规则填写参数说明见表1 自定义安装规则填写参数说明见表2 表1 操作系统安装规则 类型 可选项 说明 产品 Huawei Cloud EulerOS 全部 Huawei Cloud EulerOS1.1 Huawei Cloud EulerOS2.0 CentOS 全部 CentOS7.2 CentOS7.3 CentOS7.4 CentOS7.5 CentOS7.6 CentOS7.7 CentOS7.8 CentOS7.9 CentOS8.0 CentOS8.1 CentOS8.2 EulerOS 全部 EulerOS 2.2 EulerOS 2.5 EulerOS 2.8 EulerOS 2.9 EulerOS 2.10 选择补丁的产品属性,在补丁扫描修复时将会过滤出该产品的补丁。 分类 全部 Security Bugfix Enhancement Recommended Newpackage 选择补丁的分类属性,在补丁扫描修复时将会过滤出该分类的补丁。 严重性级别 全部 Critical Important Moderate Low None 选择补丁的严重性级别属性,在补丁扫描和修复时会过滤出该严重性级别的补丁。 自动批准 在指定的天数后批准补丁 批准指定日期之前发布的补丁 自动批准满足指定条件的补丁 指定天数 0-365 自动批准选择“在指定的天数后批准补丁”时必填, 指定日期 无 自动批准选择“批准指定日期之前发布的补丁”时必填 合规性级别 未指定 重大 高 中 低 提示 符合该补丁基线的补丁在合规性报告中展示的等级。 包括非安全更新 无 不勾选“包括非安全更新”,在补丁修复时不会进行有漏洞的补丁升级。 补丁例外 无 已批准的补丁以及已拒绝补丁支持以下格式: 完整的软件包名称,格式为:example-1.0.0-1.r1.hce2.x86_64 包含单个通配符的软件包名称,格式为:example-1.0.0*.x86_64 表2 自定义安装规则 类型 可选项 说明 产品 Huawei Cloud EulerOS 全部 Huawei Cloud EulerOS 1.1 Huawei Cloud EulerOS 2.0 CentOS 全部 CentOS 7.2 CentOS 7.3 CentOS 7.4 CentOS 7.5 CentOS 7.6 CentOS 7.7 CentOS 7.8 CentOS 7.9 CentOS 8.0 CentOS 8.1 CentOS 8.2 EulerOS 全部 EulerOS 2.2 EulerOS 2.5 EulerOS 2.8 EulerOS 2.9 EulerOS 2.10 选择补丁的产品属性,在补丁扫描修复时将会过滤出该产品的补丁。 合规性级别 未指定 重大 高 中 低 提示 符合该补丁基线的补丁在合规性报告中展示的等级。 基线补丁 无 用户自定义基线补丁的版本以及发行版号,补丁扫描安装时将会以用户自定义的基线补丁作为是否合规判断依据 单个基线最多允许上传1000条基线补丁。 补丁名称由字母、数字、下划线、中划线、点号、*号、加号组成,最长支持200字符。 第二列数据由版本号(字母、数字、下划线、点号、冒号)-发行版号(字母、数字、下划线、点号)组成,各支持最多50字符,由中划线隔开。 单击“提交”,创建自定义补丁基线。 图4 保存自定义补丁基线
  • 自动化执行参数示例说明 参数值、Region ID、和目标实例填写格式为${},需要通过该表达式解析对应的值,相关示例如下: 参考示例: 告警信息如下: { "alarmId": "al1696664837170EWbvx24kW", "alarmName": "alarm-4z39coctest1007", ...... "URL": "https://console.ulanqab.huawei.com/ces/?region=cn-north-7#/alarms/detail?alarmId=al16849986549022X5Vp4pxr", "additional": { "dimension": "instance_id:29d99a09-2d15-4ced-8723-6e94ae1c1472", ...... }, ...... } 1. 如果要获取当前告警信息里面的alarmId的值,表达式写成如下形式: ${currentAlarm.alarmId} 2. 如果要从additional.dimension字符串里面获取instance_id的uuid,表达式写成如下形式: ${string.substring(currentAlarm.additional.dimension, string.indexOf(currentAlarm.additional.dimension, 'instance_id:') + 12)} 或者 ${string.substring(currentAlarm.additional.dimension, 12)} 3. 如果要从URL字符串里面获取cn-north-7这个region ID,表达式写成如下形式: ${string.substring(currentAlarm.URL, string.indexOf(currentAlarm.URL, 'region=') + 7, string.indexOf(currentAlarm.URL, '#/alarms'))} 表达式里面的"currentAlarm."是个固定前缀,意思是从当前告警的数据里面获取。
  • 操作步骤 登录COC。 在“多云配置”页面中单击接入列表中对应云厂商的所在行“操作”列中的“编辑”。 图1 编辑账号 填写信息,具体信息可参考 表1 ,单击“确认”。 表1 编辑账号参数说明表 参数 说明 示例 账号名称 基本信息,账号名称,必填项 - Access Key ID 基本信息,Access Key ID,必填项 - 是否复用 Access Key Secret 基本信息,是否复用 Access Key Secret,必填项。 当选择“是”时,则复用最近一次保存的 Access Key Secret。 当选择“否”时,则需要填写新的 Access Key Secret 是 Access Key Secret 基本信息,Access Key Secret -
  • 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,单击“补丁管理”,进入“补丁管理”页面,选择“补丁扫描”页签。 图1 选择补丁管理 选择需要查看详情的补丁合规性报告,单击“摘要”。 状态说明: 已安装:补丁符合补丁基线,已经安装在ECS实例上,并且没有可用更新。 已安装非基线补丁:补丁未包含在补丁基线中,但已安装到ECS实例上。 已安装待重启:补丁已被修复,但需要重启ECS实例才可生效。 已拒绝:在补丁基线的补丁例外中被拒绝的补丁,该状态的补丁就算满足基线也不会被修复。 待修复:补丁符合基线,但补丁版本低于基线版本。 修复失败:补丁进行了修复操作,但是修复失败。 图2 补丁合规性报告摘要界面
  • 操作步骤 登录COC。 在左侧菜单栏选择“资源运维”,单击“自动化运维”,在“日常运维”模块选择“作业管理”,进入“作业管理”页面。 图1 进入作业管理页面 选择“公共作业”页签,单击“所有作业”,选择需要执行的公共作业,单击“执行”。 图2 选择并执行公共作业 填写执行基本信息,包含执行描述和标签。可按照标签管理中的步骤创建标签。 图3 填写执行基本信息 选择公共作业执行的“目标实例模式”,分为“所有步骤一致”和“每个步骤独立”两种。 表1 目标实例模式说明 目标 说明 所有步骤一致 所有步骤在所有目标实例执行 每个步骤独立 自定义配置,可选择指定步骤仅在指定目标实例执行 图4 选择所有步骤一致 图5 选择每个步骤独立 单击“+添加实例”,选择待执行实例的区域,根据实例名称、UniAgent状态等条件筛选并选中目标实例,单击“提交”。 图6 选择目标实例 选择“分批策略”: 自动分批:用户选择的待执行机器,会根据默认规则,分成多批。 手动分批:用户可以根据自身需要,将待执行的机器,分成若干批,控制机器所在的批次。 不分批:用户所有待执行的机器会全部在同一批次。 图7 选择分批策略 单击“提交”,执行公共作业,将跳转到作业工单详情页面。在工单详情页面查看作业和各批次的执行情况。 单击“强制结束”,将结束本次作业的所有执行任务。 单击“结束所有批次”,将结束当前步骤所有批次的执行任务。 图8 作业工单详情
  • PRR看板 PRR看板(生产就绪程度评审)中包含评审服务汇总、评估雷达分布、服务复盘、改进任务闭环情况。评审服务汇总体现投入生产前各个服务当前所处的评审阶段,以及通过情况。评估雷达中体现服务不满足的评审项分布。服务复盘和改进呈现对评审不满足项的整改情况。指标详情可查看表6。 图6 PRR看板 表6 PRR看板数据字典 模块 指标名称 数据来源 指标定义 计算规则 统计周期 度量单位 服务PRR评审汇总 评审服务总数 PRR评审 统计参与PRR评审的服务数量 选择时间范围内,所有参与PRR评审的服务数量; 天/月 个 服务PRR评审列表 PRR评审 统计参与PRR各个阶段的服务数量与通过情况 选择时间范围内,参与PRR各个阶段的所有服务数量与通过情况分布; 天/月 个 评估雷达分布图 评估雷达分布图 PRR评审 统计PRR不满足项的分布 选择时间范围内,各评审项中不满足的项目数量; 天/月 个 服务复盘 服务复盘列表 PRR评审 统计需要复盘的服务总数以及通过情况 选择时间范围内,需要复盘的服务总数以及复盘通过分布情况; 天/月 个 改进任务闭环情况 任务闭环统计 PRR评审 统计改进任务数量以及闭环情况 选择时间范围内,所有改进任务的数量以及闭环通过分布情况; 天/月 个 改进任务列表 PRR评审 统计各个维度的改进任务数量以及闭环情况 按照评审项目维度统计,各个维度的改进任务数量以及闭环分布情况; 天/月 个
  • 监控告警 监控告警包将告警信息以直观的图表形式展示,使运维人员快速掌握服务的整体状况,监控告警中含告警分析、告警成本、告警质量三个模块,体现告警管理核心指标。告警分析中提供告警总量、告警级别、Top10应用、告警降量和告警趋势等指标,运维主管可通过对历史告警数据的分析,了解服务告警的趋势和模式,发现潜在的性能问题或故障隐患。告警成本统计告警人力情况和自动化处理率,运维主管可以利用告警成本有效控制变更的人力成本。告警质量统计事件单和WarRoom的告警发现率,帮助运维主管评估当前告警的有效性,并及时进行告警配置的优化。指标详情可查看表4。 图4 监控告警 表4 监控告警数据字典 模块 指标名称 数据来源 指标定义 计算规则 统计周期 度量单位 告警分析 告警总量 告警管理 统计所有告警的数量 选择时间范围内,所有告警的数量 天/月 个 告警级别 告警管理 统计各个级别的告警的数量 选择时间范围内,各个级别的告警的数量 天/月 个 告警趋势 告警管理 选择时间范围内,各级别告警的数量趋势变化 选择时间范围内,各个级别的告警的数量 天/月 个 告警成本 告警参与人数 告警管理 统计参与处理告警的人数 去重计算集成告警的责任人数量 天/月 人 人均告警处理量 告警管理 统计人均处理的告警数量 选择时间范围内,告警总数量/告警参与人数 天/月 人 告警自动化处理率 告警管理 统计告警的自动化处理情况 选择时间范围内,自动化处理告警/告警总数*100% 天/月 百分比 告警质量 故障告警发现率 事件管理 统计所有事件单中,由告警发现的事件单数量 选择时间范围内,告警转事件单数量/事件单总数量*100% 天/月 百分比 WarRoom告警发现率 WarRoom 统计所有WarRoom中,由告警发现的WarRoom数量 选择时间范围内,告警转事件拉起的WarRoom数量/WarRoom 总数量*100% 天/月 百分比 告警冒泡 告警冒泡 告警管理 按照应用维度,展示告警的风险冒泡情况 按照应用下告警的级别和数量进行加权计算并排序 天/月 不涉及
  • SLO看板 SlO看板(服务级别目标)包含SLO总体达成情况、应用维度SLO统计、ErrorBudget管理。SLO总体达成情况可查看年度和月度的总体SLO情况,评估整体的服务水平趋势。应用维度SLO支持按照时间和应用维度查看SLO情况,评估每个应用的服务水平。ErrorBuget根据应用的SLO情况计算出错误成本,用以指导变更或其他高风险操作。指标详情可查看表5。 图5 SLO看板 表5 SLO看板数据字典 模块 指标名称 数据来源 指标定义 计算规则 统计周期 度量单位 SLO总体达成情况 年度SLO期望值 SLO管理 全年度应用期望达成的SLO指标 SLO期望值=SLO管理中设定的期望值; 多个应用SLO期望值=avg(SLO期望值); 年 百分比 年度SLO实际值 SLO管理 全年度应用实际达成的SLO情况 年度SLO实际值=1-(年度服务不可用时长/全年服务总时长)*100%; 单个区域多应用SLO实际值=avg(年度SLO实际值); 多个区域单应用SLO实际值=min(年度SLO实际值); 多个区域多应用SLO实际值=avg(多个区域单应用SLO实际值); 天/月 百分比 未达标应用数量 SLO管理 统计未达标SLO目标的应用数量 统计未达成SLO目标的应用数量,选择全部区域时,任一区域的年度SLO实际值<年度SLO期望值,视为未达标。 天/月 个 月度SLO期望值 SLO管理 月度服务期望达成的SLO指标 SLO期望值=SLO管理中设定的期望值; 多个应用SLO期望值=avg(SLO期望值); 天/月 百分比 月度SLO实际值 SLO管理 月度服务实际达成的SLO情况 月度SLO实际值=1-(月度服务不可用时长/月度服务总时长)*100%; 单个区域多应用SLO实际值=avg(月度SLO实际值); 多个区域单应用SLO实际值=min(月度SLO实际值); 多个区域多应用SLO实际值=avg(多个区域单应用SLO实际值); 天/月 百分比 应用维度SLO统计 应用SLO统计 SLO管理 统计应用维度的SLO情况 按照应用维度,展示月度SLO实际值。 月度SLO实际值=1-(月度服务不可用时长/月度服务总时长)*100%; 多个区域单应用SLO实际值=min(月度SLO实际值); 天/月 百分比 Error Budget Error Budget SLO管理 用于测量实际性能与预期性能之间的差异,用于计算错误成本 当SLO实际值>SLO期望值时: ErrorBudget=(年度SLO实际值-年度SLO期望值)*全年服务总时长(min); 当SLO实际值≤SLO期望值时,ErrorBudget=0。 天/月 分钟
  • 变更管理 变更管理包含数据概览、变更开销、变更风险三个模块,全方位呈现变更核心指标。数据概览中包含变更时长、成功率、自动化变更率等指标,通过环比和趋势图体现变更整体情况。变更风险根据变更等级、变更方式等分布图,分析变更导致的故障和变更成功率。变更开销统计变更人力和时间趋势,有效控制变更成本。指标详情可查看表2。 图2 变更管理 表2 变更管理数据字典 指标名称 数据来源 指标定义 计算规则 统计周期 度量单位 变更导致现网事件 变更管理 统计由于变更原因导致的现网各个级别的事件数量 选择时间范围内,各级别事件单类型为变更操作问题的数量 天/月 个 变更等级 变更管理 统计各个等级的变更单的数量 选择时间周期内,各个等级的变更单数量 天/月 个 变更方式 变更管理 统计各个方式(手动变更、自动化变更)的变更单数量 计算各个方式的变更单数量 天/月 个 变更总量 变更管理 统计的变更单的数量 选择时间周期内,已完成的变更单数量 天/月 个 变更成功率 变更管理 统计变更单的成功率情况 变更成功率=变更成功的变更单数量/已完成的变更单数量*100% 天/月 百分比 变更平均时长 变更管理 统计变更单的平均处理时长 选择时间周期内,已完成的变更单时长求和/已完成的变更单数量*100% 天/月 ddhhmm 自动化变更率 变更管理 所有变更单中,自动化变更的占比 自动化变更数量/所有变更单数量*100% 天/月 百分比 变更趋势 变更管理 变更成功和失败的数量以及变更成功率的趋势变化 变更成功和失败的数量以及变更成功率 天/月 个 变更人力 变更管理 统计参与变更所需要的人数 变更人力=变更配合人+变更实施人 天/月 人次 变更时间 变更管理 统计变更单的平均处理时长 选择时间周期内,已完成的变更单时长求和/已完成的变更单数量*100% 天/月 ddhhmm
  • 事件管理 事件管理包含事件统计、WarRoom、回溯改进三个模块,呈现事件管理全流程核心指标。事件统计中包含数量、闭环率、处理耗时、受损应用等指标,通过环比、趋势图和Top /Bottom排序的方式,呈现事件风险情况。WarRoom中包含受损应用、引起WarRoom事件级别和时间窗,反映重大故障场景的发生和改善情况。回溯改进中包含回溯改进的闭环率和趋势分析,确保对于已发生的故障进行经验沉淀,减少相同故障再次发生的频率和处理时间。指标详情可查看表3。 图3 事件管理 表3 事件管理数据字典 模块 指标名称 数据来源 指标定义 计算规则 统计周期 度量单位 事件统计 事件总量 事件管理 统计所有事件单数量 选择时间范围内,所有事件单的数量 天/月 个 事件级别 事件管理 统计各个类型和级别的事件单的数量 选择时间范围内,各个类型和级别的事件单的数量 天/月 个 事件闭环率 事件管理 统计事件单的闭环情况 选择时间范围内,闭环状态的事件单数量/事件单总量*100% 天/月 百分比 事件耗时 事件管理 统计事件单平均处理时长 已闭环事件单的处理时间求和/已闭环的事件单数量*100% 天/月 ddhhmm 受损应用 事件管理 统计事件单受损应用数量 去重计算事件单的受损应用数量(包含已删除应用) 天/月 个 WarRoom WarRoom数量 WarRoom 统计所有WarRoom数量 选择时间范围内,所有WarRoom数量 天/月 个 故障级别 事件管理 WarRoom关联的事件单级别分布 统计WarRomm关联的各级别事件单的数量 天/月 个 受损应用 WarRoom 统计warroom中受损应用的数量 去重计算WarRoom的受损应用数量 天/月 个 平均恢复时长 WarRoom 统计WarRoom平均恢复时长 选择时间范围内,已完成的WarRoom时间求和/已完成WarRoom数量 天/月 ddhhmm 受理时间窗分布 WarRoom 统计WarRoom在各个时间窗内的拉起次数 统计各个时间窗范围内,WarRoom的拉起次数 天/月 个 回溯改进 回溯总数 问题管理 所有的回溯单数量 统计时间周期内,所有的回溯单数量 天/月 个 回溯闭环率 问题管理 统计回溯单的闭环情况 闭环率=已闭环回溯单数量/回溯单总量*100% 天/月 百分比 改进总数 问题管理 所有的改进单数量 统计时间周期内,所有的改进单数量 天/月 个 改进闭环率 问题管理 统计改进单的闭环情况 闭环率=已闭环改进单数量/改进单总量*100% 天/月 百分比
  • 运维总览 运维总览包含总览数据、风险冒泡、PRR评审汇总(生产准备度评估)、TOP5事件四个模块。总览数据可以全局视角观测运维态势情况,辅助运维优化改进和洞察决策。风险冒泡通过P3+事件单、WarRoom、变更导致故障以及紧急告警呈现当前运维态势风险情况。PRR评审汇总体现应用上线/转商前的评审情况。通过算法统计影响最严重的Top5事件单,快速识别重大故障场景。指标详情可查看表1。 图1 运维总览 表1 运维总览数据字典 模块 指标名称 数据来源 指标定义 计算规则 统计周期 度量单位 总览数据 事件数量 事件中心 统计事件单的数量趋势 选择时间周期内,所有事件单的数量 天/月 个 告警数量 告警中心 统计告警的数量趋势 选择时间周期内,所有告警的数量 天/月 个 WarRoom数量 WarRoom 统计WarRoom的数量趋势 选择时间周期内,所有WarRoom的数量 天/月 个 监控发现率 告警中心 发生的事件单中,有相关告警的事件单占比 符合过滤条件有相关告警的事件数/符合过滤条件总的事件数 天/月 百分比 变更数量 变更管理 统计变更单的数量趋势 选择时间周期内,所有变更单的数量 天/月 个 服务SLO SLO管理 统计服务SLO实际值的变化趋势 SLO实际值 = 1 - (服务不可用时长 / 云服务总时长)*100% 天/月 百分比 风险冒泡 变更导致事件数 事件管理 统计变更问题引发事件单数量 事件类型为变更操作问题的事件单数量 天/月 个 7天紧急告警数 告警中心 统计近7天紧急告警数量 近7天的紧急告警数量 近7天 个 P3+事件 事件管理 统计发生的P3+事件单数量 P1、P2、P3级别的所有事件单的数量,包括未完成状态的事件单 天/月 个 Warroom数量 告警中心 统计Warroom数量 选择时间周期内,WarRoom的数量 天/月 个 PRR评审汇总 PRR评审服务 PRR评审 统计参与PRR评审的服务数量 参与PRR评审的服务数量 天/月 个 PPR评审通过情况 PRR评审 统计在PRR各阶段中,通过与未通过的服务数量 PRR各阶段,通过与未通过的服务数量 天/月 个 TOP5事件 TOP5事件 事件管理 统计严重性最高的事件Top5 根据选择时间范围,统计已完成的P3+事件,并先按事件级别排序,再按照中断时长排序,排列TOP5事件 天/月 事件信息
  • 人员管理概述 人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前租户下的用户,人员管理中的用户从 IAM 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个基础功能模块使用。 人员管理页面可以手动选择需要的用户进行添加与管理。 对已添加的用户在编辑时,若填写手机号、邮箱、企业微信、钉钉、飞书等通讯方式时系统后台会为其创建对应的订阅方式,以便于满足后续消息通知的需要。 在人员管理页面可通过用户信息字段颜色区分当前是否存在订阅,灰色:用户未订阅或订阅但未确认订阅;黑色:用户已订阅且已确认订阅。 父主题: 人员管理
  • 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,单击“补丁管理”,进入“补丁管理”页面,选择“补丁扫描”页签。 选择需要修复的实例,单击“修复”。 图1 选择需要修复的实例 设置分批策略。 分批策略: 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 图2 选择分批策略 设置熔断策略。 熔断阈值:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 图3 熔断策略 设置是否允许重启。 部分补丁需要重启生效,若选择否,则需要您择期安排重启 确认执行信息,若无误则单击“确定”。 图4 执行信息界面
  • 操作步骤 登录COC。 进入COC“总览”后,可以查看对应的资源信息。 图1 资源信息 打开全局视角,查看所有region的资源信息。 单击图标上的,查询对应资源类型的全部资源信息。 全局视角下,单击图标上的,查询不同region对应资源类型的全部资源信息。 图2 不同region下,资源列表 鼠标移动到含有告警的资源上,查看对应机器告警。 图3 告警信息 单击“查看更多”查看更多告警。 图4 更多告警信息 点击右上角“刷新”,同步资源与告警信息。
  • 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“脚本管理”,进入“脚本管理”页面,选择“公共脚本”页签,选择欲执行的脚本并单击“执行”。 图1 选择要执行的公共脚本 填写脚本执行相关信息。相关参数由公共脚本决定,用户无法修改。填入执行用户及执行超时时间,默认用户为root,超时时间为300秒。 脚本参数支持手动输入和参数仓库两种(清理磁盘暂不支持)。手动输入时需要用自行填写参数值;从参数中心选择时,需要选择参数所在区域、参数名称和参数联动模式。 图2 手动输入脚本参数 图3 参数仓库选择脚本参数 表1 参数联动模式说明表 参数联动模式 说明 使用对应环境最新参数值 脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值 单击“+添加实例”,选择脚本执行目标实例,可根据名称、弹性公网IP、资源状态等条件进行过滤。 图4 选择目标实例 选择“分批策略”。 自动分批:用户选择的待执行机器,会根据默认规则,分成多批。 手动分批:用户可以根据自身需要,将待执行的机器,分成若干批,控制机器所在的批次。 不分批:用户所有待执行的机器会全部在同一批次。 图5 选择分批策略 设置“熔断策略”。 熔断策略:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 图6 设置熔断阈值 单击“提交”执行脚本。 图7 “提交”按钮
  • 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“脚本管理”,进入“脚本管理”页面,选择“自定义脚本”页签,单击“创建脚本”。 图1 单击“创建脚本” 填写脚本基本信息,确认脚本风险等级,并选择脚本归属的企业项目。 图2 填写信息 填写脚本内容,可选择脚本类型为shell脚本、python脚本或者bat脚本,并对脚本内容进行高危命令校验。 图3 录入脚本内容 单击“校验高危命令”,可对脚本内容进行高危检测。 校验范围:检测涉及的高危命令范围,可点击“高危命令说明”查看校验的规则列表 校验规则:在校验范围内,通过正则匹配方式对脚本内容进行高危命令匹配 校验结果:通过正则校验结果返回脚本内容是否高危,即:低风险、高风险。 高危命令校验结果仅作为脚本风险等级的定级参考,工具不强制拦截脚本风险等级与高危命令校验结果一致性,请按实际业务影响进行评估。 图4 校验高危命令 填写脚本入参,可勾选“敏感参数”对参数进行加密。 图5 填写脚本入参 敏感参数:脱敏展示,存储时会加密存储。 入库人工审核,风险等级为“高”的脚本默认开启。 图6 选择审批人和通知审批人渠道 单击“提交”创建自定义脚本。 图7 点击“提交”
共100000条