华为云用户手册

  • 版本视图 制品仓库服务支持将软件包按照版本维度进行归类展示。在版本视图的列表中,提供按制品包名称和版本号进行过滤展示,提供按照更新时间对文件进行排序。 通过项目入口进入软件发布库页面。 用户需要为已上传的软件包编辑版本号(由编译构建归档的软件包发布版本默认为执行构建任务时设置的版本号)。 在页面左上方选择“版本视图”页签,页面展示已设置版本的软件包列表。 软件发布库将不同版本的同名软件包放在一个文件下。单击“文件名”,页面将显示该软件包最新版本的概览信息。 单击“版本数”,页面将展示对应软件包的版本列表。 单击“版本号”,页面将显示该软件包的概览信息和文件列表。在文件列表中,单击“文件名称”,页面将跳转到软件包所在的存储位置。 用户设置软件包的版本后,版本状态默认为“未发布”,可以修改版本状态。 在文件列表中,将文件的版本状态设置为“已发布”,该文件下最新版本的软件包会被设置为“已发布”。 单击“版本数”进入版本列表,可以分别将不同版本号的版本状态设置为“已发布”。 版本状态由“未发布”变为“已发布”,状态转换不可逆,请谨慎操作。已发布状态的文件不可修改、不可编辑(修改名称、修改版本号),只能下载或删除。 父主题: 软件发布库(新版)
  • 私有依赖库的覆盖策略 私有依赖库支持“允许覆盖”、“禁止覆盖”、“只读”三种版本策略,可以设置是否允许上传相同路径的制品并将原包覆盖。 进入私有依赖库,在左侧边栏中单击对应的仓库名称。 单击页面右侧“设置仓库”,显示仓库的基本信息,选择“覆盖策略”页签。 允许覆盖:允许上传相同路径的制品(默认选择),上传后将会覆盖原包。 禁止覆盖:禁止上传相同路径的制品。 只读:禁止上传、更新、删除制品。可以下载已上传的制品。 设置完成后,单击“确定”。
  • 管理Maven仓库与项目的关联 通过构建任务上传Maven组件到私有依赖库时,需要在构建步骤“Maven构建”中指定仓库路径。 不配置pom:依赖包不发布到私有依赖库中 配置所有pom:若使用mvn deploy命令会将依赖包发布到指定的release仓库和snapshot仓库中 将Maven格式仓库与项目关联后,该项目中的构建任务即可完成在构建步骤中选择该仓库。 进入私有依赖库,在左侧仓库列表中单击任一Maven格式仓库。 单击页面右侧“设置仓库”,选择“项目关联权限”。 在列表中找到待关联Maven仓库的项目,单击对应行中的图标。 根据需要在弹框中勾选仓库名称,单击“确定”。 当页面提示操作成功时,列表中对应项目的仓库关联数量将显示为与所勾选的仓库数量一致。
  • 概述 软件发布库是一种通用软件制品库,用来统一管理不同格式的软件制品。除了基本的存储功能,还提供构建部署工具集成、版本控制、访问权限控制、安全扫描等重要功能,是一种企业处理软件开发过程中产生的所有制品包类型的标准化方式。 软件发布库中的主要操作包括: 基础操作:包括上传、下载、编辑、搜索、删除软件包,新建、编辑、搜索、删除文件夹。 查看/编辑软件包详情:软件包详情包括展示基本信息的概览、构建元信息、构建包归档信息,其中文件夹名称、软件包名称、软件包状态和发布版本可编辑。 制品安全扫描:支持开源合规和漏洞检测,支持扫描结果按时间、扫描制品统计,支持扫描漏洞结果按危急、高危、中危、低危分类。 管理回收站:软件包被删除后会转移至回收站,可以将软件包还原至删除前的文件夹中、或者从回收站中彻底删除。 父主题: 软件发布库(新版)
  • 管理回收站 在私有依赖库中被删除的仓库与组件都会移到回收站,可以对删除后的组件进行管理。 进入私有依赖库。 单击“回收站”,页面右侧滑出“回收站”页面。 根据需要对列表中的仓库与组件进行删除或还原操作。 列表中,若操作列中有和,则表示此行是被删除的仓库;否则表示此行是被删除组件所在的仓库名称,单击仓库名称即可看到该仓库中被删除的组件。 可进行的操作如下: 操作类型 操作项 说明 还原 还原仓库 单击操作列的,可以还原对应仓库。 还原单个组件 进入待还原组件所在仓库,在列表中单击操作列,可以还原对应组件。 批量还原组件 进入待还原组件所在仓库,勾选多个组件,单击列表下方的“还原”,可以同时还原多个组件。 还原所有 单击页面右上方“还原所有”,可以一键还原回收站中的所有仓库与组件。 删除 删除仓库 单击操作列,可以删除对应仓库。 删除单个组件 进入待删除组件所在仓库,单击操作列,可以删除对应组件。 批量删除组件 进入待删除组件所在仓库,勾选多个组件,单击列表下方的“彻底删除”,可以同时删除多个组件。 清空回收站 单击页面右上方“清空回收站”,可以一键删除回收站中的所有仓库与组件。 回收站的所有删除操作都将彻底删除仓库与组件,无法重新找回,请慎重操作。 父主题: 私有依赖库(旧版)
  • 查看资源信息 登录AOM 2.0控制台。 在菜单栏选择“应用资源管理”,进入“应用资源管理”界面。 选择企业项目。 在左侧导航栏中选择“资源管理”,在右侧区域单击任一资源页签,即可在下方资源列表区域查看该资源所有实例的名称、项目、环境等信息。 在资源列表上方设置过滤条件,可实现资源列表过滤显示。 单击右上角的,可实时获取到所有资源实例的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义其展示/隐藏。 单击资源实例名称/ID,在该资源实例详情页面,可查看详细信息。在资源详情页面单击“更多”,可跳转至该服务Console界面查看更多信息。 用户购买该服务资源后,CMDB可实时感知获取该资源信息,并展示在资源管理页面。 资源类型相关信息,详见表1。 表1 资源类型 资源类型 子类型 信息 操作 云服务器ECS - - 名称/ID、内网IP、弹性公网IP、主机名称、可用区、区域、企业项目、应用环境、UniAgent状态、资源状态、镜像名称、VPC名称。 单击“名称/ID”列的某个资源名称,展示“主机详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 云容器引擎CCE - 工作负载 负载名称、命名空间、集群、负载类型、区域、应用环境、最近更新时间。 单击“负载名称”列的某个负载名称,展示“Workload实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 集群 集群名称、集群ID、区域。 - 数据库 关系型数据库RDS - 实例名称/ID、实例类型、数据库引擎版本、资源状态、内网IP、企业项目、区域、应用环境。 单击“名称/ID”列的某个ID,展示“RDS实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 文档数据库DDS - 名称/ID、资源状态、实例类型、版本、企业项目、区域、应用环境。 单击“名称/ID”列的某个ID,展示“DDS实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 数据复制服务DRS 实时同步任务 名称/ID、资源状态、资源类型、区域、企业项目、应用环境。 单击“名称/ID”列的某个ID,展示“DRS实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 实时迁移任务 实时灾备任务 数据订阅任务 备份迁移任务 云数据库GaussDB NoSQL - 名称/ID、实例类型、企业项目、区域、应用环境。 单击“名称/ID”列的某个ID,展示“GaussDB NoSQL实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 云数据库 GaussDB - 名称/ID、资源状态、类型、企业项目、区域、应用环境。 单击“名称/ID”列的某个ID,展示“GaussDB实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 网络 虚拟私有云VPC - 名称/ID、IPV4网段、状态、区域、企业项目、标签。 单击“名称/ID”列的某个ID,展示“VPC实例详情”。 弹性负载均衡器ELB - 名称/ID、资源状态、服务地址与所属网络、监听器、区域、企业项目、应用环境。 单击“名称/ID”列的某个ID,展示“ELB实例详情”。 单击“监听器”列的某个环境链接,跳转至“监听器”详细信息页面。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 弹性公网IP EIP - 弹性公网IP/ID、状态、带宽、带宽详情、已绑定实例、区域、企业项目、关联应用环境。 单击“名称/ID”列的某个ID,展示“EIP实例详情”。 单击“已绑定实例”列的某个实例名称,展示“主机详情”,包括属性和关联云服务。 单击“关联应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 NAT网关 - 名称/ID、状态、服务、资源类型、区域、企业项目。 单击“名称/ID”列的某个ID,展示“NAT网关实例详情”。 虚拟专用网络VPN VPN网关 名称/ID、资源类型、IPV4公网IP、状态、VPN连接数、区域、企业项目。 单击“名称/ID”列的某个ID,展示“VPN网关实例详情”。 VPN连接 名称/ID、资源类型、状态、远端网关、VPN网关、区域、企业项目。 单击“名称/ID”列的某个ID,展示“VPN连接实例详情”。 应用中间件 分布式缓存DCS - 名称/ID、资源状态、缓存类型、实例类型、规格(GB)、IP地址、区域、企业项目、应用环境。 单击“名称/ID”列的某个ID,展示“DCS实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 分布式消息DMS Kafka 名称/ID、规格、分区上限、区域、企业项目、应用环境。 单击“名称/ID”列的某个ID,展示“CBR实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 RabbitMQ 名称/ID、规格、区域、企业项目、应用环境。 单击“名称/ID”列的某个ID,展示“RabbitMQ实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 存储 对象存储服务OBS - 桶名称、区域、企业项目、应用环境。 单击“桶名称”列的某个“名称”,展示“OBS实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 云备份CBR - 名称/ID、资源状态、资源类型、计费模式、区域、企业项目、应用环境。 单击“名称/ID”列的某个ID,展示“DCS实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 云硬盘EVS - 名称/ID、状态、磁盘规格、磁盘属性、区域、企业项目。 单击“名称/ID”列的某个ID,展示“云硬盘EVS实例详情”。 弹性文件服务SFS - 名称/ID、状态、容量、共享路径、协议类型、区域、企业项目。 单击“名称/ID”列的某个ID,展示“SFS实例详情”。 函数工作流FunctionGraph - 函数 名称/ID、类型、区域、企业项目、应用环境。。 单击“名称/ID”列的某个ID,展示“FGS实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 大数据 云搜索服务CSS - 名称/ID、资源状态、资源类型、版本、企业项目、区域、应用环境。 单击“名称/ID”列的某个ID,展示“CSS实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。
  • 转移资源 关联资源后,当组件或环境信息变化,需要及时转移资源时,可将资源从原应用节点转移到目标应用的节点下 具体的操作如下: 登录AOM 2.0控制台。 在菜单栏选择“应用资源管理”,进入“应用资源管理”界面。 选择企业项目。 在左侧树节点选中待操作的环境,在右侧区域单击资源页签。 在资源列表中根据需要执行以下操作: 转移单个资源实例:单击对应资源实例“操作”列的“”。 转移多个资源实例:勾选对应资源实例前的复选框,单击页签底部的“”。 在“转移资源”对话框中设置转移的目标节点等信息,具体参数说明如表2所示。 表2 转移资源参数说明 参数 说明 选择节点 资源实例需要转移到的目标节点,请从下拉列表中选择。 转移方式 资源转移的方式,包含以下两种: 完全替换,不保留现有的环境(覆盖),该方式会将资源实例从原来的环境转移至目标环境,原环境下不再关联该资源实例。 增量更新,保留已有环境(更新),该方式会将资源实例再复制一份关联到目标环境,原环境和目标环境下均会关联该资源实例。 说明: 同应用之间支持完全替换和增量更新两种转移方式。 仅ECS跨应用转移不支持增量更新转移方式。 设置完成,单击“确认”。
  • 关联资源 登录AOM 2.0控制台。 在菜单栏选择“应用资源管理”,进入“应用资源管理”界面。 选择企业项目。 在左侧树节点选中待操作的环境,在右侧区域单击资源页签,在下方列表区域单击“关联资源”。 云容器引擎CCE不支持关联资源。 从资源列表中选择合适的资源实例。 在资源列表上方设置过滤条件,可实现资源列表过滤显示。 单击右上角的,可实时获取到所有资源实例的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义其展示/隐藏。 资源列表仅展示与应用企业项目相同的资源。 设置完成后,单击“关联”。 如果关联的资源为云服务器ECS资源,需要单击“关联资源&安装Agent”,在关联资源后继续完成Agent安装。安装Agent的详情操作请参见“安装UniAgent”。
  • 解绑资源 关联资源后,当组件或环境信息变化,不需要资源时,可将资源从原应用节点解除绑定。 具体的操作如下: 登录AOM 2.0控制台。 在菜单栏选择“应用资源管理”,进入“应用资源管理”界面。 选择企业项目。 在左侧树节点选中待操作的环境,在右侧区域单击资源页签。 在资源列表中根据需要执行以下操作: 解绑单个资源实例:单击对应资源实例“操作”列的“”。 解绑多个资源实例:勾选对应资源实例前的复选框,单击页签底部的“”。 解绑云资源与环境节点的关联关系,不会真正物理删除云服务。
  • 查看资源类型 登录AOM 2.0控制台。 在菜单栏选择“应用资源管理”,进入“应用资源管理”界面。 选择企业项目。 在左侧树节点选中待操作的环境,在右侧区域单击“资源类型”。各个资源类型信息,参见表1。 资源管理界面有资源则展示该资源,无资源则不展示。 应用管理界面涉及到绑定环境的资源都会展示。 表1 资源类型 资源类型 子类型 信息 云服务器ECS - - 名称/ID、内网IP、弹性公网IP、主机名称、可用区、区域、应用环境、UniAgent状态、资源状态、操作。 云容器引擎CCE - 工作负载 负载名称、命名空间、集群、负载类型、区域、应用环境、最近更新时间。 集群 集群名称、集群ID、区域。 数据库 关系型数据库RDS - 实例名称/ID、实例类型、数据库引擎版本、资源状态、内网IP、区域、应用环境、操作。 文档数据库DDS - 名称/ID、资源状态、实例类型、版本、企业项目、区域、应用环境、操作。 数据复制服务DRS 实时同步任务 名称/ID、资源状态、资源类型、企业项目、区域、应用环境、操作。 实时迁移任务 实时灾备任务 数据订阅任务 备份迁移任务 云数据库GaussDB NoSQL - 名称/ID、实例类型、企业项目、区域、应用环境、操作。 云数据库 GaussDB - 名称/ID、资源状态、类型、企业项目、区域、应用环境、操作。 网络 弹性负载均衡器ELB - 名称/ID、资源状态、服务地址与所属网络、监听器、区域、企业项目、应用环境、操作。 应用中间件 分布式缓存DCS - 名称/ID、资源状态、缓存类型、实例类型、规格(GB)、IP地址、区域、企业项目、应用环境、操作。 分布式消息DMS Kafka 名称/ID、规格、分区上限、区域、应用环境、操作。 RabbitMQ 名称/ID、规格、区域、应用环境、操作。 存储 对象存储服务OBS - 桶名称、区域、企业项目、区域、应用环境、操作。 云备份CBR - 名称/ID、资源状态、资源类型、计费模式、区域、企业项目、应用环境、操作。 函数工作流FunctionGraph - 函数 名称/ID、类型、区域、企业项目、应用环境、操作。 大数据 云搜索服务CSS - 名称/ID、资源状态、资源类型、版本、区域、企业项目、应用环境、操作。
  • 自动化运维自定义策略样例 示例:拒绝用户对服务卡片进行上下架操作 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予CMS FullAccess的系统策略,但不希望用户拥有CMS FullAccess中定义的卡片上下架权限,您可以创建一条拒绝上下架操作的自定义策略,然后同时将CMS FullAccess和拒绝策略授予用户,根据Deny优先原则,则用户可以对自动化运维执行除了卡片上下架外的所有操作。拒绝策略示例如下: { "Version": "1.1", "Statement": [ { "Effect": "Deny", "Action": [ "cms:toolmarket:update" ], } ]}
  • 添加环境 登录AOM 2.0控制台。 在菜单栏选择“应用资源管理”,进入“应用资源管理”界面。 选择企业项目。 在左侧树节点,将光标移至待操作的组件名称后,单击。 在“添加环境”页面中,设置环境类型、主机类型等信息。 表1 添加环境 参数名称 说明 环境类型 环境的类型。目前支持环境类型有四种:开发、测试、预发布和生产。 主机类型 主机的类型。目前支持的主机类型有:LINUX和WINDOWS。 环境名称 环境的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 区域 环境的区域,请从下拉列表中选择。 描述 环境的描述信息,最多可输入255个字符。 同一组件下最多可创建20个环境。 设置完成后,单击“确认”。
  • 更多操作 环境创建完成后,您还可以执行表2中的操作。 表2 相关操作 操作 说明 编辑 在左侧树节点选中待操作的环境,单击。 删除 在左侧树节点选中待操作的环境,单击。 关联资源 在左侧树节点选中待操作的环境,在右侧区域单击任一资源实例页签,在下方列表区域单击“关联资源”,具体操作请参见“关联资源”。 查看环境信息 在左侧树节点选中一个环境,在右侧区域单击“环境信息”页签。 查看操作记录 选中一个环境,在右侧区域单击“操作记录”页签,可查看近1小时、近3小时、近12小时、近24小时、近7天对该环境的操作记录。
  • 新增标签 登录AOM 2.0控制台。 在菜单栏选择“应用资源管理”,进入“应用资源管理”界面。 选择企业项目。 在左侧导航栏中选择“环境标签”。 在“新增标签”页面中,设置相关参数。 图1 新增标签 表1 新增标签参数表 参数名称 说明 标签名称 标签的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 描述 标签的描述信息,最多可输入255个字符。 关联节点 标签要关联的节点。 区域:资源支持的区域,请从下拉列表中选择或输入关键字搜索后选择。 节点:待关联的节点,直接从下面的应用树中选择需要的节点,或输入关键字搜索后选择。 设置完成后,单击“确认”。
  • 更多操作 节点创建完成后,您可以在应用树中执行表2中的操作。 表2 相关操作 操作 说明 添加子节点 将光标移至待操作的节点名称后,单击,添加子节点,具体操作请参见添加节点。 编辑节点 将光标移至待操作的节点名称后,单击,选择“编辑”。 删除节点 将光标移至待操作的节点名称后,单击,选择“删除”。 转移 将光标移至待操作的节点名称后,单击,选择“转移”,在弹出的页面中,选择目标节点,可转移节点。 添加环境 将光标移至待操作的子节点名称后,单击,添加环境,具体操作请参见添加环境。 查看节点信息 选中一个子应用或组件,在右侧区域单击“子应用信息”或“组件信息”页签。 查看操作记录 选中一个子应用或组件,在右侧区域单击“操作记录”页签,可查看近1小时、近3小时、近12小时、近24小时、近7天对该节点的操作记录。
  • 更多操作 应用创建完成后,您可以在应用树中执行表2中的操作。 表2 相关操作 操作 说明 添加节点 将光标移至待操作的应用名称后,单击,根据需要添加节点,具体操作请参见添加节点。 编辑应用 将光标移至待操作的应用名称后,单击,选择“编辑”。 删除应用 将光标移至待操作的应用名称后,单击,选择“删除”。 搜索应用信息 在“应用管理”页面的左侧区域,可以按企业项目、应用、区域、标签、关键字等搜索并展示需要的应用。 查看应用信息 选中一个应用,在右侧区域单击“应用信息”页签。 查看操作记录 选中一个应用,在右侧区域单击“操作记录”页签,可查看近1小时、近3小时、近12小时、近24小时、近7天对该应用的操作记录。
  • AOM自定义策略样例 示例1:授权用户创建告警规则的权限 { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "aom:alarmRule:create" ] } ]} 示例2:拒绝用户删除应用发现规则 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予AOM FullAccess的系统策略,但不希望用户拥有AOM FullAccess中定义的删除应用发现规则权限,您可以创建一条拒绝删除应用发现规则的自定义策略,然后同时将AOM FullAccess和拒绝策略授予用户,根据Deny优先原则,则用户可以对AOM执行除了删除应用发现规则外的所有操作。拒绝策略示例如下: { "Version": "1.1", "Statement": [ { "Effect": "Deny", "Action": [ "aom:discoveryRule:delete" ] } ]} 示例3:多个授权项策略 一个自定义策略中可以包含多个授权项,且除了可以包含本服务的授权项外,还可以包含其他服务的授权项,可以包含的其他服务必须跟本服务同属性,即都是项目级服务。多个授权语句策略描述如下: { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "aom:*:list", "aom:*:get", "apm:*:list", "apm:*:get" ] }, { "Effect": "Allow", "Action": [ "cce:cluster:get", "cce:cluster:list", "cce:node:get", "cce:node:list" ] } ]}
  • 功能说明 表1 功能说明 类别 说明 总览 以应用视角和容器视角提供常用服务或功能快速入口,实时监控并展示重点资源或应用数据。 应用资源管理 作为AOM的应用资源管理中心,打破传统ITIL流程中面向基础资源各服务、应用各自为政、互相割裂的方式,将所有华为云上的资源对象与应用统一管理,并设置关联,为AOM上层运维场景服务提供准确、及时、一致的资源配置数据。 监控中心 作为AOM的一站式监控平台,提供从资源数据发现、资源数据展示到数据异常告警的全方位、可视化监控服务,可应用于ECS、RDS、CCE等云产品的可观测性分析。 自动化运维 作为AOM的自动化运维平台,提供从运维任务创建、触发到审批的端到端自动化运维服务,可应用于ECS、RDS、CCE等云产品的运维管理。 采集管理 作为AOM的采集管理平台,完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent自身不提供数据采集能力,运维数据由不同的插件分工采集。
  • 基本概念 CMDB用于组织应用结构信息以及相关配置信息,主要概念如下: 企业项目: 华为云企业项目,一个项目可以包含一个或者多个应用。 应用管理:管理资源对象与应用之间的关系。CMDB层次结构遵循1(应用)+N(子应用)+1(组件/微服务)+1(环境)的应用管理模型。 应用:应用资源管理的基础对象,资源管理模型的根节点。一个应用代表一个逻辑单元,可以理解为项目、产品、业务。应用创建后,每个region都可以看到相同的应用拓扑信息。 子应用:应用管理的可选节点,同一个应用下,最多可创建三层子应用。子应用可以理解为服务,对组件/微服务的归组分类。 组件:构成应用的最小单元,可以理解为应用程序或者应用依赖的一个中间件云服务组件,例如RDS,DMS。组件一般跟下面的环境一起组合使用,一个组件可以包含一个或者多个环境。比如一个订单的应用程序,包含功能测试环境,压力测试环境,预发环境以及现网环境等。 环境:一个组件或者程序,由于部署不同的配置参数,形成多个环境。每个环境都有region属性,可以通过region信息实现环境的过滤,也可以在创建环境时打上一个或多个标签,通过标签进行环境过滤。例如按照环境类型区分包括:正式、测试。按照区域区分包括:华东、华南。按照DevOps流水线阶段区分包括:alpha,beta,gamma,product。 环境标签:环境标签是为环境设置的一个属性,多个环境可能具有相同的的标签,通过标签可过滤显示需要的环境。同一个标签只能添加在本应用下的不同环境,不能跨应用添加。 资源绑定:将资源对象与应用下的环境建立关联关系,在同一个应用下资源对象实例可属于多个环境。 资源解绑:关联资源后,当组件或环境信息变化,不需要资源时,可将资源从原应用节点解除绑定。 资源转移:关联资源后,当组件或环境信息变化,需要及时转移资源时,可将资源从原应用节点转移到目标应用的节点下。
  • 操作步骤 登录AOM 2.0控制台。 在菜单栏选择“采集管理”,进入“采集管理”界面。 在左侧导航栏中,选择“采集任务”,单击“新增采集任务”。 在新增采集任务页面中,配置相关参数信息。 表1 采集任务参数配置表 操作 参数 说明 运行实例 Prometheus实例 用于存储采集数据。采集任务通过关联Prometheus实例,对采集数据进行标记分类。 插件配置 操作系统 主机的操作系统,支持Linux和Windows。 采集插件 单击“添加采集插件”按钮,选择中间件插件或已创建的自定义插件。 说明: 当操作系统为Linux时,选择中间件插件或自定义插件。 当操作系统为Windows时,只能选择自定义插件。 插件版本 选择插件的版本。 说明: 未上线的插件版本,则置灰,无法选择。 主机 单击“添加主机”,选择主机。添加主机有两种方式指定主机和按CMDB。 指定主机:选择已接入的主机。 在指定主机页面,可通过主机名称、IP地址和Agent状态搜索选择主机。 在指定主机页面,可通过右上角,取消已勾选的主机。 选择的主机必须是UniAgent状态为运行中的主机,否则创建的采集任务无法采集数据。 按CMDB:选择应用资源管理(简称CMDB)环境下的主机。 在按CMDB添加主机页面,可通过主机名称、ID、主机IP、弹性公网IP和状态搜索主机。 在按CMDB添加主机页面,勾选“应用到所有”前的,可以选择当前环境中所有主机。 在按CMDB添加主机页面,可通过右上角,取消已勾选的主机。 选择的主机必须是UniAgent状态为运行中的主机,否则创建的采集任务无法采集数据。 说明: 当采集插件为自定义插件时,可选择多个主机;当采集插件为中间件插件时,只能选择一个主机。 Exporter地址/REDIS_Exporter地址/MySQL_Exporter地址 安装Exporter/REDIS_Exporter/MySQL_Exporter的主机IP地址和端口号。格式为IP:Port,例如:127.0.0.1:9104。 当“采集插件”选择“中间件”时,需要填写此项。 中间件地址/REDIS 地址/MySQL 地址 Exporter/REDIS_Exporter/MySQL_Exporter启动实例监控的主机/REDIS/MySQL,通常填写主机/MySQL/REDIS的IP地址。 当“采集插件”选择“中间件”时,需要填写此项。 指标 待采集的指标。默认为:''(单引号)表示输出原本的所有指标。如果需对采集指标进行过滤,则按如下格式进行填写,例如:'metric1, metric2'。 当“采集插件”选择“中间件”时,需要填写此项。 标签 新增采集指标维度。输入标签值和标签名,单击“添加标签”,字符长度不超过20个字符。最多可添加10个标签。例如:标签值为label1,标签名为label2,则添加成功后为label1:'label2'。 当“采集插件”选择“中间件”时,需要填写此项。 插件采集任务 采集任务名 采集任务的名称。不能超过50个字符。 高级设置 包括采集周期和超时时间。 采集周期:采集数据的周期,单位为秒(s),默认为60s,可选择10s、30s和60s。 超时时间:执行采集任务的时间,单位为秒(s),默认为60s,可选择10s、30s和60s。 说明: 超时时间必须小于等于采集周期。 执行用户:执行采集任务的用户,即所选主机的用户,默认为nobody。您可以根据主机用户,填写执行采集任务的用户,推荐填写nobody。 完成后,单击“立即创建”。
  • 更多告警模板操作 告警模板创建完成后,您还可以执行表5中的操作。 表5 相关操作 操作 说明 查看告警模板 在模板列表中,可查看模板规则集名称、规则数、关联集群、企业项目等信息。 为告警模板关联集群 单击“操作”列的。 修改告警模板 单击“操作”列的,并选择“编辑”。 复制告警模板 单击“操作”列的。 删除告警模板 删除一个告警模板:单击“操作”列的,并选择“删除”。 删除一个或多个告警模板:选中一个或多个告警模板前的复选框,在弹出框单击“删除”。 搜索告警模板 在右上角的搜索框中输入模板名称关键字,单击后显示匹配对象。
  • 操作步骤 登录AOM 2.0控制台。 在菜单栏选择“监控中心”,进入“监控中心”界面。 在左侧导航栏选择“Prometheus监控”,在实例列表中查看已创建的Prometheus实例,并可根据需要执行以下操作,具体请参见表1。 表1 相关操作 操作 说明 查看Prometheus实例 Prometheus实例列表中实时展示实例名、实例类型、企业类型、创建时间等信息。 单击实例名称,进入实例详情的“设置”页面,查看实例的基本信息和调用凭证等相关信息。 调用凭证的APP密钥信息默认隐藏,单击可将该密钥信息在当前凭证页面中展示。或显示的是APP密钥信息的实时状态。 在Prometheus配置代码右侧单击,可以复制该代码到对应文件。 搜索Prometheus实例 输入实例名称,单击,快速搜索待监控的Prometheus实例。 删除Prometheus实例 选择待删除的Prometheus实例,在“操作”列中单击。
  • 创建CCE Prometheus实例 登录AOM 2.0控制台。 在菜单栏选择“监控中心”,进入“监控中心”界面。 在左侧导航栏选择“Prometheus监控”,然后在右侧区域单击“创建Prometheus实例”。 设置实例名称、企业项目,选择“Prometheus for CCE”,单击“确定”。 图1 创建CCE实例 表1 创建Prometheus实例 参数名称 说明 实例名称 Prometheus实例的名称。 只能由中文、字母、数字、下划线、中划线组成,且不能以下划线或中划线开头和结尾,最多不能超过100个字符。 企业项目 所属的企业项目。 如果在全局页面设置为“全部企业项目”,请从下拉列表中选择。 如果在全局页面已选择企业项目,则此处灰化不可选。 实例类型 Prometheus实例的类型,选择创建Prometheus for CCE实例类型。
  • Prometheus监控实例类型 AOM提供多种Prometheus监控的实例类型,针对不同的场景可以选择创建对应的Prometheus监控实例类型。 表1 Prometheus类型说明 Prometheus类型 说明 default 该类型为系统实例,不允许删除。 Prometheus for 云服务 该类型适合监控云服务的多种指标。 Prometheus for CCE 该类型适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。默认提供对容器服务CCE集群的监控集成,也可通过接入中心添加容器服务集群中的各种组件的监控。创建CCE类型实例后,在集成中心一键安装Prometheus插件,实现对CCE集群的监控。 Prometheus for Remote Write 该类型适合已经自建了Prometheus Server,但需要通过远端存储(Remote Write)方式来解决Prometheus存储的可用性和可扩展性场景。 Prometheus for 多帐号聚合实例 该类型实例提供对同一组织下多个成员帐号的云服务指标监控(前提条件:成员帐号均已接入云服务指标)。
  • 创建Remote Write Prometheus实例 登录AOM 2.0控制台。 在菜单栏选择“监控中心”,进入“监控中心”界面。 在左侧导航栏选择“Prometheus监控”,然后在右侧区域单击“创建Prometheus实例”。 设置实例名称、企业项目,选择“Prometheus for Remote Write”,单击“确定”。 图1 创建Remote Write实例 表1 创建Prometheus实例 参数名称 说明 实例名称 Prometheus实例的名称。 只能由中文、字母、数字、下划线、中划线组成,且不能以下划线或中划线开头和结尾,最多不能超过100个字符。 企业项目 所属的企业项目。 如果在全局页面设置为“全部企业项目”,请从下拉列表中选择。 如果在全局页面已选择企业项目,则此处灰化不可选。 实例类型 Prometheus实例的类型,选择创建Prometheus for Remote Write实例类型。
  • 创建多帐号聚合Prometheus实例 登录AOM 2.0控制台。 在菜单栏选择“监控中心”,进入“监控中心”界面。 在左侧导航栏选择“Prometheus监控”,然后在右侧区域单击“创建Prometheus实例”。 设置实例名称、企业项目,选择“Prometheus for 多帐号聚合实例”,单击“确定”。 图1 创建多帐号聚合实例 表1 创建Prometheus实例 参数名称 说明 实例名称 Prometheus实例的名称。 只能由中文、字母、数字、下划线、中划线组成,且不能以下划线或中划线开头和结尾,最多不能超过100个字符。 企业项目 所属的企业项目。 如果在全局页面设置为“全部企业项目”,请从下拉列表中选择。 如果在全局页面已选择企业项目,则此处灰化不可选。 实例类型 Prometheus实例的类型,选择创建Prometheus for 多帐号聚合实例类型。
  • 创建云服务Prometheus实例 登录AOM 2.0控制台。 在菜单栏选择“监控中心”,进入“监控中心”界面。 在左侧导航栏选择“Prometheus监控”,然后在右侧区域单击“创建Prometheus实例”。 设置实例名称、企业项目,选择“Prometheus for 云服务”,单击“确定”。 图1 创建云服务实例 表1 创建Prometheus实例 参数名称 说明 实例名称 Prometheus实例的名称。 只能由中文、字母、数字、下划线、中划线组成,且不能以下划线或中划线开头和结尾,最多不能超过100个字符。 企业项目 所属的企业项目。 如果在全局页面设置为“全部企业项目”,请从下拉列表中选择。 如果在全局页面已选择企业项目,则此处灰化不可选。 实例类型 Prometheus实例的类型,选择创建Prometheus for 云服务实例类型。
  • 时间范围和统计周期的关系 AOM约束单个指标单次查询最大返回1440个数据点,因此统计周期与时间范围的关系如下所示: 最大可查询时间范围=统计周期×1440 当您选中的查询时间范围小于等于最大可查询时间范围时,所有满足以上条件的统计周期可以被选择。例如,查询1小时的指标时,可选的统计周期为1分钟和5分钟。 以“仪表盘”页面为例,时间范围与统计周期的关系如下表所示。 表1 时间范围和统计周期关系表 时间范围 统计周期 近30分钟 1分钟、5分钟 近1小时 近6小时 1分钟、5分钟、15分钟、1小时 近1天 近1周 1小时 自定义时间段 父主题: 相关说明
  • 普罗语句查询举例说明 示例一:集群下指定pod占所在节点(不含控制节点)的内存使用率 定义变量: pod中容器内存实际占用量(同一个Pod下可能会有多个容器/实例):aom_container_memory_used_megabytes node内存实际总量:aom_node_memory_total_megabytes 查询逻辑: 针对指标aom_container_memory_used_megabytes,使用聚合函数sum,按照nodeIP和podID进行指定node下指定pod当前的内存实际占用量计算。 针对指标aom_node_memory_total_megabytes,使用聚合函数sum,按照nodeIP计算出指定node的内存总量。 两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同) 将上述两者获得的指标值进行“/”运算,即可获得pod的内存实际使用率。 pod的内存实际使用率的普罗语句如下所示: sum(aom_container_memory_used_megabytes{podID="****1461-41d8-****-bfeb-fc1213****",nodeIP="***.***.***.***"}) by (nodeIP) / sum(aom_node_memory_total_megabytes{nodeIP="***.***.***.***"}) by (nodeIP) 示例二:集群下指定pod占所在节点(不含控制节点)的cpu使用率 定义变量: pod中容器的cpu实际使用量:aom_container_cpu_used_core node的cpu实际总量:aom_node_cpu_limit_core 查询逻辑: 针对指标aom_container_cpu_used_core,使用聚合函数sum,按照nodeIP和podID计算指定node下指定pod当前使用的cpu使用率。 针对指标aom_node_cpu_limit_core,使用聚合函数sum,按照nodeIP计算出指定node的cpu总量。 两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同) 将上述两者获得的指标值进行“/”运算,即可获得pod的内存实际使用率。 pod的cpu实际使用率的promQL如下所示: sum(aom_container_cpu_used_core{nodeIP="***.***.***.***",podID="****1461-41d8-****-bfeb-***13******"}) by (nodeIP) / sum(aom_node_cpu_limit_core{nodeIP="***.***.***.***"}) by (nodeIP) 示例三:集群下运行的Pod内存配额申请值 / 集群下该Pod所在节点的内存可分配量 定义变量: pod中给容器分配的内存总量:aom_container_memory_request_megabytes node内存实际总量:aom_node_memory_total_megabytes 查询逻辑: 针对指标aom_container_memory_request_megabytes,使用聚合函数sum,按照nodeIP和podID计算指定node下指定pod当前被分配的内存总量。 针对指标aom_node_memory_total_megabytes,使用聚合函数sum,按照nodeIP计算出指定node的内存总量。 两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同) 将上述两者获得的指标值进行“/”运算,即可获得pod的内存实际分配率。 pod的内存实际分配率的promQL如下所示: sum(aom_container_memory_request_megabytes{podID="****1461-41d8-4403-****-f***35*****",nodeIP="***.***.***.***"}) by (nodeIP) / sum(aom_node_memory_total_megabytes{nodeIP="***.***.***.***"}) by (nodeIP) 示例四:集群下运行的Pod的cpu配额申请值 / 集群下该Pod所在节点的cpu可分配量 定义变量: pod中容器的cpu实际分配总量:aom_container_cpu_limit_core node的cpu实际分配总量:aom_node_cpu_limit_core 查询逻辑: 针对指标aom_container_cpu_limit_core,使用聚合函数sum,按照nodeIP和podID计算指定node下指定pod当前使用的cpu分配量。 针对指标aom_node_cpu_limit_core,使用聚合函数sum,按照nodeIP计算出指定node的cpu总量。 两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同) 将上述两者获得的指标值进行“/”运算,即可获得pod的cpu实际分配率。 pod的cpu实际分配率的promQL如下所示: sum(aom_container_cpu_limit_core{podID="*****461-41d8-****-bfeb-****135*****",nodeIP="***.***.***.***"}) by (nodeIP) / sum(aom_node_cpu_limit_core{nodeIP="***.***.***.***"}) by (nodeIP)
  • 常用的普罗命令 常用的查询指标的普罗命令如表1所示,用户可根据实际修改其中的IP地址、ID等参数信息。 表1 常用的普罗命令 指标 标签定义 PromQL 主机CPU使用率 {nodeIP="",hostID=""} aom_node_cpu_usage{nodeIP="192.168.57.93",hostID="ca76b63f-dbf8-4b60-9c71-7b9f13f5ad61"} 主机应用请求吞吐量 {aomApplicationID="",aomApplicationName=""} http_requests_throughput{aomApplicationID="06dc9f3b0d8cb867453ecd273416ce2a",aomApplicationName="root"} 主机应用请求成功率 {appName="",serviceID="",clusterId=""} http_requests_success_rate{aomApplicationID="06dc9f3b0d8cb867453ecd273416ce2a",aomApplicationName="root" 主机组件CPU使用率 {appName="",serviceID="",clusterId=""} aom_process_cpu_usage{appName="icagent",serviceID="2d29673a69cd82fabe345be5f0f7dc5f",clusterId="00000000-0000-0000-0000-00000000"} 主机进程线程数 {processCmd=""}{processID=""}{processName=""} aom_process_thread_count{processCmd="cdbc06c2c05b58d598e9430fa133aff7_b14ee84c-2b78-4f71-9ecc-2d06e053172c_ca4d29a846e9ad46a187ade88048825e",processName="icwatchdog"} 集群磁盘使用率 {clusterId="",clusterName=""} aom_cluster_disk_usage{clusterId="4ba8008c-b93c-11ec-894a-0255ac101afc",clusterName="servicestage-test"} 集群虚拟内存使用率 {clusterId="",clusterName=""} aom_node_virtual_memory_usage{nodeIP="192.168.10.4",clusterId="af3cc895-bc5b-11ec-a642-0255ac101a0b",nameSpace="default"} 集群可用虚拟内存 {clusterId="",clusterName=""} aom_cluster_virtual_memory_free_megabytes{clusterId="4ba8008c-b93c-11ec-894a-0255ac101afc",clusterName="servicestage-test"} 工作负载文件系统使用率 {appName="",serviceID="",clusterId="",nameSpace=""} aom_container_filesystem_usage{appName="icagent",serviceID="cfebc2222b1ce1e29ad827628325400e",clusterId="af3cc895-bc5b-11ec-a642-0255ac101a0b",nameSpace="kube-system"} POD内核占用 {podID="",podName=""} aom_container_cpu_used_core{podID="573663db-4f09-4f30-a432-7f11bdb8fb2e",podName="icagent-bkm6q"} 容器上行Bps {containerID="",containerName=""} aom_container_network_transmit_bytes{containerID="16bf66e9b62c08493ef58ff2b7056aae5d41496d5a2e4bac908c268518eb2cbc",containerName="coredns"}
共100000条