华为云用户手册

  • 创建rf_admin_trust委托(可选) 进入华为云官网,打开控制台管理界面,鼠标移动至个人帐号处,打开“统一身份认证”菜单。 图1 控制台管理界面 图2 统一身份认证菜单 进入“委托”菜单,搜索“rf_admin_trust”委托。 图3 委托列表 如果委托存在,则不用执行接下来的创建委托的步骤 如果委托不存在时执行接下来的步骤创建委托 单击步骤2界面中的“创建委托”按钮,在委托名称中输入“rf_admin_trust”,委托类型选择“云服务”,输入“RFS”,单击“下一步”。 图4 创建委托 在搜索框中输入“Tenant Administrator”权限,并勾选搜索结果,单击“下一步”。 图5 选择策略 选择“所有资源”,并单击“下一步“完成配置。 图6 设置授权范围 “委托”列表中出现“rf_admin_trust”委托则创建成功。 图7 委托列表
  • 快速部署 本章节主要帮助用户快速部署该解决方案。 表1 参数填写说明 参数名称 类型 是否必填 参数解释 默认值 source_db_name String 必填 源数据库RDS(for mysql)名称,取值范围:4~64个字符之间,必须以字母开头,区分大小写,可以包含字母、数字、中划线或者下划线,不能包含其他的特殊字符。 空 source_db_ip Number 必填 源数据库的访问地址,IP地址或者域名。 空 source_db_port String 必填 源数据库的访问端口,取值范围为:1024-65535(其中12017和33071被RDS系统占用不可设置)。 3306 source_db_password String 必填 源数据库RDS(for MySQL)管理员密码。管理员账户名默认root。取值范围:8~32个字符,至少包含以下字符中的三种:大写字母、小写字母、数字和特殊字符~!@#%^*_-=+?,()&$。 空 vpc_name String 必填 目标数据库虚拟私有云(VPC)名称,该模板使用新建VPC,不允许重名。取值范围:1-50个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。 rapid-creating-of-rds-clone-instance-demo secgroup_name String 必填 目标数据库安全组名称,该模板新建安全组,安全组规则请参考部署指南进行配置。取值范围:1-64个字符,支持数字、字母、中文、_(下划线)、-(中划线)、.(点)。 rapid-creating-of-rds-clone-instance-demo destination_db_name String 必填 目标数据库RDS(for mysql)名称,取值范围:4~64个字符之间,必须以字母开头,区分大小写,可以包含字母、数字、中划线或者下划线,不能包含其他的特殊字符。 rapid-creating-of-rds-clone-instance-demo destination_db_password String 必填 目标数据库RDS(for MySQL)管理员密码,创建完成后,请参考云数据库RDS(for MySQL)重置密码。管理员账户名默认root。取值范围:8~32个字符,至少包含以下字符中的三种:大写字母、小写字母、数字和特殊字符~!@#%^*_-=+?,()&$。 空 drs_name String 必填 数据复制服务DRS任务名称,取值范围:4-50位,必须以字母开头,可以包含字母、数字、中划线或下划线,不能包含其他特殊字符。 rapid-creating-of-rds-clone-instance-demo 登录华为云解决方案实践,选择“快速创建云数据库RDS克隆实例”解决方案,单击“一键部署”,跳转至解决方案创建堆栈界面。 图1 解决方案实施库 在选择模板界面中,单击“下一步”。 图2 选择模板 在配置参数页面中,参考表1完成自定义参数填写,单击“下一步”。 图3 配置参数 在资源栈设置页面中,权限委托选择“rf_admin_trust”(可选),单击“下一步”。 图4 资源栈设置 在配置确认页面中,单击“创建执行计划”。 图5 配置确认 在弹出的创建执行计划框中,自定义填写执行计划名称,单击“确认”。 图6 创建执行计划 图7 执行计划创建成功 单击“执行”,弹出执行计划提示信息,单击“执行”确认执行。 图8 执行计划确认 等待解决方案自动部署。部署成功后,单击“事件”,回显结果如下: 图9 资源创建成功 父主题: 实施步骤
  • 应用场景 该解决方案可以帮助用户快速实现云日志服务 LTS和弹性负载均衡 ELB对接,通过云日志服务 LTS采集弹性负载均衡 ELB日志,实现网站运维的日常分析。弹性负载均衡 ELB在外部流量分发时,会记HTTP(S)详细的访问日志记录,如URI请求、客户端IP和端口、状态码。弹性负载均衡 ELB日志可用于审计,也可用于通过时间和日志中的关键词信息搜索日志,同时也可以通过各种SQL聚合函数来分析某段时间内的外部请求统计数据,比如统计一天内所有URI请求404的错误条数;分析一周内的UV(用户实际单击网站次数)或PV(网站的业务访问量),掌握真实用户的网站使用频率等。
  • 快速部署 本章节主要帮助用户快速部署该解决方案。 表1 参数填写说明 参数名称 类型 是否必填 参数解释 默认值 group_name String 必填 日志组名称,不能重复,取值范围:1-64个字符,只支持输入英文、数字、中文、中划线、下划线及小数点,且不能以小数点、下划线开头或以小数点结尾。 website-om-based-on-log-tank-service-demo stream_name String 必填 日志流名称,不能重复,取值范围:1-64个字符,只支持输入英文、数字、中文、中划线、下划线及小数点,且不能以小数点、下划线开头或以小数点结尾。 website-om-based-on-log-tank-service-demo 登录华为云解决方案实践,选择“基于云日志服务实现网站运维分析”解决方案,单击“一键部署”,跳转至解决方案创建堆栈界面。 图1 解决方案实施库 在选择模板界面中,单击“下一步”。 图2 选择模板 在参数配置界面中,参考表1完成自定义参数填写,单击“下一步”。 图3 配置参数 在资源栈设置页面中,权限委托选择“rf_admin_trust”(可选),单击“下一步”。 图4 资源栈设置 在配置确认页面中,单击“创建执行计划”。 图5 配置确认 在弹出的创建执行计划框中,自定义填写执行计划名称,单击“确定”。 图6 创建执行计划 图7 执行计划创建成功 单击“部署”,弹出执行计划提示信息,单击“执行”确认执行。 图8 执行计划确认 等待解决方案自动部署。部署成功后,单击“事件”,回显结果如下: 图9 资源创建成功 父主题: 实施步骤
  • 创建rf_admin_trust委托(可选) 进入华为云官网,打开控制台管理界面,鼠标移动至个人帐号处,打开“统一身份认证”菜单。 图1 控制台管理界面 图2 统一身份认证菜单 进入“委托”菜单,搜索“rf_admin_trust”委托。 图3 委托列表 如果委托存在,则不用执行接下来的创建委托的步骤 如果委托不存在时执行接下来的步骤创建委托 单击步骤2界面中的“创建委托”按钮,在委托名称中输入“rf_admin_trust”,委托类型选择“云服务”,输入“RFS”,单击“下一步”。 图4 创建委托 在搜索框中输入“Tenant Administrator”权限,并勾选搜索结果,单击“下一步”。 图5 选择策略 选择“所有资源”,并单击“下一步“完成配置。 图6 设置授权范围 “委托”列表中出现“rf_admin_trust”委托则创建成功。 图7 委托列表
  • MySQL数据库密码修改(可选) 登录ECS弹性云服务器控制平台,选择创建的云服务器,单击远程登录,进入Linux弹性云服务器。 图1 登录ECS云服务器控制平台 图2 登录Linux弹性云服务器 在Linux弹性云服务中输入帐号和密码后回车。 图3 登录ECS弹性云服务器 输入命令mysql -u root -p指定 root 用户登录 MySQL,输入后按回车键输入密码。使用 SET PASSWORD 修改密码命令格式为 set password for root @localhost= password('新密码'); 图4 修改MySQL的root 帐号密码 如果要修改MySQL数据库的databse用户密码。在进入MySQL的情况下,输入“grant all on wordpress.* to wordpressuser@localhost identified by '新密码';”后按回车。修改完成后输入命令‘exit’,退出MySQL数据库。 图5 修改MySQL数据库的databse用户密码
  • 安全组规则修改(可选) 该解决方案使用22端口用来远程登录弹性云服务器 ECS,默认对该方案创建的VPC子网网段放开,请参考修改安全组规则,配置IP地址白名单,以便能正常访问服务。 安全组实际是网络流量访问策略,包括网络流量入方向规则和出方向规则,通过这些规则为安全组内具有相同保护需求并且相互信任的云服务器、云容器、云数据库等实例提供安全保护。 如果您的实例关联的安全组策略无法满足使用需求,比如需要添加、修改、删除某个TCP端口,请参考以下内容进行修改。 添加安全组规则:根据业务使用需求需要开放某个TCP端口,请参考添加安全组规则添加入方向规则,打开指定的TCP端口。 修改安全组规则:安全组规则设置不当会造成严重的安全隐患。您可以参考修改安全组规则,来修改安全组中不合理的规则,保证云服务器等实例的网络安全。 删除安全组规则:当安全组规则入方向、出方向源地址/目的地址有变化时,或者不需要开放某个端口时,您可以参考删除安全组规则进行安全组规则删除。
  • 安全组规则修改(可选) 安全组实际是网络流量访问策略,包括网络流量入方向规则和出方向规则,通过这些规则为安全组内具有相同保护需求并且相互信任的云服务器、云容器等实例提供安全保护。 如果您的实例关联的安全组策略无法满足使用需求,比如需要添加、修改、删除某个TCP端口,请参考以下内容进行修改。 添加安全组规则:根据业务使用需求需要开放某个TCP端口,请参考添加安全组规则添加入方向规则,打开指定的TCP端口。 修改安全组规则:安全组规则设置不当会造成严重的安全隐患。您可以参考修改安全组规则,来修改安全组中不合理的规则,保证云服务器等实例的网络安全。 删除安全组规则:当安全组规则入方向、出方向源地址/目的地址有变化时,或者不需要开放某个端口时,您可以参考删除安全组规则进行安全组规则删除。
  • 快速部署 本章节主要帮助用户快速部署该解决方案。 表1 参数填写说明 参数名称 类型 是否必填 参数解释 默认值 function_name String 必填 函数名称,用于定义创建函数及其他资源前缀,不支持重名。取值范围:2-53个字符,可包含字母、数字、下划线和中划线,以大/小写字母开头,以字母或数字结尾。 serverless-real-time-log-analysis-demo lts_bucket_name String 必填 OBS桶名称,不支持重名。用于上传告警日志。取值范围:3-59个字符,支持小写字母、数字、中划线(-)、英文句号(.)。 serverless-real-time-log-analysis-demo lts_name String 必填 日志组、日志流名称前缀,不支持重名。取值范围:1~57个字符,只支持输入英文、数字、中文、中划线、下划线及小数点,且不能以小数点、下划线开头或以小数点结尾。 serverless-real-time-log-analysis-demo smn_name String 必填 指定要创建的主题名称,创建后,不允许修改。取值范围:1~255个字符,名称只能包含大写字母、小写字母、数字、-和_,且必须由大写字母、小写字母或数字开头。更改此参数创建一个新资源 serverless-real-time-log-analysis-demo email String 必填 接收告警信息的邮箱地址。 空 登录华为云解决方案实践,选择“无服务器日志实时分析”解决方案,单击“一键部署”,跳转至解决方案创建堆栈界面。 图1 解决方案实施库 在选择模板界面中,单击“下一步”。 图2 选择模板 在配置参数界面中,参考表1完成自定义参数填写,单击“下一步”。 图3 配置参数 在资源栈设置页面中,权限委托选择“rf_admin_trust”(可选),单击“下一步”。 图4 高级配置 在配置确认页面中,单击“创建执行计划”。 图5 配置确认 在弹出的创建执行计划框中,自定义填写执行计划名称,单击“确定”。 图6 创建执行计划 图7 执行计划创建成功 单击“部署”,弹出执行计划提示信息,单击“执行”确认执行。 图8 执行计划确认 等待解决方案自动部署。部署成功后,单击“事件”,回显结果如下: 图9 资源创建成功 父主题: 实施步骤
  • 安全组规则修改(可选) 该解决方案使用22,3389端口远程登录弹性云服务器ECS,默认对该方案创建的VPC子网网段放开,请参考修改安全组规则,配置IP地址白名单,以便能正常访问服务。 安全组实际是网络流量访问策略,包括网络流量入方向规则和出方向规则,通过这些规则为安全组内具有相同保护需求并且相互信任的云服务器、云容器、云数据库等实例提供安全保护。 如果您的实例关联的安全组策略无法满足使用需求,比如需要添加、修改、删除某个TCP端口,请参考以下内容进行修改。 添加安全组规则:根据业务使用需求需要开放某个TCP端口,请参考添加安全组规则添加入方向规则,打开指定的TCP端口。 修改安全组规则:安全组规则设置不当会造成严重的安全隐患。您可以参考修改安全组规则,来修改安全组中不合理的规则,保证云服务器等实例的网络安全。 删除安全组规则:当安全组规则入方向、出方向源地址/目的地址有变化时,或者不需要开放某个端口时,您可以参考删除安全组规则进行安全组规则删除。
  • 软件安装 打开华为云服务器控制台,查看创建的云服务器资源。 图1 创建的云服务器 (可选)修改云服务器密码,勾选创建的弹性云服务器,单击“关机”,关机成功后,单击“重置密码”,根据提示重置密码,单击“确定”后,开机即可正常使用。 图2 修改密码 SSH登录B1服务端和远程桌面登录B1客户端。需在ipGroup-tcp22地址组里加入源端的IP,如我的本地电脑的公网IP为"22x.xx.xx.xx",加入到地址组,即放通此电脑对B1服务端22端口及客户端3389的访问,然后使用本地电脑的相应工具访问NAT网关里DNAT对应的映射端口60022或63389,即可正常远程连接。 图3 远程连接白名单 图4 DNAT映射 图5 SSH连接B1服务端 图6 远程桌面连接B1客户端 参考 华为云SAP Business One on HANA安装最佳实践,进行软件安装。
  • 名词解释 基本概念、云服务简介、专有名词解释 弹性云服务器 ECS:是一种可随时自助获取、可弹性伸缩的云服务器,可帮助您打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率。 弹性公网IP EIP:提供独立的公网IP资源,包括公网IP地址与公网出口带宽服务。可以与弹性云服务器、裸金属服务器、虚拟VIP、弹性负载均衡、NAT网关等资源灵活地绑定及解绑。 虚拟私有云 VPC:是用户在云上申请的隔离的、私密的虚拟网络环境。用户可以自由配置VPC内的IP地址段、子网、安全组等子服务,也可以申请弹性带宽和弹性IP搭建业务系统。 安全组:安全组是一个逻辑上的分组,为同一个VPC内具有相同安全保护需求并相互信任的弹性云服务器提供访问策略。安全组创建后,用户可以在安全组中定义各种访问规则,当弹性云服务器加入该安全组后,即受到这些访问规则的保护。 对象存储服务 OBS:是一个基于对象的存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力,使用时无需考虑容量限制,并且提供多种存储类型供选择,满足客户各类业务场景诉求。
  • 资源和成本规划 资源和成本规划 该解决方案主要部署如下资源,不同产品的花费仅供参考,实际以收费账单为准,具体请参考华为云官网价格: 表1 资源和成本规划-弹性云服务器部署(包年包月) 华为云服务 配置示例 每月预估花费 弹性云服务器 ECS 区域:华北-北京四 计费模式:包年包月 规格:X86计算 | ECS | s6.medium.2 | 1vCPUs | 2GiB 镜像:CentOS 7.6 64bit 系统盘:高IO | 100GB 购买量:1 107.20元 弹性公网IP EIP 按需计费(按带宽计费):0.34元/5M/小时 区域:华北-北京四 计费模式:按带宽计费 线路:动态BGP 公网带宽:按带宽计费 带宽大小:5Mbit/s 购买时长:1个月 购买量:1 0.34*24*30=244.80元 合计 352.00 元 表2 资源和成本规划-弹性云服务器部署(按需计费) 华为云服务 计费说明 每月花费 弹性云服务器 按需计费:0.24/小时 区域:华北-北京四 计费模式:按需计费 规格:X86计算 | ECS | s6.medium.2 | 1vCPUs | 2GiB 镜像:CentOS 7.6 64bit 系统盘:高IO | 100GB 购买时长:1个月 购买量:1 0.22 * 24 * 30 = 158.40元 弹性公网IP 按需计费(按带宽计费):0.34元/5M/小时 区域:华北-北京四 计费模式:按带宽计费 线路:动态BGP 公网带宽:按带宽计费 带宽大小:5Mbit/s 购买时长:1个月 购买量:1 0.34*24*30=244.80元 合计 403.20元
  • 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP 主机IP。 nodeName 主机名称。 磁盘指标 clusterId 集群ID。 diskDevice 磁盘名称。 hostID 主机ID。 nameSpace 集群的命名空间。 nodeIP 主机IP。 nodeName 主机名称。 磁盘分区指标 diskPartition 磁盘分区。 diskPartitionType 磁盘分区类型。 文件系统指标 clusterId 集群ID。 clusterName 集群名称。 fileSystem 文件系统。 hostID 主机ID。 mountPoint 挂载点。 nameSpace 集群的命名空间。 nodeIP 主机IP。 nodeName 主机名称。 主机指标 clusterId 集群ID。 clusterName 集群名称。 gpuName GPU名称。 gpuID GPU ID。 npuName NPU名称。 npuID NPU ID。 hostID 主机ID。 nameSpace 集群的命名空间。 nodeIP 主机IP。 hostName 主机名称。 集群指标 clusterId 集群ID。 clusterName 集群名称。 projectId 项目ID。 容器指标 appID 服务ID。 appName 服务名称。 clusterId 集群ID。 clusterName 集群名称。 containerID 容器ID。 containerName 容器名称。 deploymentName 工作负载名称。 kind 应用类型。 nameSpace 集群的命名空间。 podID 实例ID。 podIP 实例IP。 podName 实例名称。 serviceID 存量ID。 nodename 主机名称。 nodeIP 主机IP。 virtualServiceName Istio虚拟服务名。 gpuID GPU ID。 npuName NPU名称。 npuID NPU ID。 进程指标 appName 服务名称。 clusterId 集群ID。 clusterName 集群名称。 nameSpace 集群的命名空间。 processID 进程ID。 processName 进程名称。 serviceID 存量ID。
  • 与AOM 1.0对比 AOM 2.0基于AOM 1.0原有功能,结合用户常用的应用监控,增加了多种指标和日志数据的采集与监控,并对监控结果可视化呈现。同时,通过自动化运维功能将日常运维操作服务化、自动化,减少运维人员重复性操作。 本章节主要对比AOM 2.0与AOM 1.0版本的功能特性。 表1 AOM 2.0与AOM 1.0版本的功能特性对比 功能项 功能项说明 AOM 1.0 AOM 2.0 应用资源管理 资源检索 提供应用、主机等资源的检索功能,支持通过ID、关键字、名称等方式快速检索资源。 不支持 支持 应用管理 管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+ 组件 + 环境”的应用管理模型。 资源管理 全局查看所有的云服务资源对象与应用的关联关系,便于用户对资源进行分析和管理。 环境标签 为已创建的应用环境添加标签,便于用户快速过滤和查找相同属性的应用环境。 资源监控 接入中心 快速接入需要监控的业务层、应用层、中间件层、基础设施层指标。 不支持 支持 仪表盘 将不同图表展示到同一个屏幕上,通过多种图表形式展示资源的指标、日志和性能数据。 部分支持 只支持指标数据和系统性能数据的可视化监控,不支持日志数据的监控。 支持 告警管理 对服务设置事件条件或者对资源的指标设置阈值条件,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,将告警信息以邮件、短信、企业微信等方式发送给指定的人员。 部分支持 只支持按指标类型和Prometheus命令创建指标告警规则,不支持按全量指标创建。 支持 应用洞察 基于CMDB模型,从应用、组件到环境对资源健康状态分层监控。 部分支持 不支持基于CMDB模型,对指标数据分层监控。 支持 容器洞察 从工作负载和集群2个维度监控CCE的资源使用、状态和告警等信息,以便快速响应,保证工作负载顺畅运行。 支持 支持 指标浏览 实时监控日志数据和各资源的指标数据及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看业务及分析数据关联分析。 部分支持 只支持监控分析指标数据,不支持监控分析日志数据。 支持 基础设施监控 实时监控主机和云服务运行状态和虚机CPU、内存、磁盘等信息。 支持 支持 Prometheus监控 全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,可灵活扩展云原生组件指标插件。 不支持 支持 业务监控 将ELB上报到LTS的日志数据提取为指标来统一管理,便于后续在指标浏览、仪表盘界面实时监控。 不支持 支持 日志分析 通过日志接入和日志搜索功能帮您快速在海量日志中查询到所需的日志,还可通过分析日志的来源信息和上下文原始数据快速定位问题。 支持 支持 进程监控 通过配置应用发现规则发现和收集主机上部署的应用和关联的指标,并支持从应用下钻到组件,从组件下钻到实例,从实例下钻到容器。通过各层状态,完成对应用或组件的立体监控。 支持 支持 数据订阅 支持用户订阅指标或者告警信息,订阅后可以将数据转发到用户配置的kafka或DMS的Topic中,供消费者消费转发的订阅的信息。 支持 支持 自动化运维 服务场景 提供不同任务类型,并且可以对各原子服务场景卡片进行管理。 不支持 支持 定时运维 提供创建定时任务等功能,并展示定时任务的执行记录。 任务管理 提供执行任务等功能,并展示所有任务的执行记录。 参数库 提供创建参数等功能,并展示现有所有参数信息。 作业管理 提供创建作业等功能,并支持对作业进行管理。 脚本管理 提供创建脚本等功能,并支持对脚本进行版本管理。 文件管理 提供创建文件包等功能,并支持对文件包进行版本管理。 采集管理 UniAgent管理 通过UniAgent调度采集任务对数据进行采集。目前UniAgent安装支持两种方式:手动安装和自动安装。 不支持 支持 插件市场 提供系统插件、中间件、自定义插件能力。 不支持 支持 采集任务 UniAgent通过执行插件脚本,采集数据。主要有三大类采集任务分别为系统采集任务、中间件采集任务和自定义采集任务。 不支持 支持 随着AOM 1.0相关功能逐步被AOM 2.0全面取代,AOM 1.0后续会逐步下线,建议用户将AOM 1.0升级到AOM 2.0版本,升级的相关操作请参见升级AOM。
  • 资源监控 在使用资源监控时,您需注意以下使用限制,详见表1。 表1 资源监控使用限制 分类 对象 使用限制 仪表盘 仪表盘 1个区域中最多可创建1000个仪表盘。 仪表盘中的图表 1个仪表盘中最多可添加30个图表。 仪表盘中图表可选资源、阈值规则、组件或主机的个数 1个数字图最多可添加12个资源,只能展示1个资源,默认展示第一个资源。 1个阈值状态图表最多可添加10个阈值规则。 1个主机状态图表最多可添加10个主机。 1个组件状态图表最多可添加10个组件。 指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 维度 每个指标的维度最多为20个。 指标查询接口 单次最大可同时查询20个指标。 统计周期 最大统计周期为1小时。 单次查询返回指标数据 单个指标单次查询最大返回1440个数据点。 自定义指标 无限制。 上报自定义指标 单次请求数据最大不能超过40KB,上报指标所带时间戳不能超前于标准UTC时间10分钟,不接收乱序指标,即有新指标上报后,旧指标上报将会失败。 应用指标 JOB指标 每个主机的容器个数超过1000个时,ICAgent将停止采集该主机应用指标,并发送“ICAgent停止采集应用指标”告警(告警ID:34105)。 每个主机的容器个数缩减到1000个以内时,ICAgent将恢复该主机应用指标采集,并清除“ICAgent停止采集应用指标”告警 。 由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。 告警规则 告警规则 告警规则(包含指标告警规则和事件告警规则)最多可创建3000个。 告警模板 告警模板最多可创建150个。 日志 日志功能限制 日志功能限制请参考LTS日志限制。 日志文件 只支持采集文本类型日志文件,不支持采集其他类型日志文件(例如二进制文件)。 每个通过卷挂载日志的路径下,ICAgent最多采集20个日志文件。 每个ICAgent最多采集1000个容器标准输出日志文件,容器标准输出日志只支持json-file类型。 采集日志文件的资源消耗 日志文件采集时消耗的资源和日志量、文件个数及网络带宽、backend服务处理能力等多种因素强相关。 日志丢弃 当单行日志长度超过10240字节时,此行会被丢弃。 日志采集路径 Linux 采集路径支持递归路径,**表示递归5层目录。示例:/var/logs/**/a.log。 采集路径支持模糊匹配,匹配目录或文件名中的任何字符。示例:/var/logs/*/a.log、/var/logs/service/a*.log。 采集路径如果配置的是目录,示例:/var/logs/,则只采集目录下后缀为“.log”、“.trace”和“.out”的文件;如果配置的是文件名,则直接采集对应文件,只支持文本类型的文件。 采集路径不能重复配置,即同一主机下的同一路径,即使跨日志组和日志流,也只能配置一次。 Windows Windows环境日志采集路径支持递归路径,**表示递归5层目录。配置样例:C:\var\service\**\a.log。 Windows环境日志采集路径支持模糊匹配,匹配目录或文件名中的任何字符。配置样例:C:\var\service\*\a.log、C:\var\service\a*.log。 采集路径不能重复配置,即同一主机下的同一路径,即使跨日志组和日志流,也只能配置一次。 windows事件日志采集不能重复配置,即同一主机下,即使跨日志组和日志流,也只能配置一次。 日志重复 当采集器被重启后,重启时间点附近可能会产生一定的数据重复。 历史日志 日志数据存储时长与您选择的版本有关,且收费不同,详见价格详情。 告警列表 告警 您最多可查询最近31天的告警。 事件 您最多可查询最近31天的事件。 - 应用发现规则 应用发现规则最多可创建100个。 父主题: 约束与限制
  • 什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化运维方案,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。 图1 AOM产品结构图 托管&运行态 AOM可无缝对接多个上层运维服务,支持快速从应用管理与运维平台(ServiceStage)、函数工作流(FunctionGraph)和微服务引擎(Cloud Service Engine,CSE)等上层运维服务采集指标数据并实时、可视化呈现。 可观测性分析 基于四层指标体系(基础设施层指标、中间件层指标、应用层指标和业务层指标),通过事务监控、容器监控、普罗监控等功能,提供异常检测、历史数据分析、性能分析、关联性和场景化分析等可观测性分析能力。 运维自动化 提供批量磁盘清理、作业编排、脚本执行等功能,将日常运维操作服务化、标准化、自动化。 应用资源管理 通过应用管理、资源搜索等功能,将所有资源对象与应用统一管理,为AOM上层运维场景服务提供准确、及时、一致的资源配置数据。 采集管理 统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。 开放 支持原生PromQL数据上报,也可通过API等方式上报数据,并也可通过grafana查看数据,通过kafka转储数据。
  • 名词解释 基本概念、云服务简介、专有名词解释 弹性云服务器 ECS:是一种可随时自助获取、可弹性伸缩的云服务器,可帮助您打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率。 弹性公网IP EIP:提供独立的公网IP资源,包括公网IP地址与公网出口带宽服务。可以与弹性云服务器、裸金属服务器、虚拟IP、弹性负载均衡、NAT网关等资源灵活地绑定及解绑。 云容器引擎 CCE:CCE是一种托管的Kubernetes产品/服务,可进一步简化基于容器的应用程序部署和管理,您可以在CCE中方便的创建Kubernetes集群、部署您的容器化应用,以及方便的管理和维护。 volcano插件:Volcano是一个基于Kubernetes的批处理平台,提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性。 Flink Operator:通过Flink operator ,把Flink集群描述成yaml文件,接触kubernetes的声明式特性和协调控制器,可以直接管理Flink集群及其作业,而无需关注底层资源如Deployment,Sevice,Configmap的创建及维护。
  • 提升用户体验 业务痛点 行业竞争激烈,用户对服务的体验要求高,尤其是用户体验成为互联网企业的核心竞争力。如何能获取用户的真实体验感受,减少流失率,提升用户转化率成为企业的难题。 解决方案 AOM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,实时感知用户对应用的满意度,帮助您全面了解用户体验状况。对于用户体验差的事务,通过拓扑和调用链完成事务问题定位。 通过前端性能监控,提供页面的性能、JS错误请求、API请求、服务的运营相关指标(PV/UV)情况,实时了解并追踪应用性能情况。 通过用户会话追踪,定位使用过程中影响用户体验的慢请求、慢加载、慢交互等问题,实时了解用户使用情况。 通过页面加载性能分析,提供多维度页面的首屏时间、白屏时间、可交互时间等页面加载指标数据,全面还原用户的体验感受,定位访问慢的原因。
  • 定位应用性能瓶颈 业务痛点 随着业务不断发展,业务逻辑日益复杂,导致应用性能问题分析与定位日益艰难,给监控运维带来了巨大的挑战: 应用之间的依赖关系复杂,难以梳理。 调用链路长,排查和定位群体困难。 接口调用、数据库调用关系复杂,管理难度大。 解决方案 AOM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓扑+调用链下钻能力分钟级完成问题定位。 基于应用拓扑自助发现,定位性能瓶颈。 真实还原应用大规模业务访问场景,帮助用户提前识别应用性能问题。 基于关键性能指标对比,优化应用性能。 根据指标变化趋势配置告警,及时了解异常。
  • 安全组规则修改(可选) 该解决方案默认没有放开22、1521端口及ICMP协议报文的访问,如需访问请参考下面描述自行添加安全组规则。 安全组实际是网络流量访问策略,包括网络流量入方向规则和出方向规则,通过这些规则为安全组内具有相同保护需求并且相互信任的云服务器、云容器、云数据库等实例提供安全保护。 如果您的实例关联的安全组策略无法满足使用需求,比如需要添加、修改、删除某个TCP端口,请参考以下内容进行修改。 添加安全组规则:根据业务使用需求需要开放某个TCP端口,请参考添加安全组规则添加入方向规则,打开指定的TCP端口。 修改安全组规则:安全组规则设置不当会造成严重的安全隐患。您可以参考修改安全组规则,来修改安全组中不合理的规则,保证云服务器等实例的网络安全。 删除安全组规则:当安全组规则入方向、出方向源地址/目的地址有变化时,或者不需要开放某个端口时,您可以参考删除安全组规则进行安全组规则删除。
  • 名词解释 基本概念、云服务简介、专有名词解释: 弹性云服务器ECS:是一种可随时自助获取、可弹性伸缩的云服务器,可帮助您打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率。 弹性公网EIP:提供独立的公网IP资源,包括公网IP地址与公网出口带宽服务。可以与弹性云服务器、裸金属服务器、虚拟IP、弹性负载均衡、NAT网关等资源灵活地绑定及解绑。 云数据库RDS:是稳定可靠、可弹性伸缩的云数据库服务。通过云数据库能够让您几分钟内完成数据库部署。云端完全托管,让您专注于应用程序开发,无需为数据库运维烦恼。 分布式缓存服务DCS:是华为云提供的一款内存数据库服务,兼容了Redis和Memcached两种内存数据库引擎,为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力,满足用户高并发及数据快速访问的业务诉求。 对象存储服务OBS:提供海量、安全、高可靠、低成本的数据存储能力,可供用户存储任意类型和大小的数据。适合企业备份/归档、视频点播、视频监控等多种数据存储场景。 消息通知服务SMN:可以依据华为云用户的需求主动推送通知消息,最终用户可以通过HTTP、HTTPS、短信等方式接收通知信息。 云搜索服务 CSS:是华为云ELK生态的一系列软件集合,为您全方位提供托管的ELK生态云服务,兼容Elasticsearch、Kibana、Cerebro等软件。 云监控CES:为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解华为云上的资源使用情况、业务的运行状况,并及时收到异常报警做出反应,保证业务顺畅运行。如果您需要开通云监控服务,监控资源。
  • 安全组规则修改(可选) 用户需在登录弹性云服务器前添加入方向规则。比如登录Linux弹性云服务器,指定登录端口为22,并添加白名单IP。 安全组实际是网络流量访问策略,包括网络流量入方向规则和出方向规则,通过这些规则为安全组内具有相同保护需求并且相互信任的云服务器、云容器、云数据库等实例提供安全保护。 如果您的实例关联的安全组策略无法满足使用需求,比如需要添加、修改、删除某个TCP端口,请参考以下内容进行修改。 添加安全组规则:根据业务使用需求需要开放某个TCP端口,请参考添加安全组规则添加入方向规则,打开指定的TCP端口。 修改安全组规则:安全组规则设置不当会造成严重的安全隐患。您可以参考修改安全组规则,来修改安全组中不合理的规则,保证云服务器等实例的网络安全。 删除安全组规则:当安全组规则入方向、出方向源地址/目的地址有变化时,或者不需要开放某个端口时,您可以参考删除安全组规则进行安全组规则删除。
  • 登录注册 请您登录华为控制台进入ECS弹性云服务器,选中刚创建的ECS服务器。 图3 控制台-弹性云服务器 选中ECS安全组,单击配置规则。 图4 弹性云服务器-安全组 选择入方向规则-添加规则。 图5 入方向规则-添加规则 添加有权限进行后台管理的ip或ip地址组,以对Ploto平台用户进行管理。 图6 添加8000端口权限 使用具有步骤四后台管理ip的设备访问(Ploto平台地址:8000/admin/auth/user),通过后端管理平台添加Ploto平台用户,用户名为Ploto,初始密码为 Ploto1234。 图7 后端管理平台登录页面 添加Ploto用户。 图8 添加Ploto users 图9 填写Ploto用户信息。 图10 添加Ploto用户权限。 Ploto平台使用。 图11 用户使用创建的用户登录Ploto平台后,可在数据概览看板查看平台各模块概况 图12 用户可以在数据管理-脱敏数据中查看并管理脱敏数据 图13 用户可以在数据管理-场景片段中查看并管理场景数据 图14 用户可以在用户中心-事件列表中查看平台各项事件 图15 用户可以在用户中心-告警列表中查看平台发生的各项告警事件,并进行管理
  • 名词解释 基本概念、云服务简介、专有名词解释 虚拟私有云 VPC:是用户在华为云上申请的隔离的、私密的虚拟网络环境。用户可以基于VPC构建独立的云上网络空间,配合弹性公网IP、云连接、云专线等服务实现与Internet、云内私网、跨云私网互通,帮您打造可靠、稳定、高效的专属云上网络。 弹性云服务器 ECS:是一种云上可随时自助获取、可弹性伸缩的计算服务,可帮助您打造安全、可靠、灵活、高效的应用环境。 对等连接:是指两个VPC之间的网络连接。您可以使用私有IP地址在两个VPC之间进行通信,就像两个VPC在同一个网络中一样。同一区域内,您可以在自己的VPC之间创建对等连接,也可以在自己的VPC与其他帐户的VPC之间创建对等连接。不同区域间的VPC之间不能创建对等连接。
  • 查看部署资源并测试网络连接 登录华为云控制台,添加以“北京四”为例。 图3 华为云控制台 在虚拟私有云VPC控制台,可查看该方案一键生成的VPC和对应的子网/路由表/弹性服务器ECS。 图4 虚拟私有云VPC控制台 图5 VPC实例 在虚拟私有云VPC控制台,可查看该方案一键部署生成的对等连接实例。 图6 对等连接实例 进入“堆栈”页面,查看复制两台云服务器实例的IP地址。 图7 查看复制云服务器实例IP 在弹性云服务器控制台,可远程登录其中一台云服务器,通过ping IP的方式测试与另一VPC的云服务器的连接性。 图8 远程登录ECS_01 图9 测试与ECS_02流量互通
  • 快速部署 本章节主要帮助用户快速部署该解决方案。 表1 参数填写说明 参数名称 类型 是否必填 参数解释 默认值 function_name string 必填 函数名称,用于定义创建函数及其他资源前缀,不支持重名。取值范围:1-53个字符,以字母开头,仅支持小写字母、数字、下划线(_)、中划线(-)。 batch_change_specification_demo ecs_ids string 必填 需变更ECS弹性服务器的名称id,多个id之间用空格隔开,格式为:id1 id2 ... ,默认为空。 空 ecs_flavor string 必填 变更后弹性云服务器ECS规格名称,仅支持同实例类型变更,具体变更详情请参考链接:登录弹性云服务器ECS规格清单 空 change_cron string 必填 定时变更cron表达式。格式为:秒 分 时 日 月 周(可选),例如:0 15 2 * * ?(表示每天凌晨02:15:00执行);0 30 8 ? * Mon(表示每周一上午08:30:00执行);0 0 7 1 * ?(表示每月1号上午07:00:00执行),可参考cron表达式规则了解,填写Cron表达式。 空 登录华为云解决方案实践,选择“定时变更实例规格解决方案”。数据中心下拉菜单可以选择需要部署的区域,单击“一键部署”,跳转至解决方案创建资源栈界面。 图1 定时变更实例规格解决方案 在选择模板界面中,单击“下一步”。 图2 选择模板 在配置参数界面中,参考表1完成自定义参数填写,单击“下一步”。 图3 配置参数 在资源栈设置页面中,权限委托选择“rf_admin_trust”,单击“下一步”。 图4 资源栈设置 在配置确认页面中,单击“创建执行计划”。 图5 配置确认 单击“创建执行计划”,自定义填写执行计划名称,单击“确定”。创建执行计划。 图6 创建执行计划 执行计划状态为“创建成功,待部署”时,然后单击“部署”,确认执行。 图7 执行计划 图8 执行计划确认 待“事件”中出现“Apply required resource success”,表示该解决方案已经部署完成。 图9 部署成功 父主题: 实施步骤
  • 名词解释 基本概念、云服务简介、专有名词解释 弹性云服务器 ECS:是一种可随时自助获取、可弹性伸缩的云服务器,可帮助您打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率。 函数工作流 FunctionGraph:FunctionGraph是一项基于事件驱动的函数托管计算服务。使用FunctionGraph函数,只需编写业务函数代码并设置运行的条件,无需配置和管理服务器等基础设施,函数以弹性、免运维、高可靠的方式运行。此外,按函数实际执行资源计费,不执行不产生费用。 统一身份认证服务 IAM:是华为云提供权限管理、访问控制和身份认证的基础服务,您可以使用IAM创建和管理用户、用户组,通过授权来允许或拒绝对象对云服务和资源的访问,通过设置安全策略提高帐号和资源的安全性,同时IAM为您提供多种安全的访问凭证。
  • 访问网站 修改初始密码。打开华为云服务器控制台,勾选3.1快速部署-步骤2创建的弹性云服务器,单击“关机”,关机成功后,单击“重置密码”,根据提示重置密码,单击“确定”后,开机即可正常使用。 图1 重置密码 访问ezEIP建站系统。软件启动大约需一分钟,之后,复制3.1 步骤9中所看到的万户ezEIP建站系统访问地址,在浏览器打开。 图2 访问网址 登录到网站首页。具体使用可请单击这里,查看更多信息以及联系客服。 图3 网站首页
  • 安全组规则修改(可选) 用户需在登录弹性云服务器前添加入方向规则。比如登录Windows弹性云服务器,指定登录端口为3389,并添加白名单IP。 安全组实际是网络流量访问策略,包括网络流量入方向规则和出方向规则,通过这些规则为安全组内具有相同保护需求并且相互信任的云服务器、云容器、云数据库等实例提供安全保护。 如果您的实例关联的安全组策略无法满足使用需求,比如需要添加、修改、删除某个TCP端口,请参考以下内容进行修改。 添加安全组规则:根据业务使用需求需要开放某个TCP端口,请参考添加安全组规则添加入方向规则,打开指定的TCP端口。 修改安全组规则:安全组规则设置不当会造成严重的安全隐患。您可以参考修改安全组规则,来修改安全组中不合理的规则,保证云服务器等实例的网络安全。 删除安全组规则:当安全组规则入方向、出方向源地址/目的地址有变化时,或者不需要开放某个端口时,您可以参考删除安全组规则进行安全组规则删除。
共100000条