什么是云实时监控服务

云监控服务为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。云监控服务架构图如图1所示。

图1 云监控服务架构图

云监控服务主要具有以下功能:

自动监控:

云监控服务不需要开通,在创建弹性云服务器等资源后监控服务会自动启动,您可以直接到云监控服务查看该资源运行状态并设置告警规则。

主机监控:

通过在弹性云服务或裸金属服务器中安装云监控服务Agent插件,用户可以实时采集ECS或BMS 1分钟级粒度的监控数据。已上线CPU、内存和磁盘等40余种监控指标。有关主机监控的更多信息,请参阅主机监控简介。

灵活配置告警规则:

对监控指标设置告警规则时,支持对多个云服务资源同时添加告警规则。告警规则创建完成后,可随时修改告警规则,支持对告警规则进行启用、停止、删除等灵活操作。

实时通知:

通过在告警规则中开启消息通知服务,当云服务的状态变化触发告警规则设置的阈值时,系统通过短信、邮件通知或发送消息至服务器地址等多种方式实时通知用户,让用户能够实时掌握云资源运行状态变化。

监控面板:

为用户提供在一个监控面板跨服务、跨维度查看监控数据,将用户关注的重点服务监控指标集中呈现,既能满足您总览云服务的运行概况,又能满足排查故障时查看监控详情的需求。

OBS转储:

云监控服务各监控指标的原始数据的保留周期为两天,超过保留周期后原始数据将不再保存。您可以在对象存储服务(Object Storage Service,以下简称OBS)创建存储桶,然后将原始数据同步保存至OBS,以保存更长时间。

资源分组:

资源分组支持用户从业务角度集中管理其业务涉及到的弹性云服务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则、告警记录,可以迅速提升运维效率。

站点监控:

站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。

日志监控:

日志监控提供了针对日志内容的实时监控能力。通过云监控服务和云日志服务的结合,用户可以针对日志内容进行监控统计、设置告警规则等操作,降低用户监控日志的运维成本,简化用户使用监控日志的流程。

事件监控:

事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。

监控云存储有免费的吗

免费开通,节省成本。CES目前为免费使用,当您购买弹性云服务器、带宽等资源时,将自动开通CES云监控服务,为您的各种资源提供监控能力,同时具备告警发送能力,全面护航您的云上资源。

立即免费使用 >>

  • 云服务监控

    可以查看最近六个月的各服务资源的历史监控数据,高时效、自动开通

    可以查看最近六个月的各服务资源的历史监控数据,高时效、自动开通

  • ECS主机监控

    ECS主机监控提供秒级的ECS主机实例监控,具备底层/OS/应用层监控能力

    ECS主机监控提供秒级的ECS主机实例监控,具备底层/OS/应用层监控能力

  • 事件监控

    事件监控将业务中的各类重要事件或对云资源的操作事件收集到云监控,并进行告警

    事件监控将业务中的各类重要事件或对云资源的操作事件收集到云监控,并进行告警

  • 站点监控

    模拟真实用户对远端站点的访问,持续监控站点的可用性、连通性等状态

    模拟真实用户对远端站点的访问,持续监控站点的可用性、连通性等状态

  • 一键告警

    您可以一键触发,轻松的将关注的云服务配置上默认的告警规则,开箱即用,简单便捷

    您可以一键触发,轻松的将关注的云服务配置上默认的告警规则,开箱即用,简单便捷

  • 进程监控

    持续监控ECS内进程的运行情况,细粒度监管进程运行状态

    持续监控ECS内进程的运行情况,细粒度监管进程运行状态

  • 快速告警

    借助云监控灵活的告警规则和多种通知方式,您可以收到云监控针对资源变化产生的通知消息。提供三种状态变化通知、七种告警通知方式

    借助云监控灵活的告警规则和多种通知方式,您可以收到云监控针对资源变化产生的通知消息。提供三种状态变化通知、七种告警通知方式

  • 告警模板

    您可使用系统默认推荐的或自己创建的告警模板,快速为云资源批量创建告警规则

    您可使用系统默认推荐的或自己创建的告警模板,快速为云资源批量创建告警规则

  • 资源分组

    业务角度分类管理所用资源,业务角度管理监控和告警信息。快速定位故障范围,提升企业运维效率

    业务角度分类管理所用资源,业务角度管理监控和告警信息。快速定位故障范围,提升企业运维效率

云监控系统最佳实践

电商平台业务监控

电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。

ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。

网站为电商平台的入口,双12、618等大型购物节,会导致不同网络用户访问电商网站出现网页打开慢、网络延时高等问题。站点监控可对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。

针对电商平台使用的RDS、ELB、VPC等服务,可以使用云服务监控,在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。

电商业务主要涉及华为云ECS、CDN、AS、安全服务、RDS、ELB、OBS等服务。通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。

云监控在视频直播中的应用

在互联网飞速发展的时代,视频直播服务需求量不断加大。华为云稳定的ECS、VPC、ELB,可为您的视频直播服务提供稳定的资源,以保障便捷接入、低延迟、高并发、高清流畅的视频直播服务,减少视频卡顿、模糊带来的用户体验差的问题。

在华为云部署的视频直播业务典型架构图如图1所示,其中所用到多个ECS、VPC、ELB。ECS作为视频直播服务的基础,VPC提供网络基础,ELB用于流量分发。ECS细微的性能变化,网络访问流量的突增都会引起业务动荡,因此,对云资源的实时监控,及时通知资源异常变得越来越重要。华为云云监控可提供对ECS、VPC、ELB等资源的监控,及时发现异常并通知用户处理。

图1 视频直播业务架构图

云监控在众包平台中的使用

众包平台作为知识工作者共享平台,利用互联网来将工作分配出去,连接雇主和服务提供者。众多服务商为企业、公共机构和个人提供定制化的解决方案,将创意、智慧、技能转化为商业价值和社会价值。

在华为云部署的众包平台的经典架构图如图1所示,核心数据库采用BMS集群方式部署数据库集群,Web-Server与API-Server部署在ECS上,Web-Server主要提供网站的搜索、类目、店铺、交易等业务,API-Server为连接各业务与数据库的各个基础接口。BMS与ECS的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控事件监控随时监控ECS与BMS的运行状况。

网站与各个基础接口的可用性、响应时间、丢包率等会直接影响用户使用的流畅程度,需使用站点监控随时监控各站点的运行情况。

VPC、NAT、ELB等提供基础的网络支持,网络状态影响各个业务之间的连通性,因此需使用网络监控来随时监控各业务系统的运行状况。

图1 众包平台架构图