华为云用户手册

  • DubboProvider监控 介绍APM采集的dubbo服务端监控指标的类别、名称、含义等信息。 表1 DubboProvider采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 invocationDetail radio JAVA false 2.0.0 - 是否采集调用详情(配置后,会采集参数和返回值,默认不采集) invocationLength integer JAVA 1000 2.0.0 - 调用详情采集长度(默认:1000字节) attachmentDetail radio JAVA false 2.0.0 - 是否采集attachment(默认不采集) attachmentLength integer JAVA 1000 2.0.0 - attachment采集长度(默认:1000字节) attachmentKeys array JAVA - 2.0.0 - attachment采集键值(指定需要从dubbo attachment中采集的键值) fieldFilterKeys array JAVA - 2.0.0 - 域过滤键值(指定需要从dubbo调用参数和返回信息需要过滤敏感信息键值) slowRequestThreshold integer JAVA 800 2.0.0 - 慢调用方法阈值(单位:ms) slowTraceCountStats string JAVA 100,50,10,2 2.0.0 - 系统压力较大时采样率配置(例子:100,50,10,2 分别表示低、中、高CPU负载下的采样率,末位表示最低采样个数) errorTraceCountStats string JAVA 100,50,10,2 2.0.0 - 错误调用采样率配置(例子:100,50,10,2 分别表示低、中、高CPU负载下的采样率,末位表示单个方法最低采样个数) traceCountStats string JAVA 20,10,5,1 2.0.0 - 默认采样率配置(例子:20,10,5,1 分别表示低、中、高CPU负载下的采样率,末位表示单个方法最低采样个数) excludeMethods string JAVA [{"group":"mock"},{"service":"mock*"}] 2.0.0 - 排除方法(指定不需要调用链跟踪的方法) specMethods string JAVA {{"group":"mock"}:{"percentage":10,"periodCount":1000,"sampleType":"4","slowRequestThreshold":800}} 2.0.0 - 方法配置(指定调用链跟踪的方法的灰度规则,只采集规则命中调用信息) DefaultSampleConfig string JAVA {"percentage":10,"periodCount":1000,"sampleType":"4","slowRequestThreshold":800} 2.0.0 - 默认采样配置(指定dubbo调用采样配置,会覆盖apm默认的采样配置) 表2 dubbo服务端监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 方法调用(invocation,方法调用指标集。) serviceUniqueName serviceUniqueName 服务唯一标识(group+interface+version) - ENUM LAST method method 方法 - ENUM LAST source source 调用源 - ENUM LAST lastError lastError 错误信息 - STRING LAST slowTraceId slowTraceId 慢调用traceId - STRING LAST errorTraceId errorTraceId 错误traceId - STRING LAST range1 range1 响应时间在0-10ms范围请求数 - INT SUM range2 range2 响应时间在10-100ms范围请求数 - INT SUM range3 range3 响应时间在100-500ms范围请求数 - INT SUM range4 range4 响应时间在500-1000ms范围请求数 - INT SUM range5 range5 响应时间在1-10s范围请求数 - INT SUM range6 range6 响应时间在10s以上请求数 - INT SUM invokeCount invokeCount 调用次数 - INT SUM totalTime 总响应时间 总响应时间 ms INT SUM maxTime 最大响应时间 最大响应时间 ms INT MAX errorCount errorCount 错误数 - INT SUM runningCount runningCount 当前正在执行数量 - INT SUM concurrentMax concurrentMax 最大并发数 - INT MAX 主机汇总(cluster,按照主机汇总指标集) cluster cluster 主机 - ENUM LAST range1 range1 响应时间在0-10ms范围请求数 - INT SUM range2 range2 响应时间在10-100ms范围请求数 - INT SUM range3 range3 响应时间在100-500ms范围请求数 - INT SUM range4 range4 响应时间在500-1000ms范围请求数 - INT SUM range5 range5 响应时间在1-10s范围请求数 - INT SUM range6 range6 响应时间在10s以上请求数 - INT SUM invokeCount invokeCount 调用次数 - INT SUM totalTime 总响应时间 总响应时间 ms INT SUM maxTime 最大响应时间 最大响应时间 ms INT MAX errorCount errorCount 错误数 - INT SUM runningCount runningCount 当前正在执行数量 - INT SUM concurrentMax concurrentMax 最大并发数 - INT MAX 返回码汇总(resultCode,返回码汇总指标集。) code code 返回码 - ENUM LAST count count 调用次数 - INT SUM lastMethod lastMethod 最近异常类型 - STRING LAST 汇总(total,汇总指标集。) lastError lastError 错误信息 - STRING LAST slowTraceId slowTraceId 慢调用traceId - STRING LAST errorTraceId errorTraceId 错误traceId - STRING LAST range1 range1 响应时间在0-10ms范围请求数 - INT SUM range2 range2 响应时间在10-100ms范围请求数 - INT SUM range3 range3 响应时间在100-500ms范围请求数 - INT SUM range4 range4 响应时间在500-1000ms范围请求数 - INT SUM range5 range5 响应时间在1-10s范围请求数 - INT SUM range6 range6 响应时间在10s以上请求数 - INT SUM invokeCount invokeCount 调用次数 - INT SUM totalTime 总响应时间 总响应时间 ms INT SUM maxTime 最大响应时间 最大响应时间 ms INT MAX errorCount errorCount 错误数 - INT SUM runningCount runningCount 当前正在执行数量 - INT SUM concurrentMax concurrentMax 最大并发数 - INT MAX 线程池(threadPool,线程池指标集。) poolId poolId 线程池唯一标示 - ENUM LAST poolType poolType dubbo自定义线程池类型(fixed、cached、limited等) - STRING LAST activeCount activeCount 当前激活个数 - INT SUM corePoolSize corePoolSize 核心线程数 - INT SUM maximumPoolSize maximumPoolSize 最大核心线程数 - INT SUM poolSize poolSize 线程池大小 - INT SUM queueSize queueSize 等待队列大小 - INT SUM taskCount taskCount 任务数 - INT SUM 客户端版本(version,客户端版本指标集。) version version 客户端版本 - STRING LAST 父主题: 接口调用
  • 探针监控 本章节介绍APM采集的探针监控指标的类别、名称、含义等信息。 表1 探针监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 探针数据(detail,探针数据指标集。) type 数据类型 探针上报的数据类型 - ENUM LAST discardBytes 丢弃字节数 该数据类型的丢弃字节数 Byte INT SUM discardCount 丢弃次数 该数据类型的丢弃次数 - INT SUM errorBytes 发送失败字节数 该数据类型的发送失败字节数 Byte INT SUM errorCount 发送失败次数 该数据类型的发送失败次数 - INT SUM maxBytes 最大字节数 该数据类型的最大发送字节数 Byte INT MAX maxQueueSize 队列最大长度 该数据类型发送队列最大长度 - INT MAX sendBytes 发送成功字节数 该数据类型发送成功字节数 Byte INT SUM sendCount 发送成功次数 该数据类型发送成功次数 - INT SUM sendTotalTime 总发送时间 该数据类型的总发送时间 ms INT SUM slowTime 最慢发送时间 该数据类型最慢发送时间 ms INT MAX 异常(exception,异常指标集。) causeType 异常类 异常发生类 - ENUM LAST type 类型 异常类型 - ENUM LAST count 次数 异常次数 - INT SUM message 消息 异常消息 - STRING LAST stackTrace 堆栈 异常堆栈 - CLOB LAST 服务端连接监控(transfer,服务端连接监控指标集。) host 主机 主机信息 - ENUM LAST connectIp 连接ip 连接ip - STRING LAST ipList ip列表 所有ip列表 - STRING LAST isConnected 是否连接 是否连接 - INT LAST rt 响应时间 响应时间 ms INT AVG 队列监控(repository,队列监控指标集。) monitorQueueSize 监控数据队列大小 监控数据队列大小 - INT SUM monitorObjectSize 监控数据内存大小 监控数据内存大小 - INT SUM traceQueueSize 调用链数据队列大小 调用链数据队列大小 - INT SUM traceObjectSize 调用链数据内存大小 调用链数据内存大小 - INT SUM 父主题: 指标总览
  • HBase监控 介绍APM采集的HBase监控指标的类别、名称、含义等信息。 表1 HBase监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常(exception,HBase调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST HBase调用监控(client,HBase调用监控。) namespaceTable 命名空间:表名 HBase操作所对应的命名空间及表名 - ENUM LAST command 命令 在HBase服务端运行的命令 - ENUM LAST concurrentMax 最大并发 最大并发 - INT MAX queryRowCount 读取行数 读取行数 - INT SUM updateRowCount 更新行数 更新行数 - INT SUM errorCount 错误次数 错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST invokeCount 调用次数 调用次数 - INT SUM lastError 错误信息 错误信息 - STRING LAST maxTime 最大响应时间 最大响应时间 - INT MAX totalTime totalTime 总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM HBase版本(version,HBase版本。) version 版本 版本 - STRING LAST HBase汇总(total,HBase调用的汇总信息统计。) invokeCount 调用次数 总的调用次数 - INT SUM queryRowCount 总读取行数 总读取行数 - INT SUM updateRowCount 总更新行数 总更新行数 - INT SUM errorCount 总错误数 总错误数 - INT SUM totalTime 总响应时间 总响应时间 - INT SUM HBase节点调用监控(serverNode,HBase服务端节点RPC调用监控。) serverAddr 服务端节点 服务端节点信息 - ENUM LAST concurrentMax 最大并发 最大并发 - INT MAX errorCount 错误次数 错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST invokeCount 调用次数 调用次数 - INT SUM lastError 错误信息 错误信息 - STRING LAST maxTime 最大响应时间 最大响应时间 - INT MAX totalTime totalTime 总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM HBase集群维度调用监控(cluster,HBase集群维度RPC调用监控。) clusterId 集群ID 集群ID - ENUM LAST cachedServers 客户端缓存节点地址 客户端缓存节点地址 - STRING LAST zkNodes ZK连接地址 ZK连接地址 - STRING LAST concurrentMax 最大并发 最大并发 - INT MAX errorCount 错误次数 错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST invokeCount 调用次数 调用次数 - INT SUM lastError 错误信息 错误信息 - STRING LAST maxTime 最大响应时间 最大响应时间 - INT MAX totalTime 总响应时间 总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM 父主题: 数据库
  • GC监控 介绍APM采集的GC监控指标的类别、名称、含义等信息。 表1 GC监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 gc统计信息(gc,gc统计信息。) fullGCCount fullgc次数 采集周期内fullgc的次数 - INT SUM fullGCCountTotal fullgc总次数 fullgc的累积次数 - INT SUM fullGCTime fullgc时间 采集周期内fullgc的时间 ms INT SUM fullGCTimeTotal fullgc总时间 fullgc的累积时间 ms INT SUM fullGCMBeanName fullgc回收器名称 fullgc回收器的名称 - STRING LAST youngGCCount younggc次数 采集周期内younggc的次数 - INT SUM youngGCCountTotal younggc总次数 younggc的累积次数 - INT SUM youngGCTime younggc时间 采集周期内younggc的时间 ms INT SUM youngGCTimeTotal younggc总时间 younggc的累积时间 ms INT SUM youngGCMBeanName younggc回收器名称 younggc回收器的名称 - STRING LAST gc详情统计信息(gcdetail,gc详情统计信息。) action gc类型 gc类型,分为major和minor两种 - ENUM LAST cause gc原因 发生gc的原因 - ENUM LAST name gc名称 gc回收器的名称 - STRING LAST count 次数 gc发生的次数 - INT SUM totalTime gc时间 gc消耗的时间 ms INT SUM maxTime gc最大时间 最慢一次gc消耗的时间 ms INT MAX detail gc详情 最慢一次gc的详细信息 - CLOB LAST 父主题: 基础监控
  • HttpClient监控 介绍APM采集的HttpClient监控指标的类别、名称、含义等信息。 表1 HttpClient监控采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 url规整配置 obj_array JAVA - 2.0.0 - 根据url规整配置,将一些restful风格的url进行规整;规整方式包含startwith,endwith,include,regex四种方式 httpclient最大采集行数 integer JAVA 500 2.4.1 - httpclient最大采集行数 表2 HttpClient监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常(exception,httpclient调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST causeType 异常类 发生异常的类 - ENUM LAST 集群指标(hostInvocation,根据被调用方的集群维度统计httpclient接口调用信息。) envId 集群id 被调用方的集群id - ENUM LAST hostUri 调用地址 被调用的地址 - STRING LAST errorCount 错误次数 调用该集群url发生的错误次数 - INT SUM invokeCount 调用次数 调用该集群url的调用次数 - INT SUM maxTime 最大响应时间 调用该集群url的最大响应时间 ms INT MAX totalTime 总响应时间 调用该集群url的总响应时间 ms INT SUM responseCloseCount 关闭响应数 调用该集群url的关闭响应数 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM httpclient版本(info ,httpclient的包版本信息统计。) httpClientVersion httpclient版本 httpclient包的版本 - STRING LAST httpCoreVersion httpCore版本 httpCore包的版本 - STRING LAST url监控(invocation,以被调用的url为维度统计接口调用信息。) url url 被调用url - ENUM LAST method httpmethod url的httpmethod - ENUM LAST client 客户端类型 httpclient客户端的类型 - ENUM LAST concurrentMax 最大并发 被调用url的最大并发 - INT MAX errorCount 错误次数 被调用url的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST hostUri 调用地址 被调用url的调用地址 - STRING LAST invokeCount 调用次数 被调用url的调用次数 - INT SUM lastError 错误信息 url发生错误时产生的错误信息 - STRING LAST maxTime 最大响应时间 被调用url的最大响应时间 ms INT MAX responseCloseCount responseCloseCount 被调用url的关闭响应数 - INT SUM totalTime 总响应时间 被调用url的总响应时间 ms INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM envId 集群id 被调用的url对应的集群id - STRING LAST httpclient汇总(total ,httpclient接口调用的汇总信息统计。) errorCount 错误次数 总的错误次数 - INT SUM invokeCount 调用次数 总的调用次数 - INT SUM responseCloseCount 关闭响应数 总的关闭响应数 - INT SUM totalTime 总响应时间 总响应时间 ms INT SUM 状态码统计(code ,httpclient调用的异常信息统计。) code 状态码 状态码 - ENUM LAST url url 产生对应状态码的url - STRING LAST count 次数 对应状态码的发生次数 - INT SUM 父主题: 外部调用
  • KafkaProducer监控 介绍APM采集的KafkaProducer监控指标的类别、名称、含义等信息。 表1 KafkaProducer监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 topic (topic,kafka的topic监控数据。) id id clientid和ip信息 - ENUM LAST topic topic kafka的topic名称 - ENUM LAST byteRate 每秒发送字节 每秒发送字节 Byte INT AVG recordErrorRate 每秒错误数 每秒错误数 - INT AVG recordRetryRate 每秒重试数 每秒重试数 - INT AVG recordSendRate 每秒发送数 每秒发送数 - INT AVG seqIds Producer生成序列号 Producer生成序列号 - STRING LAST recordSendTotal 总发送次数 总发送次数 - INT SUM byteTotal 总发送字节数 总发送字节数 - INT SUM KafkaProducer汇总(total,KafkaProducer汇总信息统计。) recordSendTotal 总发送次数 总发送次数 - INT SUM byteTotal 总发送字节数 总发送字节数 - INT SUM 异常 (exception,kafka发送异常信息。) causeType 异常发生类 异常发生类 - ENUM LAST exceptionType 异常类 异常类 - ENUM LAST count 数量 异常数量 - INT SUM message 异常消息 异常消息 - STRING LAST stackTrace 异常堆栈 异常堆栈 - CLOB LAST 发送方法(doSendMethod,发送消息方法监控。) topic topic topic - ENUM LAST concurrentMax 最大并发 最大并发 - INT MAX errorCount 错误数 错误数 - INT SUM invokeCount 调用次数 调用次数 - INT SUM maxTime 最慢时延 最慢时延 - INT MAX range1 0–10ms 时延在0-10ms范围调用次数 - INT SUM range2 10–100ms 时延在10–100ms范围调用次数 - INT SUM range3 100–500ms 时延在100–500ms范围调用次数 - INT SUM range4 500–1000ms 时延在500–1000ms范围调用次数 - INT SUM range5 1–10s 时延在1–10s范围调用次数 - INT SUM range6 10s-n 时延在10s以上调用次数 - INT SUM totalTime 总时延 调用总耗时 - INT SUM 父主题: 消息队列
  • CoapClient监控 介绍APM采集的CoapClient监控指标的类别、名称、含义等信息。 表1 调用接口指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 接口监控(detail,以接口、报文类型、请求类型为维度统计接口调用数据。) url url 请求的url - ENUM LAST requestType 报文类型 该调用的报文类型 - ENUM LAST concurrentMax 最大并发 该方法的最大并发 - INT MAX errorCount 错误数 该方法的错误数 - INT SUM invokeCount 调用次数 该方法的调用次数 - INT SUM maxTime 最大响应时间 该方法在采集周期内最大响应时间 - INT MAX runningCount 正在执行数 该方法在采集时间点正在执行数量 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM totalTime 总响应时间 该方法的总响应时间 - INT SUM method 请求类型 该调用的请求类型 - ENUM LAST errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST lastError 错误信息 错误信息 - STRING LAST 状态码(statusInfo ,以接口返回的状态码维度统计接口调用数据。) statusInfo 状态码 状态码 - ENUM LAST count 调用次数 该状态码的发生次数 - INT SUM url 采样url 该状态码在采集周内采样的url - STRING LAST 集群调用(CON类报文)(cluster_con,以调用方集群id维度统计接口调用数据(CON类报文)。) clusterId 集群id 调用方的集群id - ENUM LAST invokeCount 调用次数 该集群的调用次数 - INT SUM totalTime 总响应时间 该集群调用的总响应时间 - INT SUM errorCount 错误次数 该集群调用的错误次数 - INT SUM CoapClient版本(version) version 版本 版本 - STRING LAST 父主题: 物联网
  • PahoPublisher监控 介绍APM采集的PahoPublisher监控指标的类别、名称、含义等信息。 表1 PahoPublisher监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 PahoPublisher发送Publish报文监控(message,PahoPublisher发送Publish报文监控。) uri serviceUri PahoPublisher连接的MQTT服务端uri - ENUM LAST msgType 报文类型 发送的报文类型 - ENUM LAST concurrentMax 最大并发 最大并发 - INT MAX errorCount 错误次数 错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST invokeCount 调用次数 调用次数 - INT SUM lastError 错误信息 错误信息 - STRING LAST maxTime 最大响应时间 最大响应时间 - INT MAX totalTime 总响应时间 总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM PahoPublisher发送Publish报文节点维度监控(uriMessage,PahoPublisher发送Publish报文节点维度监控。) uri serviceUri PahoPublisher连接的MQTT服务端uri - ENUM LAST errorCount 错误次数 错误次数 - INT SUM invokeCount 调用次数 调用次数 - INT SUM totalTime 总响应时间 总响应时间 - INT SUM 异常(exception,PahoPublisher调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST PahoPublisher主题维度监控(clientPublish,PahoPublisher主题维度监控。) clientId clientId clientId - ENUM LAST topic 主题 主题 - ENUM LAST msgSentCount 消息推送次数 消息推送次数 - INT SUM bytesSent 消息推送字节数 消息推送字节数 - INT SUM PahoPublisher版本(version,PahoPublisher版本。) version 版本 版本 - STRING LAST PahoPublisher主题汇总(total,PahoPublisher主题汇总信息统计。) msgSentCount 消息推送次数 总的消息推送次数 - INT SUM bytesSent 消息推送字节数 总消息推送字节数 - INT SUM 父主题: 物联网
  • DubboConsumer监控 介绍APM采集的DubboConsumer监控指标的类别、名称、含义等信息。 表1 DubboConsumer监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 方法调用(invocation,方法调用指标集。) serviceUniqueName serviceUniqueName 服务唯一标识(group+interface+version) - ENUM LAST method method 方法 - ENUM LAST lastError lastError 错误信息 - STRING LAST slowTraceId slowTraceId 慢调用traceId - STRING LAST errorTraceId errorTraceId 错误traceId - STRING LAST range1 range1 响应时间在0-10ms范围请求数 - INT SUM range2 range2 响应时间在10-100ms范围请求数 - INT SUM range3 range3 响应时间在100-500ms范围请求数 - INT SUM range4 range4 响应时间在500-1000ms范围请求数 - INT SUM range5 range5 响应时间在1-10s范围请求数 - INT SUM range6 range6 响应时间在10s以上请求数 - INT SUM invokeCount invokeCount 调用次数 - INT SUM totalTime 总响应时间 总响应时间 ms INT SUM maxTime 最大响应时间 最大响应时间 ms INT MAX errorCount errorCount 错误数 - INT SUM runningCount runningCount 当前正在执行数量 - INT SUM concurrentMax concurrentMax 最大并发数 - INT MAX source source 调用源 - ENUM LAST 主机汇总(cluster,按照主机汇总指标集。) cluster cluster 主机 - ENUM LAST range1 range1 响应时间在0-10ms范围请求数 - INT SUM range2 range2 响应时间在10-100ms范围请求数 - INT SUM range3 range3 响应时间在100-500ms范围请求数 - INT SUM range4 range4 响应时间在500-1000ms范围请求数 - INT SUM range5 range5 响应时间在1-10s范围请求数 - INT SUM range6 range6 响应时间在10s以上请求数 - INT SUM invokeCount invokeCount 调用次数 - INT SUM totalTime 总响应时间 总响应时间 ms INT SUM maxTime 最大响应时间 最大响应时间 ms INT MAX errorCount errorCount 错误数 - INT SUM runningCount runningCount 当前正在执行数量 - INT SUM concurrentMax concurrentMax 最大并发数 - INT MAX 返回码汇总(resultCode,返回码汇总指标集。) code code 返回码 - ENUM LAST count count 调用次数 - INT SUM lastMethod lastMethod 最近异常类型 - STRING LAST 汇总(total,汇总指标集。) lastError lastError 错误信息 - STRING LAST slowTraceId slowTraceId 慢调用traceId - STRING LAST errorTraceId errorTraceId 错误traceId - STRING LAST range1 range1 响应时间在0-10ms范围请求数 - INT SUM range2 range2 响应时间在10-100ms范围请求数 - INT SUM range3 range3 响应时间在100-500ms范围请求数 - INT SUM range4 range4 响应时间在500-1000ms范围请求数 - INT SUM range5 range5 响应时间在1-10s范围请求数 - INT SUM range6 range6 响应时间在10s以上请求数 - INT SUM invokeCount invokeCount 调用次数 - INT SUM totalTime 总响应时间 总响应时间 ms INT SUM maxTime 最大响应时间 最大响应时间 ms INT MAX errorCount errorCount 错误数 - INT SUM runningCount runningCount 当前正在执行数量 - INT SUM concurrentMax concurrentMax 最大并发数 - INT MAX 线程池(threadPool,线程池指标集。) poolId poolId 线程池唯一标示 - ENUM LAST poolType poolType dubbo自定义线程池类型(fixed、cached、limited等) - STRING LAST activeCount activeCount 当前激活个数 - INT SUM corePoolSize corePoolSize 核心线程数 - INT SUM maximumPoolSize maximumPoolSize 最大核心线程数 - INT SUM poolSize poolSize 线程池大小 - INT SUM queueSize queueSize 等待队列大小 - INT SUM taskCount taskCount 任务数 - INT SUM 客户端版本(version ,客户端版本指标集。) version version 版本 - STRING LAST 父主题: 外部调用
  • Lettuce客户端 介绍APM采集的Lettuce客户端指标的类别、名称、含义等信息。 表1 Lettuce客户端指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 客户端信息(clientInfo,客户端信息指标集。) version version 客户端版本 - STRING LAST mode mode redis运行模式(standalone、cluster) - STRING LAST nodes nodes redis节点(只统计主节点) - STRING LAST 主备切换(switch,主备切换指标集。) from from 原主机 - STRING LAST to to 目标主机 - STRING LAST switchTimes switchTimes 切换次数 - INT SUM 父主题: 缓存
  • RabbitMqConsumer监控 介绍APM采集的RabbitMqConsumer监控指标的类别、名称、含义等信息。 表1 调用接口指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常 (exception,RabbitMqConsumer调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) pushConsumeIdentifier identifier 推模式消费标识 - ENUM LAST concurrentMax 最大并发 消费消息最大并发 - INT MAX errorCount 错误次数 消费消息的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST invokeCount invokeCount Consume调用次数 - INT SUM consumedMsgCount consumedMsgCount 消费消息数 - INT SUM consumedBytes 消费字节数 消费字节数 - INT SUM maxSingleMsgBytes 单次消费最大字节数 单次消费最大字节数 - INT MAX manualAckCount ack消息数 ack消息数 - INT SUM rejectCount reject消息数 reject消息数 - INT SUM requeueCount requeue消息数 requeue消息数 - INT SUM lastError 错误信息 消费消息发生错误产生的错误信息 - STRING LAST maxTime 最大响应时间 消费消息的最大响应时间 - INT MAX runningCount 正在执行数 采集时间点正在执行的消费消息数量 - INT SUM slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST totalTime 总响应时间 消费消息的总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-200ms 响应时间在100-200ms范围请求数 - INT SUM range4 200-1000ms 响应时间在200-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM unackedMsgCount 未确认消息数(Channel) 该channel中未确认的消息数 - INT LAST connection监控(connectionConsume,以connection为维度统计消息消费详情。) connection connection consumer连接信息 - ENUM LAST connectionCount 当前连接数 当前连接数 - INT LAST channelCount 当前Channel数 当前Channel数 - INT LAST connectionCreated 创建连接数 创建连接数 - INT SUM connectionClosed 销毁连接数 销毁连接数 - INT SUM channelCreated 创建Channel数 创建Channel数 - INT SUM channelClosed 销毁Channel数 销毁Channel数 - INT SUM concurrentMax 最大并发 消费消息最大并发 - INT MAX errorCount 错误次数 消费消息的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST invokeCount invokeCount Consume调用次数 - INT SUM consumedMsgCount consumedMsgCount 消费消息数 - INT SUM consumedBytes 消费字节数 消费字节数 - INT SUM maxSingleMsgBytes 单次消费最大字节数 单次消费最大字节数 - INT MAX manualAckCount ack消息数 ack消息数 - INT SUM rejectCount reject消息数 reject消息数 - INT SUM requeueCount requeue消息数 requeue消息数 - INT SUM lastError 错误信息 消费消息发生错误产生的错误信息 - STRING LAST maxTime 最大响应时间 消费消息的最大响应时间 - INT MAX runningCount 正在执行数 采集时间点正在执行的消费消息数量 - INT SUM slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST totalTime 总响应时间 消费消息的总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-200ms 响应时间在100-200ms范围请求数 - INT SUM range4 200-1000ms 响应时间在200-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM unackedMsgCount 未确认消息数 该连接中未确认的消息数 - INT LAST total监控(total,以客户端为维度统计消息消费详情。) concurrentMax 最大并发 消费消息最大并发 - INT MAX errorCount 错误次数 消费消息的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST invokeCount invokeCount Consume调用次数 - INT SUM consumedMsgCount consumedMsgCount 消费消息数 - INT SUM consumedBytes 消费字节数 消费字节数 - INT SUM maxSingleMsgBytes 单次消费最大字节数 单次消费最大字节数 - INT MAX manualAckCount ack消息数 ack消息数 - INT SUM rejectCount reject消息数 reject消息数 - INT SUM requeueCount requeue消息数 requeue消息数 - INT SUM lastError 错误信息 消费消息发生错误产生的错误信息 - STRING LAST maxTime 最大响应时间 消费消息的最大响应时间 - INT MAX runningCount 正在执行数 采集时间点正在执行的消费消息数量 - INT SUM slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST totalTime 总响应时间 消费消息的总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-200ms 响应时间在100-200ms范围请求数 - INT SUM range4 200-1000ms 响应时间在200-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM unackedMsgCount 未确认消息数 该客户端中未确认的消息数 - INT LAST 父主题: 消息队列
  • RocketMqProducer监控 介绍APM采集的RocketMqProducer监控指标的类别、名称、含义等信息。 表1 RocketMqProducer监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常(exception,RabbitMqProducer调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST clientId监控(clientIdPublish,以clientId为维度统计消息推送详情) clientId clientId 客户端实例标识 - ENUM LAST group 生产者组 生产者组 - ENUM LAST pid pid pid - STRING LAST concurrentMax 最大并发 推送消息最大并发 - INT MAX errorCount 错误次数 推送消息的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST invokeCount invokeCount Publish调用次数 - INT SUM publishedMsgCount publishedMsgCount 推送消息数 - INT SUM publishedBytes 推送字节数 推送字节数 - INT SUM lastError 错误信息 推送消息发生错误产生的错误信息 - STRING LAST maxTime 最大响应时间 推送消息的最大响应时间 - INT MAX runningCount 正在执行数 采集时间点正在执行的推送消息数量 - INT SUM slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST totalTime 总响应时间 推送消息的总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-200ms 响应时间在100-200ms范围请求数 - INT SUM range4 200-1000ms 响应时间在200-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM topic监控(topicPublish,以以topic为维度统计消息推送详情。) clientId clientId 客户端实例标识 - ENUM LAST group 生产者组 生产者组 - ENUM LAST topic 主题 消息推送的主题 - ENUM LAST pid pid pid - STRING LAST concurrentMax 最大并发 推送消息最大并发 - INT MAX errorCount 错误次数 推送消息的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST invokeCount invokeCount Publish调用次数 - INT SUM publishedMsgCount publishedMsgCount 推送消息数 - INT SUM publishedBytes 推送字节数 推送字节数 - INT SUM lastError 错误信息 推送消息发生错误产生的错误信息 - STRING LAST maxTime 最大响应时间 推送消息的最大响应时间 - INT MAX runningCount 正在执行数 采集时间点正在执行的推送消息数量 - INT SUM slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST totalTime 总响应时间 推送消息的总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-200ms 响应时间在100-200ms范围请求数 - INT SUM range4 200-1000ms 响应时间在200-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM queue监控(queuePublish,以queue为维度统计消息推送详情。) clientId clientId 客户端实例标识 - ENUM LAST group 生产者组 生产者组 - ENUM LAST queue 消息队列 消息队列标识 - ENUM LAST pid pid pid - STRING LAST concurrentMax 最大并发 推送消息最大并发 - INT MAX errorCount 错误次数 推送消息的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST invokeCount invokeCount Publish调用次数 - INT SUM publishedMsgCount publishedMsgCount 推送消息数 - INT SUM publishedBytes 推送字节数 推送字节数 - INT SUM lastError 错误信息 推送消息发生错误产生的错误信息 - STRING LAST maxTime 最大响应时间 推送消息的最大响应时间 - INT MAX runningCount 正在执行数 采集时间点正在执行的推送消息数量 - INT SUM slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST totalTime 总响应时间 推送消息的总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-200ms 响应时间在100-200ms范围请求数 - INT SUM range4 200-1000ms 响应时间在200-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM broker监控(brokerPublish,以broker为维度统计消息推送详情。) clientId clientId 客户端实例标识 - ENUM LAST group 生产者组 生产者组 - ENUM LAST broker broker broker地址 - ENUM LAST pid pid pid - STRING LAST concurrentMax 最大并发 推送消息最大并发 - INT MAX errorCount 错误次数 推送消息的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST invokeCount invokeCount Publish调用次数 - INT SUM publishedMsgCount publishedMsgCount 推送消息数 - INT SUM publishedBytes 推送字节数 推送字节数 - INT SUM lastError 错误信息 推送消息发生错误产生的错误信息 - STRING LAST maxTime 最大响应时间 推送消息的最大响应时间 - INT MAX runningCount 正在执行数 采集时间点正在执行的推送消息数量 - INT SUM slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST totalTime 总响应时间 推送消息的总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-200ms 响应时间在100-200ms范围请求数 - INT SUM range4 200-1000ms 响应时间在200-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM 事务监控(transactionPublish,以client为维度统计事务消息推送详情。) clientId clientId 客户端实例标识 - ENUM LAST group 生产者组 生产者组 - ENUM LAST pid pid pid - STRING LAST concurrentMax 最大并发 推送事务消息最大并发 - INT MAX errorCount 错误次数 推送事务消息的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST invokeCount invokeCount 推送事务消息调用次数 - INT SUM lastError 错误信息 推送事务消息发生错误产生的错误信息 - STRING LAST maxTime 最大响应时间 推送事务消息的最大响应时间 - INT MAX runningCount 正在执行数 采集时间点正在执行的推送事务消息数量 - INT SUM slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST totalTime 总响应时间 推送事务消息的总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-200ms 响应时间在100-200ms范围请求数 - INT SUM range4 200-1000ms 响应时间在200-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM total监控(total,以客户端为维度统计消息推送详情) errorCount 错误次数 推送消息的错误次数 - INT SUM invokeCount invokeCount Publish调用次数 - INT SUM publishedMsgCount publishedMsgCount 推送消息数 - INT SUM publishedBytes 推送字节数 推送字节数 - INT SUM totalTime 总响应时间 推送消息的总响应时间 - INT SUM 父主题: 消息队列
  • ApacheHttpAsyncClient连接池 介绍APM采集的ApacheHttpAsyncClient连接池指标的类别、名称、含义等信息。 表1 ApacheHttpAsyncClient采集器采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 获取连接调用链上报时间阈值(ms) integer JAVA 1 2.1.6 - 获取连接调用链上报时间阈值(ms)。 getConnection时是否获取池内信息 radio JAVA 1 2.1.6 - getConnection时是否获取池内信息。 表2 ApacheHttpAsyncClient连接池指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 连接池(connectionPool,ApacheHttpAsyncClient连接池中不同连接状态的连接数监控。) poolId 连接池id ApacheHttpAsyncClient连接池id - ENUM LAST available 空闲数量 连接池空闲连接数量 - INT SUM leased 占用数量 连接池占用连接数量 - INT SUM max 最大数量 连接池最大连接数量 - INT MAX pending 正在连接数 连接池正在连接数 - INT SUM 连接池路由(connectionPoolRoute,连接池路由为维度统计连接状态信息。) poolId 连接池id ApacheHttpAsyncClient连接池id - ENUM LAST route 路由 连接池路由信息 - ENUM LAST available 空闲数量 连接池空闲连接数 - INT SUM leased 占用数量 连接池占用连接数 - INT SUM max 最大数量 连接池最大连接数 - INT MAX pending 正在连接数 连接池正在连接数 - INT SUM 获取连接详情(connection,获取连接详情。) route 路由 路由 - ENUM LAST invokeCount 调用次数 调用次数 - INT SUM totalTime 总时间 总时间 - INT SUM errorCount 错误次数 错误次数 - INT SUM maxTime 最慢调用 最慢调用 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM concurrentMax 最大并发 最大并发 - INT MAX 父主题: 外部调用
  • JVM监控 介绍APM采集的JVM监控指标的类别、名称、含义等信息。 表1 JVM监控采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 调用链堆栈采集阈值 integer JAVA 0 2.0.4 - 请求时延超过阈值时自动打印堆栈。 表2 JVM监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 类加载(classLoading,JVM类加载数量的统计信息。) loadedClassCount 已加载类数量 类加载器已加载类数量 - INT SUM totalLoadedClassCount 总加载类数量 类加载器总加载类数量 - INT SUM unloadedClassCount 卸载类数量 类加载器卸载类数量 - INT SUM 编译(compile,JVM的类编译时间的统计数据。) compilationTime 编译时间 采集周期内 编译时间 ms INT SUM totalCompilationTime 总编译时间 总编译时间 ms INT SUM CPU(CPU监控,JVM进程的cpu利用率数据统计。) cpuRatio cpu利用率 java进程的cpu利用率 % DOUBLE AVG cpuRatioMax 最大cpu利用率 java进程的最大cpu利用率 % DOUBLE MAX cpuTimeInterval cpu使用时间 java进程在采集间隔内cpu使用的时间 ns INT SUM processorCount 处理器个数 处理器个数 - INT SUM systemTimeInterval 采集间隔 采集间隔时间 ns INT SUM totalCpuTime 总cpu时间 cpu使用总时间 ns INT SUM 内存(memory,JVM内存数据统计。) directMemoryUsage 直接内存 直接内存使用大小 M INT AVG directMemoryCapacity 直接内存最大值 直接内存总容量 M INT AVG heapMemoryUsage 堆内存 堆内存使用的大小 M INT AVG nonHeapMemoryUsage 非堆内存 非堆内存的使用大小 M INT AVG objectPendingFinalizationCount 正在回收数量 采集时间点正在回收的对象个数 - INT SUM 内存池(memoryPool ,JVM内存池数据,以内存池名称为维度统计。) committed 可使用内存 当前可使用的内存大小 Byte INT SUM init 初始化内存 初始化内存大小 Byte INT SUM max 最大内存 最大内存大小 Byte INT SUM name 内存池名称 内存池名称 - ENUM LAST used 已使用内存 已经被使用的内存大小 Byte INT SUM 线程(thread,JVM线程数统计。) currentThreadCpuTime 线程cpu时间 当前线程的cpu时间 - INT SUM currentThreadUserTime 线程用户时间 当前线程的用户时间 - INT SUM daemonThreadCount 守护线程数 守护线程数 - INT SUM deadlockedThreadsCount 死锁线程数 死锁线程数 - INT SUM monitorDeadlockedThreads 当前死锁线程 当前死锁线程id列表 - INT SUM peakThreadCount 峰值线程数 峰值线程数 - INT SUM threadCount 当前线程数 当前线程数 - INT SUM totalStartedThreadCount 总线程数 从java进程启动开始,累积启动的线程数 - INT SUM newThreadCount 初始状态线程数量 初始状态线程数量 - INT SUM runnableThreadCount 运行状态线程数量 运行状态线程数量 - INT SUM blockedThreadCount 阻塞状态线程数量 阻塞状态线程数量 - INT SUM waitingThreadCount 等待状态线程数量 等待状态线程数量 - INT SUM timedWaitingThreadCount 超时等待状态线程数量 超时等待状态线程数量 - INT SUM terminatedThreadCount 终止状态线程数量 终止状态线程数量 - INT SUM 父主题: 基础监控
  • Druid连接池监控 介绍APM采集的Druid连接池监控指标的类别、名称、含义等信息。 表1 Druid连接池监控采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 获取连接调用链上报时间阈值(ms) integer JAVA 1 2.1.3 - getConnection方法调用链上报阈值,不超过该阈值不上报。 getConnection时是否获取池内信息 radio JAVA false 2.1.3 - getConnection时是否获取池内信息。 表2 Druid连接池监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 数据源(dataSource,数据源。) url url url - ENUM LAST dbType 数据库类型 数据库类型 - STRING LAST driverClassName 驱动 驱动 - STRING LAST initialSize 初始化连接数 初始化连接数 - INT LAST minIdle 连接池最小空闲数 连接池最小空闲数 - INT LAST maxIdle 连接池最大空闲数 连接池最大空闲数 ms INT LAST maxActive 连接池大小上限 连接池大小上限 - INT LAST waitThreadCount 等待线程数 等待线程数 - INT LAST maxWaitThreadCount 等待线程数上限 等待线程数上限 - INT LAST poolingCount 池中连接数 池中连接数 - INT LAST poolingPeak 最大池中连接数 最大池中连接数 - INT MAX activeCount 活跃连接数 活跃连接数 - INT LAST activePeak 最大活跃连接数 最大活跃连接数 - INT MAX logicConnectCount 获取连接总数 获取连接总数 - INT SUM maxWait 获取连接最大等待时间 获取连接最大等待时间 - INT LAST removeAbandoned 自动回收超时连接 是否自动回收超时连接 - STRING LAST removeAbandonedCount 超时连接回收次数 超时连接回收次数 - INT LAST removeAbandonedTimeoutMillis 连接使用时长上限 如果池中连接被获取且超过该时长未被还回,则回收该连接 - INT LAST testWhileIdle 空闲连接有效性校验 当应用向连接池申请连接且该连接被判断为空闲连接时是否校验其有效性 - STRING LAST testOnBorrow 获取连接有效性校验 在连接池中取连接前校验连接是否有效 - STRING LAST testOnReturn 归还连接有效性校验 当应用归还连接时是否校验连接有效性 - STRING LAST minEvictableIdleTimeMillis 池中连接可空闲的时间 池中连接可空闲的时间 ms INT LAST timeBetweenEvictionRunsMillis 检查池中连接空闲周期 检查池中连接空闲周期 - INT LAST 获取连接详情(connection,获取连接详情。) url 连接地址 连接地址 - ENUM LAST invokeCount 调用次数 调用次数 - INT SUM totalTime 总时间 总时间 - INT SUM errorCount 错误次数 错误次数 - INT SUM maxTime 最慢调用 最慢调用 ms INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM concurrentMax 最大并发 最大并发 - INT MAX 版本 (version,版本。) version 版本 版本 - STRING LAST 异常(exception,Druid调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST 父主题: 数据库
  • ObsClient监控 介绍APM采集的线程ObsClient监控的类别、名称、含义等信息。 表1 ObsClient监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常(exception,ObsClient调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST url监控(obsClientInvocation,以被调用的url为维度统计接口调用信息。) client client client - ENUM LAST url url 被调用url - ENUM LAST method httpmethod url的httpmethod - ENUM LAST concurrentMax 最大并发 被调用url的最大并发 - INT MAX errorCount 错误次数 被调用url的错误次数 - INT SUM hostUri hostUri hostUri - STRING LAST invokeCount 调用次数 被调用url的调用次数 - INT SUM lastError 错误信息 url发生错误时产生的错误信息 - STRING LAST maxTime 最大响应时间 被调用url的最大响应时间 - INT MAX responseCloseCount 响应关闭次数 响应关闭次数 - INT SUM totalTime 总响应时间 被调用url的总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM 状态码统计(code ,根据状态码维度统计接口调用信息。) code 状态码 状态码 - ENUM LAST url url 产生对应状态码的url - STRING LAST count 次数 对应状态码的发生次数 - INT SUM ObsClient汇总(total ,ObsClient接口调用的汇总信息统计。) errorCount 请求错误次数总和 请求错误次数总和 - INT SUM invokeCount 调用次数 总的调用次数 - INT SUM totalTime 总响应时间 总响应时间 - INT SUM 父主题: 数据库
  • Netty内存 介绍APM采集的Netty内存指标的类别、名称、含义等信息。 表1 Netty内存指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 内存(memory,内存指标。) directMemoryUsage 已使用直接内存 已使用直接内存 - INT AVG maxDirectMemory 最大直接内存 最大直接内存 - INT MAX 异常(exception ,异常。) causeType 类名 类名 - ENUM LAST exceptionType 异常类型 异常类型 - ENUM LAST count 次数 次数 - INT SUM message 异常消息 异常消息 - STRING LAST stackTrace 异常堆栈 异常堆栈 - CLOB LAST 父主题: 基础监控
  • MoquetteBroker监控 介绍APM采集的MoquetteBroker监控指标的类别、名称、含义等信息。 表1 MoquetteBroker监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常(exception,MoquetteBroker调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST MoquetteBroker版本(version,MoquetteBroker版本。) version 版本 版本 - STRING LAST MoquetteBroker主题汇总(total,MoquetteBroker主题汇总信息统计。) msgSentCount 消息推送次数 总的消息推送次数 - INT SUM bytesSent 消息推送字节数 总消息推送字节数 - INT SUM msgReceivedCount 消息接收次数 总消息接收次数 - INT SUM bytesReceived 消息接收字节数 总消息接收字节数 - INT SUM MoquetteBroker主题维度监控(brokerTopic,MoquetteBroker主题维度监控。) topic 主题 主题 - ENUM LAST subscribeCount 订阅数 订阅数 - INT SUM msgSentCount 消息推送次数 消息推送次数 - INT SUM bytesSent 消息推送字节数 消息推送字节数 - INT SUM msgReceivedCount 消息接收次数 消息接收次数 - INT SUM bytesReceived 消息接收字节数 消息接收字节数 - INT SUM 父主题: 物联网
  • GRPCClient监控 介绍APM采集的GRPCClient监控指标的类别、名称、含义等信息。 表1 GRPCClient监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 方法监控(detail,以方法维度统计接口调用数据。) method method 请求的方法 - ENUM LAST concurrentMax 最大并发 该方法的最大并发 - INT MAX errorCount 错误数 该方法的错误数 - INT SUM invokeCount 调用次数 该方法的调用次数 - INT SUM maxTime 最大响应时间 该方法在采集周期内最大响应时间 - INT MAX runningCount 正在执行数 该方法在采集时间点正在执行数量 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM totalTime 总响应时间 该方法的总响应时间 - INT SUM 集群调用(cluster,以调用方集群id维度统计接口调用数据。) clusterId 集群id 调用方的集群id - ENUM LAST invokeCount 调用次数 该集群的调用次数 - INT SUM totalTime 总响应时间 该集群调用的总响应时间 - INT SUM errorCount 错误次数 该集群调用的错误次数 - INT SUM 父主题: 远程过程调用
  • EsRestClient监控 介绍APM采集的EsRestClient监控指标的类别、名称、含义等信息。 表1 EsRestClient监控采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 index规整配置 obj_array JAVA - 2.0.0 - 通过regex匹配并规整url中符合的index 表2 EsRestClient监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常(exception,EsRestClient调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST 客户端信息(clientInfo,客户端信息。) clientId 客户端id 客户端id - ENUM LAST RestClientVersion RestClient版本 RestClient版本 - STRING LAST RestHighLevelClientVersion RestHighLevelClient版本 RestHighLevelClient版本 - STRING LAST poolId 对应的HttpAsyncClient连接池指标中的poolId 对应的HttpAsyncClient连接池指标中的poolId - STRING LAST esNodes 客户端设置的集群节点信息 客户端设置的集群节点信息 - STRING LAST esDeadNodes 集群节点中失联的节点 集群节点中失联的节点 - STRING LAST url监控 (esClient,以被调用的url为维度统计接口调用信息。) clientId clientId RestClient的Id编号 - ENUM LAST url url 被调用url - ENUM LAST method httpmethod url的httpmethod - ENUM LAST concurrentMax 最大并发 被调用url的最大并发 - INT MAX errorCount 错误次数 被调用url的错误次数 - INT SUM definitiveFailureCount 请求错误次数(definitiveFailure) 请求错误次数(definitiveFailure) - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST hostUri hostUri host uri - STRING LAST invokeCount 调用次数 被调用url的调用次数 - INT SUM lastError 错误信息 url发生错误时产生的错误信息 - STRING LAST maxTime 最大响应时间 被调用url的最大响应时间 - INT MAX totalTime 总响应时间 被调用url的总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM retryCount 请求重试次数(trackFailure) 请求重试次数(trackFailure) - INT SUM 状态码统计(code,根据状态码维度统计接口调用信息。) code 状态码 状态码 - ENUM LAST url url 产生对应状态码的url - STRING LAST count 次数 对应状态码的发生次数 - INT SUM EsRestClient汇总(total,EsRestClient接口调用的汇总信息统计。) definitiveFailureCount 请求错误次数总和 请求错误次数总和 - INT SUM invokeCount 调用次数 总的调用次数 - INT SUM totalTime 总响应时间 总响应时间 - INT SUM retryCount 请求重试次数总和 请求重试次数总和 - INT SUM EsRestClient节点调用监控(serverNode ,EsRestClient节点调用监控。) serverAddr 服务端节点 服务端节点信息 - ENUM LAST concurrentMax 最大并发 最大并发 - INT MAX errorCount 错误次数 错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST invokeCount 调用次数 调用次数 - INT SUM lastError 错误信息 错误信息 - STRING LAST maxTime 最大响应时间 最大响应时间 - INT MAX totalTime 总响应时间 总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM url监控(invocation ,以被调用的url为维度统计接口调用信息。) url url 被调用url - ENUM LAST method httpmethod url的httpmethod - ENUM LAST client 客户端类型 EsRestClient客户端的类型 - ENUM LAST concurrentMax 最大并发 被调用url的最大并发 - INT MAX errorCount 错误次数 被调用url的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST hostUri 调用地址 被调用url的调用地址 - STRING LAST invokeCount 调用次数 被调用url的调用次数 - INT SUM lastError 错误信息 url发生错误时产生的错误信息 - STRING LAST maxTime 最大响应时间 被调用url的最大响应时间 - INT MAX responseCloseCount responseCloseCount 被调用url的关闭响应数 - INT SUM totalTime 总响应时间 被调用url的总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM envId 集群id 被调用的url对应的集群id - STRING LAST EsRestClient集群调用监控(cluster,EsRestClient集群调用监控。) esNodes 集群节点 集群节点信息 - ENUM LAST clientCount 创建的RestClient个数 创建的RestClient个数 - INT LAST concurrentMax 最大并发 最大并发 - INT MAX errorCount 错误次数 错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST invokeCount 调用次数 调用次数 - INT SUM lastError 错误信息 错误信息 - STRING LAST maxTime 最大响应时间 最大响应时间 - INT MAX totalTime 总响应时间 总响应时间 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM 父主题: 数据库
  • APM JAVA探针支持操作系统 表4 APM JAVA探针(2.4.1版本)支持操作系统 探针类型 CPU架构 vCPUs 内存 规格名称 操作系统 系统版本 结果 自研探针 x86计算 2 4 s2.large.2 CentOS CentOS 8.1 64bit for GPU 支持 自研探针 x86计算 2 4 s2.large.2 CentOS CentOS 7.6 64bit for Tenant 20230712 支持 自研探针 x86计算 2 4 s2.large.2 CentOS CentOS 7.3 64bit 支持 自研探针 x86计算 4 16 Sit3.xlarge.4 CentOS CentOS 7.4 64bit 支持 自研探针 x86计算 2 4 s2.large.2 CentOS CentOS 6.8 64bit 支持 自研探针 x86计算 2 4 s2rm.2u.4g Debian Debian 11.1.0 64bit for Tenant 20221227 支持 自研探针 x86计算 2 4 s2.large.2 Ubuntu Ubuntu 22.04 server 64bit for Tenant 20230713 支持 自研探针 x86计算 2 4 s2.large.2 Ubuntu Ubuntu 16.04 server 64bit 支持 自研探针 x86计算 2 4 s2.large.2 Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 Standard 64 bit for Tenant 20230606 base 2.0.2303.1 支持 自研探针 x86计算 2 4 s2.large.2 Huawei Cloud EulerOS Huawei Cloud EulerOS 1.1 for CentOS 64 bit for op5 Tenant 20230217 base 1.1.2212.1 支持 自研探针 x86计算 2 4 s2.large.2 EulerOS EulerOS 2.9 64bit for Tenant 20230728 base 2.9.15 支持 自研探针 x86计算 2 4 s2.large.2 EulerOS EulerOS 2.5 64bit for Tenant 2023714 base 2.5.15 支持 自研探针 x86计算 2 4 s2.large.2 EulerOS EulerOS 2.2 64bit for Tenant 20210227 支持 自研探针 x86计算 2 4 s2.large.2 Windows Windows Server 2019 标准版 64位简体中文_40GB 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 Standard 64 bit for ARM for Tenant 20230411 base 2.0.2303.1(40GiB)(bf7488b4-d9b3-4314-b2a9-e39094f573d2) 支持(默认jdk11.0.17) 自研探针 鲲鹏计算 2 4 kc1.large.2 CentOS CentOS 7.6 64bit with ARM 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 CentOS CentOS 7.5 64bit with ARM(40GiB) 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 CentOS CentOS 7.4 64bit with ARM(40GiB) 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 CentOS Kylin Linux Advanced Server (Kunpeng) V10(40GiB) 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 Ubuntu Ubuntu 18.04 64bit with ARM(40GiB) 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 EulerOS EulerOS 2.9 64bit with ARM for Tenant 20230419 base 2.9.14 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 EulerOS EulerOS 2.8 64bit with ARM for Tenant 20210309(40GiB) 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 EulerOS EulerOS 2.10 64bit with ARM for Tenant 20230404 base 2.10.7 支持 自研探针 鲲鹏计算 2 4 kc1.large.2 Fedora Fedora 29 64bit with ARM(40GiB) 支持
  • APM支持的JAVA类型 APM支持JAVA类应用,目前已支持多种主流Java框架、web服务器、通讯协议、数据库等,可实现应用轻松接入。 表1 自研探针JAVA组件和框架 探针类型 组件 JDK 1.8 JDK 17 自研探针 Dubbo 2.6.x 2.6.x 自研探针 Jedis 2.x.x-3.x.x 2.x.x-3.x.x 自研探针 Lettuce 5.x.x 5.x.x 自研探针 servicecomb 2.x.x - 自研探针 log4j 1.x.x 1.x.x 自研探针 log4j2 2.x.x 2.x.x 自研探针 httpclient 4.x.x 4.x.x~5.3.x(5.x.x仅支持同步场景) 自研探针 jdkhttpclient 1.6~1.8 17 自研探针 mariadb 2.x.x 2.x.x 自研探针 mysql 5.x.x~8.x.x 5.x.x~8.x.x 自研探针 okhttpclient 3.x.x 3.x.x 自研探针 tomcat 6.x.x~9.x.x 9.x.x 自研探针 jetty 8.x.x~9.x.x 9.x.x 自研探针 grpc 1.x.x 1.x.x 自研探针 reactor-netty 1.x.x - 自研探针 hbase 2.x.x 2.x.x 自研探针 mongodb 3.x.x~4.x.x 3.x.x~4.x.x 自研探针 redisson 3.12.x~3.26.x 3.13.x~3.26.x 自研探针 c3p0 0.9.x 0.9.x 自研探针 cassandra3 3.x.x 3.x.x 自研探针 clickhouse 0.2.x 0.2.x 自研探针 dbcp 2.x.x 2.x.x 自研探针 druid 1.x.x 1.x.x 自研探针 httpasyncclient 4.x.x 4.x.x 自研探针 jettyclient 9.x.x 9.x.x 自研探针 mariadb3 3.x.x 3.x.x 自研探针 mybatis 3.x.x 3.x.x 自研探针 netty 4.x.x 4.x.x 自研探针 postgresql 42.x.x 42.x.x 自研探针 rabbitmq 5.x.x 5.x.x 自研探针 undertow 2.x.x 2.x.x 自研探针 websocket 9.x.x 9.x.x 自研探针 elasticsearch 7.x.x 7.x.x 自研探针 oracle 10.x.x 10.x.x 自研探针 rocketmq 4.x.x 4.x.x 自研探针 kafka 2.x.x 2.x.x 自研探针 springCloudGateway 2.1.x~3.1.x - 表2 skywalking探针JAVA组件信息 探针类型 组件 版本 skywalking探针 Tomcat 7~10 skywalking探针 Spring Boot Web 4.x skywalking探针 Spring MVC 3.x, 4.x 5.x with servlet 3.x skywalking探针 Spring MVC 6.x skywalking探针 Nutz Web Framework 1.x skywalking探针 Struts2 MVC 2.3.x~2.5.x skywalking探针 Resin 3~4 skywalking探针 Jetty Server 9.x~11.x skywalking探针 Spring WebFlux 5.x skywalking探针 Undertow 1.3.0~2.0.27 skywalking探针 RESTEasy 3.1.0~6.2.4 skywalking探针 Play Framework 2.6.x~2.8.x skywalking探针 Light4J Microservices Framework 1.6.x~2.x skywalking探针 Netty SocketIO 1.x skywalking探针 Micronaut HTTP Server 3.2.x~3.6.x skywalking探针 Jersey REST framework 2.x~3.x skywalking探针 Grizzly 2.3.x~4.x skywalking探针 WebSphere Liberty 23.x skywalking探针 Feign 9.x skywalking探针 Netflix Spring Cloud Feign 1.1.x~2.x skywalking探针 Okhttp 2.x~4.x skywalking探针 Spring RestTemplate 6.x skywalking探针 Jetty Client 9.x~11.x skywalking探针 Apache httpcomponent AsyncClient 4.x skywalking探针 AsyncHttpClient 2.1+ skywalking探针 JRE HttpURLConnection (Optional²) - skywalking探针 Hutool-http client 5.x skywalking探针 Micronaut HTTP Client 3.2.x~3.6.x skywalking探针 Spring Cloud Gateway 2.0.2.RELEASE~3.x skywalking探针 Apache ShenYu 2.4.x skywalking探针 Mysql Driver 5.x, 6.x, 8.x skywalking探针 H2 Driver 1.3.x~1.4.x skywalking探针 ShardingSphere 3.0.0, 4.0.0, 4.0.1, 4.1.0, 4.1.1, 5.0.0 skywalking探针 PostgreSQL Driver 8.x, 9.x, 42.x skywalking探针 Mariadb Driver 2.x, 1.8 skywalking探针 InfluxDB 2.5~2.17 skywalking探针 Mssql-Jtds 1.x skywalking探针 Mssql-jdbc 6.x~8.x skywalking探针 ClickHouse-jdbc 0.3.x skywalking探针 Apache-Kylin-Jdbc 2.6.x~ 4.x skywalking探针 Impala-jdbc 2.6.x skywalking探针 Dubbo 2.5.4~2.7.0 skywalking探针 Dubbox 2.8.4 skywalking探针 Apache Dubbo 2.7.x~3.x skywalking探针 Motan 0.2.x~1.1.0 skywalking探针 gRPC 1.x skywalking探针 Apache ServiceComb Java Chassis 1.x, 2.x skywalking探针 SOFARPC 5.4.0 skywalking探针 Armeria 0.63.0~1.22.0 skywalking探针 Apache Avro 1.7.0~1.8.x skywalking探针 Finagle 6.44.0~20.1.0 skywalking探针 Brpc-Java 2.3.7~3.0.5 skywalking探针 JSONRPC4J 1.2.0~1.6 skywalking探针 Nacos-Client 2.x skywalking探针 RocketMQ 3.x~5.x skywalking探针 RocketMQ-gRPC 5.x skywalking探针 Kafka 0.11.0.0~3.2.3 skywalking探针 Spring Kafka Consumer 1.3.x~2.3.x skywalking探针 ActiveMQ 5.10.0~5.15.4 skywalking探针 RabbitMQ 3.x~5.x skywalking探针 Pulsar 2.2.x~2.9.x skywalking探针 NATS 2.14.x~2.15.x skywalking探针 Aliyun ONS 1.x skywalking探针 aerospike 3.x~6.x skywalking探针 Jedis 2.x~4.x skywalking探针 redisson Easy Java Redis client 3.5.2+ skywalking探针 Lettuce 5.x skywalking探针 MongoDB Java Driver 2.13~2.14, 3.4.0~3.12.7, 4.0.0~4.1.0 skywalking探针 Spymemcached 2.x skywalking探针 Xmemcached 2.x skywalking探针 transport-client 5.2.x~5.6.x,6.2.3~6.8.4,7.0.0-7.5.2 skywalking探针 rest-high-level-client 6.7.1~6.8.4,7.0.0~7.5.2 skywalking探针 SolrJ 7.x skywalking探针 cassandra-java-driver 3.7.0~3.7.2 skywalking探针 hbase-client HTable 1.0.0-2.4.2 skywalking探针 Neo4j-java 4.x skywalking探针 Zookeeper 3.4.x skywalking探针 Spring Bean annotations 3.x~4.x skywalking探针 Spring Core Async SuccessCallback/FailureCallback/ListenableFutureCallback 4.x skywalking探针 Spring Transaction 4.x~5.x skywalking探针 Hystrix 1.4.20~1.5.18 skywalking探针 Sentinel 1.7.0~1.8.1 skywalking探针 Elastic Job 2.x skywalking探针 Apache ShardingSphere-Elasticjob 3.x skywalking探针 Spring @Scheduled 3.1+ skywalking探针 Quartz Scheduler 2.x skywalking探针 XXL Job 2.x skywalking探针 Canal 1.0.25~1.1.2 skywalking探针 GSON 2.8.x skywalking探针 Fastjson 1.2.x skywalking探针 Jackson 2.x skywalking探针 Vert.x Eventbus 3.2~4.x skywalking探针 Vert.x Web 3.x~4.x skywalking探针 Spring 4.x~5.x skywalking探针 Quasar 0.7.x skywalking探针 Ehcache 2.x skywalking探针 GuavaCache 18.~23.x skywalking探针 Coroutine 1.0.1~1.3.x skywalking探针 Graphql 8.0~17.x skywalking探针 Alibaba Druid 1.x skywalking探针 HikariCP 3.x~4.x skywalking探针 log4j 2.x skywalking探针 log4j2 1.2.x skywalking探针 logback 1.2.x skywalking探针 MyBatis 3.4.x~3.5.x skywalking探针 GuavaEventBus 19.x~31.x-jre skywalking探针 Undertow 2.1.x~2.6.x skywalking探针 Grizzly 2.3.x~4.x skywalking探针 Jetty 9.1.x~11.x 表3 opentelemetry探针JAVA组件信息 探针类型 组件 版本 opentelemetry探针 Dubbo 2.7+ opentelemetry探针 Jedis 1.4+ opentelemetry探针 Lettuce 4.0+ opentelemetry探针 log4j 1.2+ opentelemetry探针 log4j2 2.11+ opentelemetry探针 httpclient 2.0+ opentelemetry探针 tomcat 7.0.x, 8.5.x, 9.0.x, 10.0.x opentelemetry探针 jetty 9.4.x, 10.0.x, 11.0.x opentelemetry探针 grpc 1.6+ opentelemetry探针 mongodb 3.1+ opentelemetry探针 redisson 3.0+ opentelemetry探针 c3p0 0.9.2+ opentelemetry探针 cassandra3 3.0+ opentelemetry探针 dbcp 2.0+ opentelemetry探针 httpasyncclient 4.1+ opentelemetry探针 jettyclient 9.2+(not including 10+ yet) opentelemetry探针 netty 3.8+ opentelemetry探针 rabbitmq 2.7+ opentelemetry探针 undertow 1.4+ opentelemetry探针 elasticsearch 5.0+ opentelemetry探针 oracle 11.2+ opentelemetry探针 rocketmq 4.8+ opentelemetry探针 kafka 2.7+
  • ApacheHttpClient连接池 介绍APM采集的ApacheHttpClient连接池指标的类别、名称、含义等信息。 表1 ApacheHttpClient连接池指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 连接池(connectionPool,ApacheHttpclient连接池中不同连接状态的连接数监控。) poolId 连接池id ApacheHttpclient连接池id - ENUM LAST available 空闲数量 连接池空闲连接数量 - INT SUM leased 占用数量 连接池占用连接数量 - INT SUM max 最大数量 连接池最大连接数量 - INT MAX pending 正在连接数 连接池正在连接数 - INT SUM 连接池路由(connectionPoolRoute,连接池路由为维度统计连接状态信息。) poolId 连接池id ApacheHttpClient连接池id - ENUM LAST route 路由 连接池路由信息 - ENUM LAST available 空闲数量 连接池空闲连接数 - INT SUM leased 占用数量 连接池占用连接数 - INT SUM max 最大数量 连接池最大连接数 - INT MAX pending 正在连接数 连接池正在连接数 - INT SUM 父主题: 外部调用
  • 异常日志 介绍APM采集的异常指标的类别、名称、含义等信息。 表1 异常采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 日志异常是否认为调用链异常 radio JAVA true 2.0.0 - 采集到了日志异常之后,是否将所属调用链数据标记为异常。 关联业务日志与TraceId radio JAVA false 2.3.19 - 关联业务日志与TraceId。 表2 异常指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 异常日志(exception,日志打印的所有异常等级日志的统计数据。) className 异常类 发生异常的所在类 - ENUM LAST exceptionType 异常类型 该异常的类型 - ENUM LAST logType 日志类型 该异常打印所属的日志类型 - ENUM LAST count 次数 异常发生的次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的异常堆栈 - CLOB LAST errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST 日志版本(logVersion,日志组件的包版本信息。) logType 日志类型 日志类型 - ENUM LAST version 日志版本 日志类型对应的版本 - STRING LAST 父主题: 指标总览
  • 线程 介绍APM采集的线程指标的类别、名称、含义等信息。 表1 线程采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 线程详情最大行数 integer JAVA 1 2.3.19 - 线程详情最大行数50。 表2 线程指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 线程详情(threadDetail,线程详情。) threadName 线程名 线程名 - ENUM LAST memory 内存 内存 - INT SUM stack 线程堆栈 线程堆栈 - CLOB LAST ids 线程id 线程id - STRING LAST cpuTime 线程cpu耗时 线程cpu耗时 ms INT SUM count 线程数 线程数 - INT LAST 父主题: 基础监控
  • Oracle数据库 介绍APM采集的Oracle数据库指标的类别、名称、含义等信息。 表1 Oracle数据库采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 是否采集原始sql radio JAVA false 2.2.9 - 调用链中是否采集上报带有参数内容的原始sql。 oracle最大采集行数 integer JAVA 500 2.4.1 - oracle最大采集行数 sql语句最大采集字节数 integer JAVA 2000 2.4.7 - sql语句最大采集字节数 表2 Oracle数据库指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 数据库连接(connection,以数据库为维度统计sql调用详情。) db 数据库 数据库名称 - ENUM LAST createdCount 创建连接数 该数据库创建连接数 - INT SUM currentCount 当前连接数 该数据库当前连接数 - INT SUM destroyedCount 销毁连接数 该数据库销毁连接数 - INT SUM errorCount 错误数 该数据库发生错误数 - INT SUM invokeCount 调用次数 该数据库的调用次数 - INT SUM maxTime 最大响应时间 该数据库的最大响应时间 - INT MAX range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-200ms 响应时间在100-200ms范围请求数 - INT SUM range4 200-1000ms 响应时间在200-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM ranges 自定义响应时间区间 自定义响应时间区间 - STRING LAST readRowCount 读取行数 该数据库读取行数 - INT SUM updatedRowCount 更新行数 该数据库更新行数 - INT SUM totalTime 总响应时间 该数据库的总响应时间 - INT SUM slowestSql 最慢sql 该数据库在采集周期内的最慢sql - STRING LAST 异常(exception,以数据库为维度统计sql调用详情。) causeType 类名 异常发生类 - ENUM LAST exceptionType 异常类型 异常类型 - ENUM LAST count 次数 异常次数 - INT SUM message 消息 异常消息 - STRING LAST sql 异常sql 发生异常的sql - STRING LAST stackTrace 异常堆栈 异常产生的堆栈信息 - CLOB LAST 版本(version,Oracle的包版本信息。) version 版本 驱动包版本 - STRING LAST sql监控(sql,以sql为维度统计sql调用详情。) sql sql唯一标识 sql对应的唯一id,用于告警配置 - ENUM LAST concurrentMax 最大并发 该sql的最大并发 - INT MAX errorCount 错误次数 该sql的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST invokeCount 调用次数 该sql的调用次数 - INT SUM lastError 错误信息 sql发生错误产生的错误信息 - STRING LAST maxTime 最大响应时间 该sql的最大响应时间 - INT MAX readRowCount 读取行数 该sql的读取行数 - INT SUM runningCount 正在执行数 采集时间点正在执行的sql数量 - INT SUM slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST sqlString sql语句 sql语句 - STRING LAST totalTime 总响应时间 该sql的总响应时间 - INT SUM updatedRowCount 更新行数 该sql的更新行数 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-200ms 响应时间在100-200ms范围请求数 - INT SUM range4 200-1000ms 响应时间在200-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM ranges 自定义响应时间区间 自定义响应时间区间 - STRING LAST 汇总total(total,sql调用的汇总数据统计。) invokeCount 调用次数 总调用次数 - INT SUM errorCount 错误次数 总错误次数 - INT SUM readRowCount 读取行数 总读取行数 - INT SUM totalTime 响应时间 总响应时间 - INT SUM updatedRowCount 更新行数 总更新行数 - INT SUM 父主题: 数据库
  • CoapServer监控 介绍APM采集的CoapServer监控指标的类别、名称、含义等信息。 表1 CoapServer监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 接口监控(detail,以接口、报文类型、请求类型为维度统计接口调用数据。) url url 请求的url - ENUM LAST requestType 报文类型 该调用的报文类型 - ENUM LAST concurrentMax 最大并发 该方法的最大并发 - INT MAX errorCount 错误数 该方法的错误数 - INT SUM invokeCount 调用次数 该方法的调用次数 - INT SUM maxTime 最大响应时间 该方法在采集周期内最大响应时间 - INT MAX runningCount 正在执行数 该方法在采集时间点正在执行数量 - INT SUM range1 0-10ms 响应时间在0-10ms范围请求数 - INT SUM range2 10-100ms 响应时间在10-100ms范围请求数 - INT SUM range3 100-500ms 响应时间在100-500ms范围请求数 - INT SUM range4 500-1000ms 响应时间在500-1000ms范围请求数 - INT SUM range5 1-10s 响应时间在1-10s范围请求数 - INT SUM range6 10s以上 响应时间在10s以上请求数 - INT SUM totalTime 总响应时间 该方法的总响应时间 - INT SUM method 请求类型 该调用的请求类型 - ENUM LAST errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid - STRING LAST slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid - STRING LAST lastError 错误信息 错误信息 - STRING LAST 状态码(statusInfo,以接口返回的状态码维度统计接口调用数据。) statusInfo 状态码 状态码 - ENUM LAST count 调用次数 该状态码的发生次数 - INT SUM url url 状态码的url - STRING LAST 集群调用(cluster,以调用方集群id维度统计接口调用数据。) clusterId 集群id 调用方的集群id - ENUM LAST invokeCount 调用次数 该集群的调用次数 - INT SUM totalTime 总响应时间 该集群调用的总响应时间 - INT SUM errorCount 错误次数 该集群调用的错误次数 - INT SUM clientErrorCount 客户端错误次数 该集群调用的客户端错误次数 - INT SUM serverErrorCount 服务端错误次数 该集群调用的服务端错误次数 - INT SUM CoapServer版本(version,CoapServer版本。) version 版本 版本 - STRING LAST 父主题: 物联网
  • 性能相关 规范 业务程序禁止执行全表扫描的查询。 执行查询时,只选择需要返回的字段,不需要的字段不要返回。从而减少网络和进程处理的负载,修改数据时,只修改变化需要修改的字段,不要整个对象直接存储全部修改。 避免使用$not。DDS并不会对缺失的数据进行索引,因此$not的查询条件将会要求在一个结果集中扫描所有记录。如果$not是唯一的查询条件,会对集合执行全表扫描。 用$and时把匹配最少结果的条件放在最前面,用$or时把匹配最多结果的条件放在最前面。 单个实例中,数据库的总的个数不要超过200个,总的集合个数不要超过500个。集合数量过多会导致内存压力变高,并且集合数量多会导致重启以及主备倒换性能变差,影响紧急情况下的高可用性能。 业务上线前,一定要对数据库进行性能压测,评估业务峰值场景下,对数据库的负载情况。 禁止同时执行大量并发事务,且长时间不提交。 业务正式上线前, 所有的查询类别,都应该先执行查询计划检查查询性能。 建议 每个连接在后台都是由一个单独线程处理,每个线程会分配1MB的栈内存。所以连接数不宜过多,否则会占用过多的内存。 使用连接池,避免频繁的建立连接和断开连接,否则会导致CPU过高。 减少磁盘读写:避免使用不必要的upsert命令,避免查询不必要的数据。 优化数据分布:对数据进行分片,同时分散热点数据,均衡地使用实例资源。如何进行数据分片,请参见设置数据分片。 减少锁冲突:避免对同一个Key过于频繁地操作。 减少锁等待:避免前台创建索引。 注意 开发过程中对集合的每一个操作都要通过执行explain()检查其执行计划,如: db.T_DeviceData.find({"deviceId":"ae4b5769-896f"}).explain(); db.T_DeviceData.find({"deviceId":"77557c2-31b4"}).explain("executionStats"); 对于查询而言,因为覆盖查询不需要读取文档,而是直接从索引中返回结果,这样的查询性能好,所以尽可能使用索引覆盖查询。如果explain()的输出显示indexOnly字段为真,则说明这个查询就被一个索引覆盖。 执行计划解析: 看执行时间:executionStats.executionStages.executionTimeMillisEstimate和executionStats.executionStages.inputStage. executionTimeMillisEstimate时间越短越好。 executionStats.executionTimeMillis表示执行计划选择和执行的所有时间。 executionStats.executionStages.executionTimeMillisEstimate表示执行计划的执行完成时间。 executionStats.executionStages.inputStage. executionTimeMillisEstimate表示执行计划下的子阶段执行完成时间。 看扫描条数:三个条目数相同为最佳。 executionStats. nReturned表示匹配查询条件的文档数。 executionStats .totalKeysExamined表示索引扫描条目数。 executionStats .totalDocsExamined表示文档扫描条目数。 看Stage状态,性能较好的Stage状态组合如下。 Fetch+IDHACK Fetch+ixscan Limit+(Fetch+ixscan) PROJECTION+ixscan 表1 状态说明 状态名称 描述 COLLSCAN 全表扫描 SORT 内存中进行排序 IDHACK 根据_id进行查询 TEXT 全文索引 COUNTSCAN 未用索引计数 FETCH 索引扫描 LIMIT 使用Limit限制返回数 SUBPLA 未用索引的$or查询阶段 PROJECTION 限定返回字段时stage的返回 COUNT_SCAN 使用索引计数
  • 数据库连接 使用DDS时,可能会遇到因为Mongod/dds mongos的连接数满了,导致客户端无法连接的问题。在Mongod/dds mongos的服务端,收到一个新的连接由一个单独的线程来处理,每个线程配置了1MB的栈空间,当网络连接数太多时,过多的线程会导致上下文切换开销变大,同时内存开销也会上涨。 客户端连接数据库的时候,要计算业务一共有多少个客户端,每个客户端配置的连接池大小是多少,总的连接数不要超过当前实例能承受的最大连接数的80%。 客户端与数据库的连接应尽量保持相对稳定的状态,每秒新增连接数建议保持在10以下。 建议客户端的连接超时时间至少设置为最大业务执行时长的3倍。 对于副本集实例,客户端需要同时配置主备节点的IP地址;对于集群实例,至少配置两个dds mongos的IP地址。 DDS默认提供rwuser用户,使用rwuser用户登录时认证库必须是admin。
  • 分片设计规范 对于使用DDS分片集群,建议尽可能的使用分片集合以充分利用性能,详情请参见设置数据分片以充分利用分片性能。 分片集合使用上建议如下: 对于大数据量(数据量过百万),并有较高读写请求的业务场景,数据量随着业务量增大而增大的,建议采用分片。 对于采用hash分片的集合,需要根据业务后面实际数据量大小,采用预分片,提前预置chunk数量,减少自动均衡和分裂对业务运行造成影响。 对于非空集合开启分片,应将均衡器的开启时间窗放在业务空闲时,避免分片间均衡数据与业务冲突影响性能。设置时间窗口的API接口详情请参见设置集群均衡活动时间窗。 需要基于分片键排序查询且增加数据时可以分布均匀建议使用范围分片,其他使用哈希分片。 合理设计shard key,防止出现大量的数据使用相同shard key,导致出现jumbo chunk。 使用分片集群,执行dropDatabase后,一定要执行flushRouterConfig命令,详情请参见如何规避dds mongos路由缓存缺陷。 业务的update请求需要注意与片键相适配。在使用分片表时,如果出现如下场景则update请求会报错,并返回“An upsert on a sharded collection must contain the shard key and have the simple collation”。 update请求的filter中未携带片键字段且选项multi:false set中未携带片键字段且选项upsert:true
共100000条