华为云用户手册

  • Flink简介 Flink是一个批处理和流处理结合的统一计算框架,其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理,是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理(Data Processing)场景:高并发pipeline处理数据,时延毫秒级,且兼具可靠性。 Flink技术栈如图1所示。 图1 Flink技术栈 Flink在当前版本中重点构建如下特性: DataStream Checkpoint 窗口 Job Pipeline 配置表
  • MAS自定义策略样例 示例1:授权用户创建、修改和查看实例的权限。 { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "mas:instance:create", "mas:instance:modify", "mas:instance:list", "mas:instance:get" ] } ] }
  • 操作步骤 进入购买MAS实例页面。 在购买多活管理中心页面,填写实例配置信息,系统会根据您选择的“商品类型”自动计算费用,然后单击“立即创建”。 图1 购买多活管理中心 表1 多活实例配置参数 参数 配置说明 命名空间 选择命名空间。 说明: 多活实例支持如下条件的命名空间: 同城多活:主备多活分区均为当前控制台所选区域。如需创建用于同城多活的多活实例,请选择满足此条件的命名空间。 异地容灾:备多活分区为当前控制台所选区域。如需创建用于执行工作流的多活实例,请选择满足此条件的命名空间。 CPU架构 选择CPU架构。 分区设置 选择多活分区的可用区,可用区由命名空间配置决定。 仲裁节点 命名空间选择“同城多活”类型时可见,选择ETCD仲裁节点所属可用区,可用区选择请与业务部署架构保持一致。 计费模式 选择计费模式。 按需计费:按需计费是后付费模式,按多活实例的实际使用时长计费,可以随时开通/删除多活实例。 包年包月:包年包月是预付费模式,按订单的购买周期计费,价格比按需计费模式更优惠。 商品类型 多活实例类型,目前支持铂金版。 开启双向认证 命名空间选择“同城多活”类型时可见,ETCD双向认证,默认开启。 注意: 关闭双向认证有风险,请谨慎操作。 多活管理中心名称 填写多活管理中心名称,根据规划自定义。 描述 填写多活管理中心的描述信息。 网络 选择实例所关联的VPC和子网,VPC和子网须提前创建。 IPv4网段 该VPC网段为实例机器网段,请保证与您的VPC网段及其他对等连接网段不冲突。建议使用网段:10.0.0.0/24;172.16.0.0/24;192.168.0.0/24。 安全组 选择实例所关联的安全组,安全组须提前创建。 注意需要在安全组中开放被监控资源的端口。 etcd密码 命名空间选择“同城多活”类型时可见,创建etcd密码。 确认密码 命名空间选择“同城多活”类型时可见,再次确认etcd密码,两次密码输入保持一致。 购买时长 “计费模式”选择“包年包月”时可见,选择购买多活管理中心的时长。 自动续费 “计费模式”选择“包年包月”时可见,勾选后开通自动续费。 如需续费,请在管理控制台续费管理页面进行续费操作。续费相关操作请参考续费管理。 若“计费模式”选择“按需计费”,当单击“立即创建”之后,会直接开始创建实例; 若“计费模式”选择“包年包月”,需要先支付订单费用,才会开始创建实例。 实例创建时间需要5-15分钟,请耐心等待。实例创建成功后,在控制台的“多活管理”页面可看到该实例的状态为“运行中”。 如果创建实例失败,可删除创建失败的实例,然后重新创建实例。如果重新创建仍然失败,请联系技术支持。
  • 开通功能模块 进入开通功能模块页面。 在“开通功能模块”页面,单击勾选所需多活版本和功能点,单击右下角的“确定”。 图1 开通功能模块 表1 功能模块配置参数 参数 配置说明 版本 选择多活版本,可选择“同城多活”或“异地多活”。 功能点 选择如下所需功能点。 MySQL Oracle PostgreSQL Redis MongoDB Elasticsearch OpenGauss API监控 收费模式 开通功能模块的收费模式,默认“按需计费”。具体计费说明,请参考价格详情。
  • 配置介绍 表1 配置说明 参数 配置说明 使用当前用户token 是否使用当前用户token来获得鉴权。 获取token地址 如不使用当前用户token,需配置token地址。 获取token请求体 如不使用当前用户token,需配置token请求体。 请求地址 配置请求地址。 请求参数 (可选)配置请求参数。 请求头 (可选)配置请求头。 请求方式 配置请求方式,支持如下请求方式。 GET PUT POST DELETE PATCH 请求体 (可选)输入请求体内容。
  • 容器类 表2 参数配置 故障类型 故障模式 设置参数 CPU 容器CPU过载 cluster_name ;namespace ;pod_name ;容器名称 ;usage 内存 容器内存过载 cluster_name ;namespace ;pod_name ;容器名称 ;usage 进程 容器杀进程 cluster_name ;namespace ;pod_name ;容器名称 ;process 进程持续异常,即使重新拉起也会被再次杀掉 cluster_name ;namespace ;pod_name ;容器名称 ;process 进程停止 cluster_name ;namespace ;pod_name ;容器名称 ;process 磁盘 容器磁盘满 cluster_name ;namespace ;pod_name ;容器名称 ;disk ;usage 容器磁盘IO高 cluster_name ;namespace ;pod_name ;容器名称 ;disk ;operate 网络-数据链路层 容器链路层网络时延 cluster_name ;namespace ;pod_name ;容器名称;dev ;delay 容器链路层网络丢包 cluster_name ;namespace ;pod_name ;容器名称;dev ;loss_rate 容器链路层网络错包 cluster_name ;namespace ;pod_name ;容器名称;dev ;corrupt_rate 容器链路层网络重复 cluster_name ;namespace ;pod_name ;容器名称;dev ;duplicate_rate 容器链路层网络乱序 cluster_name ;namespace ;pod_name ;容器名称;dev ;reorder_rate 容器网卡down cluster_name ;namespace ;pod_name ;容器名称;dev 容器Dns篡改 cluster_name ;namespace ;pod_name ;domain;ip 网络-传输层 容器网络中断 cluster_name ;namespace ;pod_name ;容器名称;中断方向 :入方向/出方向;协议(默认tcp) ;客户端IP地址 /服务端IP地址;端口 文件 容器文件新增 cluster_name ;namespace ;pod_name ;文件路径 ;文件内容 ;是否是文件夹 :是/否 容器文件追加内容 cluster_name ;namespace ;pod_name;容器名称 ;文件路径 ;追加内容;追加次数;间隔时间 容器文件修改权限 cluster_name ;namespace ;pod_name;容器名称 ;文件路径 ;权限mod 容器文件删除 cluster_name ;namespace ;pod_name ;容器名称;文件路径 ;是否彻底删除:是/否 容器文件移动 cluster_name ;namespace ;pod_name ;容器名称;文件路径 ;目标路径;是否强制移动:是/否
  • 节点类 表3 参数配置 故障类型 故障模式 设置参数 CPU 节点CPU过载 cluster_name ;节点名称;usage 内存 节点内存过载 cluster_name ;节点名称;usage 进程 节点杀进程 cluster_name ;节点名称;process 进程持续异常,即使重新拉起也会被再次杀掉 cluster_name ;节点名称;process 进程停止 cluster_name ;节点名称 ;process 网络-数据链路层 节点链路层网络时延 cluster_name ;节点名称;dev ;delay 节点链路层网络丢包 cluster_name ;节点名称;dev ;loss_rate 节点链路层网络错包 cluster_name ;节点名称;dev ;corrupt_rate 节点链路层网络重复 cluster_name ;节点名称;dev ;duplicate_rate 节点链路层网络乱序 cluster_name ;节点名称;dev ;reorder_rate 节点网卡down cluster_name ;节点名称;dev 节点Dns篡改 cluster_name ;节点名称;domain;ip 网络-传输层 容器网络中断 cluster_name ;节点名称;中断方向 :入方向/出方向;协议(默认tcp) ;客户端IP地址 /服务端IP地址;端口
  • POD类 表1 参数配置 故障类型 故障模式 设置参数 CPU podCPU过载 cluster_name ;namespace ;pod_name ;usage 内存 pod内存过载 cluster_name ;namespace ;pod_name ;usage 进程 pod杀进程 cluster_name ;namespace ;pod_name ;process 进程持续异常,即使重新拉起也会被再次杀掉 cluster_name ;namespace ;pod_name ;process 进程停止 cluster_name ;namespace ;pod_name ;process 磁盘 pod磁盘满 cluster_name ;namespace ;pod_name ;disk ;usage pod磁盘IO高 cluster_name ;namespace ;pod_name ;disk ;operate POD 停止pod实例 cluster_name ;namespace ;pod_name 网络-数据链路层 pod链路层网络时延 cluster_name ;namespace ;pod_name ;dev ;delay pod链路层网络丢包 cluster_name ;namespace ;pod_name ;dev ;loss_rate pod链路层网络错包 cluster_name ;namespace ;pod_name ;dev ;corrupt_rate pod链路层网络重复 cluster_name ;namespace ;pod_name ;dev ;duplicate_rate pod链路层网络乱序 cluster_name ;namespace ;pod_name ;dev ;reorder_rate pod网卡down cluster_name ;namespace ;pod_name ;dev podDns篡改 cluster_name ;namespace ;pod_name ;domain;ip 网络-传输层 pod网络中断 cluster_name ;namespace ;pod_name ;中断方向 :入方向/出方向;协议(默认tcp) ;客户端IP地址 /服务端IP地址;端口 文件 pod文件新增 cluster_name ;namespace ;pod_name ;文件路径 ;文件内容 ;是否是文件夹 :是/否 pod文件追加内容 cluster_name ;namespace ;pod_name ;文件路径 ;追加内容;追加次数;间隔时间 pod文件修改权限 cluster_name ;namespace ;pod_name ;文件路径 ;权限mod pod文件删除 cluster_name ;namespace ;pod_name ;文件路径 ;是否彻底删除:是/否 pod文件移动 cluster_name ;namespace ;pod_name ;文件路径 ;目标路径;是否强制移动:是/否
  • 当资源类型选择为自建K8S 选择资源类型为自建K8S。 纳管集群控制节点。 选择一台ecs作为集群控制节点,该ecs需要能够通过ip地址访问集群,以下以ecs-cast-vpn这台机器为例。将集群的连接信息按K8S标准格式填入 /root/.kube/config 文件,没有需要自行创建(参考文档 使用 kubeconfig 文件组织集群访问 | Kubernetes),以下为示例: { "kind": "Config", "apiVersion": "v1", "preferences": { }, "clusters": [{ "name": "internalCluster", "cluster": { "server": "https://192.168.0.1:5443", "certificate-authority-data": "LS0tL~Cg==" } }], "users": [{ "name": "user", "user": { "client-certificate-data": "LS0t~S0K", "client-key-data": "LS0tL~Qo=" } }], "contexts": [{ "name": "internal", "context": { "cluster": "internalCluster", "user": "user" } }], "current-context": "internal" } 然后,下载kubectl命令行工具,并安装(参考文档 在 Linux 系统中安装并设置 kubectl | Kubernetes)。完成后可以尝试执行 kubectl get node命令,如果成功显示node列表,说明配置成功。 完成后。在界面上,点击"应用管理",选择对应的"应用"(这里以跨云App示例),点击"添加资源"。选择"弹性云服务器ECS",将这台ecs纳管。 控制节点安装UniAgent。 在探针管理界面,按照页面提示为这台ecs安装UniAgent。 纳管自建K8S集群 点击"应用管理",选择对应的"应用"(这里以跨云App示例),点击"添加资源"。选择"自建K8S"。 再点击"添加自建K8S",选择刚才配置的集群信息,点击纳管完成。 集群安装故障探针 手动安装探针 如果显示ErrImagePull,说明当前集群的机器无法拉取默认镜像,此时需要手动将镜像下载后上传到能够拉取的镜像仓。下文以北京四纳管自建K8S为例: 来到应用管理界面,按图示找到镜像地址,根据集群为x86或是arm机器,点击按钮复制拉取镜像命令。 此处以x86机器为例,执行 docker pull swr.cn-north-4.myhuaweicloud.com/cast-probe/castprobe-operator-x86_64:1.7.2 && docker pull swr.cn-north-4.myhuaweicloud.com/cast-probe/castprobe-K8S-network-x86_64:1.7.2 如果你的机器为containerd,执行 crictl pull swr.cn-north-4.myhuaweicloud.com/cast-probe/castprobe-operator-x86_64:1.7.2 && crictl pull swr.cn-north-4.myhuaweicloud.com/cast-probe/castprobe-K8S-network-x86_64:1.7.2 拉取成功后,分别将两个镜像上传到私有镜像仓库。 重新安装前,执行卸载命令,将原有安装卸载(安装前请务必先执行卸载命令,安装命令不会覆盖原有安装): 卸载: /opt/K8S/RASAgent/client/cast_probe K8S uninstall --kubeconfig=/root/.kube/config 执行安装命令,将私有仓库地址填到变量中: 安装命令 : /opt/K8S/RASAgent/client/cast_probe K8S install --kubeconfig=/root/.kube/config --operator-image=${operator镜像地址} --tool-image=${network镜像地址} 安装后 kubectl get pod -A | grep cast 查看安装结果,可能需要等待一段时间(0~10分钟),才能安装成功。 如图,所有castprobe-operator pod和cast-K8S-network pod 启动成功,探针安装完成。
  • 创建演练 登录MAS控制台。 单击“混沌工程”,进入“故障演练”页面。 单击右上角的“创建演练”,进入“创建演练”页面。 图1 创建演练 配置基本信息,输入演练名称和描述。 表1 参数说明 参数名称 说明 名称 请输入演练名称 关联 选择关联一个混沌实验或者混沌实验组,混沌实验组支持对多个混沌实验的串并行编排。 关联混沌实验/实验组。 单击“选择”,在弹窗中选择所需关联的混沌实验/实验组,并单击“确定”。 一个故障演练支持关联一个混沌实验或者一个混沌实验组。 一个混沌实验只能从一个应用下选择攻击目标,如果要同时对多个应用进行故障注入,则建议关联混沌实验组。 输入预期结果。 单击“人员安排”页签的“设置”,在“成员管理”弹窗中勾选姓名和角色,并单击“确定”。 表2 参数说明 参数名称 说明 蓝军 负责故障演练的规划和执行,作为故障演练的攻击方,拥有故障演练的所有权限。 记录组 负责对故障演练的执行详情进行记录和修正,拥有执行记录和演练报告的编辑权限。 监督组 负责对故障演练的全流程进行监督,拥有故障演练的所有查看权限和演练报告的编辑权限。 红军 负责故障演练中的问题定界和业务恢复,作为被攻击方,拥有故障演练执行结束后的查看权限。 单击右上角“保存”,完成创建演练。
  • 查看执行记录 登录MAS控制台。 单击“混沌工程”,进入“执行记录”页面。 单击“混沌实验”/“混沌实验组”页签,可分别查看对应页签的执行记录。 单击执行记录所在行的“执行详情”,可跳转至具体的详情页面进行查看。 图2 实验执行详情 表2 参数说明 参数名称 说明 业务指标 cpts配置的业务背景流量 监控信息 提供aom的机器监控数据 单击执行记录所在行的“删除”,在弹窗中单击“确认”,可删除此条执行记录。
  • 查看执行总览 登录MAS控制台。 单击“混沌工程”,进入“执行记录”页面。 单击“故障演练”页签,可查看执行记录。 故障演练的执行记录跟实验和实验组的执行记录不同,演练的执行记录需要在“记录组”回填响应的数据,回填的数据在大屏和演练报告会作为数据源展示出来。 单击执行记录所在行的“执行详情”,可跳转至执行总览的详情页面进行查看。 图1 执行总览 表1 参数说明 参数名称 说明 演练执行概览 查看演练的执行状态 演练记录 查看已执行演练的攻击模型参数配置 总结 总结本次演练结果
  • 查看故障模式 针对ECS弹性云服务器、Docker容器、CCE、中间件、等不同对象提供CPU、内存、网络、进程等故障注入的故障模式,通过故障模式库提供各类故障的快速浏览和查询的能力。 登录MAS控制台。 单击“混沌工程”进入“故障模式库”页面。 图1 故障模式库 选择故障模式类型、故障类型、故障模式并设置参数。 在搜索框直接输入故障模式名称,支持模糊匹配,再选择故障模式名称,可以直接匹配至所需故障模式。
  • 安装UniAgent 登录MAS控制台。 单击“混沌工程”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用,勾选需要安装的资源。 图1 探针管理 单击右上角的“UniAgent安装”,进入UniAgent安装页面。 选择安装方式,包括“远程安装”和“手动安装”。 第一次安装需要使用“手动安装”方式,VPC里面有一台安装机后才可以采用远程安装方式。 远程安装 图2 远程安装UniAgent 单击UniAgent版本下拉框选择UniAgent版本。 单击安装机下拉框选择安装机。 单击“添加主机信息”,并输入主机IP,登录账号,登录端口,主机密码,单击“测试连接”确认是否已连接主机。 表1 参数说明 参数名称 说明 主机IP 请输入主机IP 登录账号 请输入登录账号 说明: 请使用root用户 登录端口 请输入登录端口 主机密码 请输入密码 说明: 只作为安装使用,不保存 单击“立即安装”,开始安装UniAgent。 手动安装 图3 手动安装UniAgent 单击UniAgent版本下拉框选择UniAgent版本。 单击,复制安装命令。 命令复制到机器执行。 完成手动安装UniAgent。
  • 网络通信类 表2 参数配置 故障类型 故障模式 设置参数 网络-数据链路层 容器内链路层网络时延 类型:docker_id /docker_name;docker_id /docker_name;num ;dev_name ;delay 容器内链路层网络丢包 类型:docker_id /docker_name;docker_id /docker_name;num ;dev_name ;loss_rate 容器内链路层网络错包 类型:docker_id /docker_name;docker_id /docker_name;num ;dev_name ;corrupt_rate 容器内链路层网络包重复 类型:docker_id /docker_name;docker_id /docker_name;num ;dev_name ;duplicate_rate 容器内链路层网络包乱序 类型:docker_id /docker_name;docker_id /docker_name;num ;dev_name ;reorder_rate 容器内链路层报文多种组合故障 类型:docker_id /docker_name;docker_id /docker_name;num ;delay ;loss_rate ;corrupt_rate ;duplicate_rate ;reorder_rate 容器内网卡down 类型:docker_id /docker_name;docker_id /docker_name;num ;dev_name 容器内限制网卡带宽 类型:docker_id /docker_name;docker_id /docker_name;num ;dev_name;bandwidth 网络-传输层 容器内TCP连接吊死 类型:docker_id /docker_name;docker_id /docker_name;num ;client_ip ;server_ip ;server_port 容器内TCP释放连接吊死 类型:docker_id /docker_name;docker_id /docker_name;num ;client_ip ;server_ip ;server_port 容器内TCP连接中断 类型:docker_id /docker_name;docker_id /docker_name;num ;client_ip ;server_ip ;server_port 容器内网络单通 类型:docker_id /docker_name;docker_id /docker_name;num ;client_ip ;server_ip ;server_port 容器内网络层报文限速 类型:docker_id /docker_name;docker_id /docker_name;num ;client_ip ;server_ip ;server_port ;speed 容器内端口被占用 类型:docker_id /docker_name;docker_id /docker_name;num ;port 容器内网络连接闪断 类型:docker_id /docker_name;docker_id /docker_name;num ;client_ip ;server_ip ;server_port ;fault_repetition ;fault_interval
  • 容器资源类 表1 参数配置 故障类型 故障模式 设置参数 CPU 容器实例内CPU过载 类型:docker_id /docker_name;docker_id /docker_name;num ;usage 内存 容器实例内内存过载 类型:docker_id /docker_name;docker_id /docker_name;num ;usage 磁盘 容器内磁盘分区满 类型:docker_id /docker_name;docker_id /docker_name;num ;disk;usage 容器内磁盘IO高 类型:docker_id /docker_name;docker_id /docker_name;num ;operation 容器 杀死容器实例 类型:docker_id /docker_name;docker_id /docker_name;num ;auto_restore 优雅退出容器实例 类型:docker_id /docker_name;docker_id /docker_name;num ;auto_restore 暂停容器实例 类型:docker_id /docker_name;docker_id /docker_name;num 重启容器实例 类型:docker_id /docker_name;docker_id /docker_name;num ;auto_restore
  • 配置介绍 表1 配置说明 参数 配置说明 任务所在region 选择任务所在区域。 凭证 选择凭证,默认显示当前命名空间多活分区下已配置的默认凭证。 项目ID 输入项目ID,默认显示当前命名空间多活分区下已配置的默认项目ID。 作业 选择作业。 说明: 暂不支持选择全局参数含有主机列表类型参数的作业。 执行方案 选择执行方案。如果方案未上线不能使用,需要去AOM控制台将方案上线。 全局参数 输入AOM自动化运维配置的全局参数,详情请参考参数库。
  • 网络通信类 表2 参数配置 故障类型 故障模式 设置参数 网络-数据链路层 链路层(指定端口)网络时延 dev_name ;port;delay 链路层(指定端口)网络丢包 dev_name ;port;loss_rate 链路层(指定端口)网络错包 dev_name ;port;corrupt_rate 链路层(指定端口)网络包重复 dev_name ;port;duplicate_rate 链路层(指定端口)网络包乱序 dev_name ;port;reorder_rate 链路层(指定连接)网络时延 dev_name ;proto;client_ip ;server_ip ;client_port ;server_port ;delay 链路层(指定连接)网络丢包 dev_name ;proto;client_ip ;server_ip ;client_port ;server_port ;loss_rate 链路层(指定连接)网络错包 dev_name ;proto;client_ip ;server_ip ;client_port ;server_port ;corrupt_rate 链路层(指定连接)网络包重复 dev_name ;proto;client_ip ;server_ip ;client_port ;server_port ;duplicate_rate 链路层(指定连接)网络包乱序 dev_name ;proto;client_ip ;server_ip ;client_port ;server_port ;reorder_rate 网络链路闪断 dev_name ;fault_repetition ;fault_interval ;fault_duration 网络-网络层 ICMP丢包 client_ip ;server_ip 网络-传输层 TCP连接吊死 client_ip ;server_ip ;server_port TCP释放连接吊死 client_ip ;server_ip ;server_port TCP连接中断 client_ip ;server_ip ;server_port TCP连接中断(支持指定多服务端 ip 和端口) client_ip ;server_ip_port 网络单通 client_ip ;server_ip ;server_port 网络单通(支持指定多服务端 ip 和端口) client_ip ;server_ip_port 网络层报文限速 client_ip ;server_ip ;server_port ;speed 端口被占用 port ;is_snatch 网络层连接闪断 client_ip ;server_ip server_port ;fault_repetition ;fault_interval ;fault_duration 连接耗尽,客户端无法建立连接 server_ip;server_port ;concurrency
  • Java程序类 表2 参数配置 故障类型 故障模式 设置参数 JVM java方法网络延时 process;delayTime ;class ;method ;paramtype java方法抛自定义异常 process;exception ;class ;method ;paramtype java方法内存溢出异常 process;class ;method ;paramtype java方法栈溢出异常 process;class ;method ;paramtype java修改方法返回值 process;class ;method ;paramtype;return_value Redis redis网络延时 process ;delayTime ;cmd ;key redis抛自定义异常 process ;exception ;cmd ;key KAFKA生产端 kafka生产消息网络延迟 process ;delayTime ;topic kafka生产消息抛自定义异常 process ;exception ;topic KAFKA消费端 kafka消费端消息网络延迟 process ;delayTime ;topic kafka消费端消息抛自定义异常 process ;exception ;topic MySQL mysql网络延迟 process ;delayTime ;database ;host ;port ;table ;sqltype mysql抛自定义异常 process ;exception ;database ;host ;port ;table ;sqltype PostgreSQL postGreSql网络延迟 process ;delayTime ;database;host ;port ;table ;sqltype postGreSql抛自定义异常 process ;exception ;database;host ;port ;table ;sqltype HTTP http网络延迟 process ;delayTime ;uri http抛自定义异常 process ;exception ;uri
  • 创建混沌工程 登录MAS控制台。 单击“混沌工程”,进入“混沌实验”页面。 单击右上角的“创建混沌实验”。 自定义输入混沌实验名称。 添加攻击目标。 图1 添加攻击目标 在“攻击目标”页签,单击“添加攻击目标”。 表1 参数说明 参数名称 说明 应用 选择需要攻击的应用 服务类型 选择故障注入的故障模式类型 在弹窗下拉框中选择需要攻击的应用。 勾选需要攻击的服务资源。 单击“确定”。 设置攻击步骤。 图2 攻击步骤 单击“添加故障模式”。 在“添加故障模式”弹窗内,选择具体所需故障模式,并设置故障模式参数。 不同故障模式需要设置的参数不同,具体请参考《故障模式库》章节。 配置调度策略。 表2 调度策略参数说明 参数 配置说明 随机算法 常规:所有故障模式注入所有攻击目标。 随机:根据攻击目标数和故障模式数来随机注入。 单次攻击持续时长 配置单次攻击持续时长,最长可配置3600秒或60分钟。 攻击目标数 当随机算法选择“随机”时可见,配置攻击目标数量,区间选择范围根据目标数增长。 攻击故障模式数 当随机算法选择“随机”时可见,配置攻击故障模式数量,区间选择范围根据故障模式数增长。 攻击重复次数 配置攻击重复次数,最大可配置50次,配置后可重复对目标攻击。 攻击间隔 配置攻击时间间隔,重复攻击的时间间隔,最长间隔为3600秒或60分钟。 如需添加更多攻击模型,可单击“添加攻击模型”,并重复上述步骤1至3。 设置高级配置。 前提条件: 配置背景流量需要您先创建PerfTest测试工程任务。 配置AOM资源监控需要您先安装ICAgent。 图3 高级配置 单击“添加背景流量”。 在“背景流量”弹窗中选择工程名称。 表3 参数说明 参数名称 说明 工程名 请选择工程 任务名称 请选择任务名称 资源组类型 请选择资源组类型 勾选任务,并选择资源组,单击“确定”。 配置监控指标,可通过AOM查看系统资源类监控指标。 单击,在弹窗中添加需要监控的主机监控指标,最多可选择10个指标。 选择统计方式。 选择统计周期。 统计方式:选择统计方式为平均值、最小值、最大值、总计和样本个数中一种。 统计周期:选择统计周期为1分钟、5分钟、15分钟和1小时中一种。 单击“保存”,完成混沌实验的创建。
  • 配置介绍 表1 配置说明 参数 配置说明 任务所在region 选择任务所在区域。 任务 选择DRS灾备任务名称。 对象级对比 配置对象级对比。 开启:开启对象级对比。 关闭:关闭对象级对比。 对比类型 当“对象级对比”选择“开启”时,此参数可见。 选择对比类型。 对象:支持对数据库、索引、表、视图、存储过程和函数、表的排序规则等对象进行对比。 数据级对比 配置数据级对比。 开启:开启数据级对比。 关闭:关闭数据级对比。 说明: 对象级对比和数据级对比至少需要开启一种。 对比类型 当“数据级对比”选择“开启”时,此参数可见。 选择对比类型。 行数对比:对比同步的表的行数是否一致,只查询表的行数,对比速度较快,建议优先使用。 内容对比:对比同步的表内数据是否一致,需要查询每条数据进行对比,相较于行对比,内容对比较慢。 说明: 对象级对比开启或者DRS实时灾备任务类型规模非大规格时,不能选择内容对比。 对比方式 当“对比类型”选择“内容对比”时,此参数可见。 选择对比方式。 静态对比:对源数据库和目标数据库进行一次全量内容对比,内容对比完成后对比任务结束,适用于无数据变化的非业务时间。 对象选择 当“数据级对比”选择“开启”时,此参数可见。 勾选需要比对的对象。
  • 模型要求 导入的模型可为“.om”格式、“.pb”格式或“.caffemodel”格式,其中“.om”格式的模型才可以在HiLens Kit上运行,“.pb”格式或“.caffemodel”格式的模型在“导入(转换)”过程中,华为HiLens平台会自动将模型转换为“.om”格式。 并非所有模型都能转换成功,进行导入(转换)模型操作前,请确认是否为“.om”模型支持的TensorFlow和Caffe算子边界,详情请见附录Caffe算子边界和Tensorflow算子边界。
  • 什么是技能 技能(Skill)是运行在端侧摄像头的人工智能应用,一般由模型和逻辑代码组成。其中,逻辑代码是技能的框架,负责控制技能的运行,包括数据读入、模型导入、模型推理、结果输出等;模型是人工智能算法经由大数据训练而成,负责技能运行中关键场景的推理。 华为HiLens的技能市场提供了丰富的技能供用户选择。 按应用场景划分,技能可应用于:智能园区、智慧家庭、智能车载、智能商超和其他等场景。 按不同的设备划分,技能分为2种,一种是适用于Ascend芯片的技能,另一种是适用于海思35XX系列芯片的技能。 图1 适用芯片
  • 技能管理说明 一台设备支持安装多个技能,最多支持安装5个技能。 针对新注册的设备,其技能管理页面无任何技能信息,需安装新技能后使用。 由于当前设备管理只支持HiLens Kit设备,设备上的技能管理只能针对“适用于Ascend芯片的技能”。 设备上的技能可在技能市场购买、定制、安装等,您可以前往技能市场获得更多技能。 设备上的技能也可自行开发,您可以前往控制台开发技能。 在设备列表单击设备卡片进入设备详情页,默认进入技能管理页签,可查看设备上安装的技能列表,技能状态包含“安装中”、“故障”、“停止”、“运行中”。
  • 用户介绍 华为HiLens是面向普通用户、AI应用开发者、软硬件厂商的端云协同AI应用开发平台。它由具备AI推理能力的摄像头和云上开发平台组成,包括一站式技能开发、部署与设备管理、技能市场等功能,帮助用户开发AI技能并将其推送至端侧设备。 针对不同类型的用户的不同使用场景,其关注和使用的华为HiLens的功能有所区别。首先,请通过表1介绍了解不同角色及其使用场景,三种不同场景的使用流程请参见使用流程简介。 表1 用户介绍 用户角色 典型用户 用户场景 使用流程 普通用户 家庭成员 商超老板 工地负责人 家庭:提高家庭安防。 商超:统计客流量等。 园区:检测车辆属性和车牌等。 工地:检测工人是否佩戴安全帽等。 参见普通用户使用技能 开发者 从事AI开发的技术人员 高校学生 开发具备AI能力的技能,发布到技能市场,构建良好AI开发者生态。 控制台新建技能 参见: 开发者控制台开发技能 厂商 海思35xx系列芯片摄像头产品的厂商 摄像头厂商:赋予中低端摄像头设备AI能力。 参见厂商管理产品
  • 技能开发说明 如图1所示,根据不同芯片类型,技能分为两种类型,分别为可应用于HiLens Kit设备的技能和可应用于海思35XX系列芯片设备的技能。平台不仅支持使用技能模板快速开发技能,便捷高效;还支持自行开发模型和逻辑代码,可以满足您更丰富的场景。 运行在海思35XX系列芯片的技能对内存和性能的要求比较高,针对适用于此类设备的技能需要对模型进行优化后才能运行,若需要开发此类技能,请联系华为工程师。 图1 技能开发的不同场景
  • 新建可训练技能的流程 ModelArts Pro控制台提供可训练技能工作流,使用可训练技能模板在ModelArts Pro控制台自主上传数据训练模型,无需代码,即可快速提高模型精度,创建技能,并且一键部署至设备。 使用可训练技能模板新建技能,仅支持训练模型提高模型精度,暂不支持修改技能模板的逻辑代码。如果您希望自行修改技能的逻辑代码,可以选择在华为HiLens控制台开发技能,详情请见控制台开发技能。 在开发可训练技能时,会占用OBS资源,需要收取一定费用,收费规则请参见对象存储服务 OBS。 在开发可训练技能时,会占用ModelArts的训练资源,需要收取一定费用,收费规则请参见ModelArts价格详情。 新建可训练技能的详细流程如图2所示。 图2 可训练技能开发流程 表1 新建可训练技能常用操作指引 步骤 说明 快速跳转至详细指导 连接端侧和云侧 首先,连接您购买的HiLens Kit,并将HiLens Kit注册到华为HiLens平台,连接端侧与云侧。 HiLens Kit注册流程 智能边缘系统注册设备 使用SSH注册设备 新建可训练技能(使用可训练技能模板) 基于预置的可训练技能新建技能,填写技能的基本信息。 新建可训练技能 开发技能(HiLens安全帽检测技能) 根据工作流指引,开发安全帽检测技能,通过上传训练数据,训练生成安全帽检测模型,自主更新和调整模型精度,实现高精度的安全帽检测功能,并一键安装技能至HiLens Kit设备。 HiLens安全帽检测技能 启动技能 把技能安装至设备后,可以直接启动技能。 启动或停止技能
  • 如何获取驱动 不同类型的关系数据库,需要适配不同类型的驱动。注意,上传的驱动版本不必与待连接的数据库版本相匹配,直接参考表1获取建议版本的JDK8 .jar格式驱动即可。 表1 获取驱动 关系数据库类型 驱动名称 获取地址 建议版本 云数据库 MySQL MySQL MYSQL https://downloads.mysql.com/archives/c-j/ 5.1.48版本,获取mysql-connector-java-5.1.48.jar Oracle ORACLE_6 ORACLE_7 ORACLE_8 驱动包下载地址:https://www.oracle.com/database/technologies/appdev/jdbc-downloads.html 历史版本驱动包下载地址:https://repo1.maven.org/maven2/com/oracle/database/jdbc/ ojdbc8的12.2.0.1版本,获取ojdbc8.jar 说明: 不支持使用新版本(如Oracle Database 21c (21.3) drivers),会导致创建作业时无法获取模式名。 云数据库 PostgreSQL PostgreSQL POSTGRESQL https://mvnrepository.com/artifact/org.postgresql/postgresql PostgreSQL推荐使用42.3.4版本,获取postgresql-42.3.4.jar 金仓数据库 POSTGRESQL https://mvnrepository.com/artifact/org.postgresql/postgresql 金仓数据库推荐使用42.2.9版本PostgreSQL驱动,获取postgresql-42.2.9.jar GaussDB数据库 POSTGRESQL GaussDB JDBC驱动请在GaussDB官方文档中搜索“JDBC包、驱动类和环境类”,然后选择实例对应版本的文档,参考文档获取gsjdbc4.jar。 请从对应版本的发布包中获取gsjdbc4.jar 云数据库 SQL Server Microsoft SQL Server SQLServer https://docs.microsoft.com/en-us/sql/connect/jdbc/release-notes-for-the-jdbc-driver?view=sql-server-ver15#previous-releases 4.2版本,获取sqljdbc42.jar
  • 操作场景 当您确认不再使用当前集群后,可以删除当前CDM集群。 删除CDM集群后集群以及数据都销毁且无法恢复,请您谨慎操作! 删除集群前,请您确认如下注意事项: 待删除集群确认已不再使用,且其中的连接和作业数据您已通过批量管理作业中的导出作业功能进行备份。 对于购买DataArts Studio服务时系统赠送的CDM集群,非常不建议您进行删除操作。该集群删除后无法再次赠送,只能另外购买。 删除集群后,CDM集群不再按需计费或扣除套餐时长。如果您为删除的CDM集群购买了CDM折扣套餐或包年包月形式的DataArts Studio数据集成增量包,则请参考云服务退订章节进行套餐包退订。
  • 创建CDM集群并绑定EIP 如果是独立CDM服务,参考创建集群创建CDM集群;如果是作为DataArts Studio服务CDM组件使用,参考创建集群创建CDM集群。 关键配置如下: CDM集群的规格,按待迁移的数据量选择,一般选择cdm.medium即可,满足大部分迁移场景。 CDM集群所在VPC、子网、安全组,选择与MRS集群所在的网络一致。 CDM集群创建完成后,选择集群操作列的“绑定弹性IP”,CDM通过EIP访问MRS HDFS。 图1 集群列表 如果用户对本地数据源的访问通道做了SSL加密,则CDM无法通过弹性IP连接数据源。
共100000条