华为云用户手册

  • 续费相关的功能 包年/包月实例续费相关的功能如表1所示。 表1 续费相关的功能 功能 说明 手动续费 包年/包月GaussDB实例从购买到被自动删除之前,您可以随时在云数据库GaussDB控制台为实例续费,以延长实例的使用时间。 自动续费 开通自动续费后,GaussDB实例会在每次到期前自动续费,避免因忘记手动续费而导致资源被自动删除。 在一个包年/包月GaussDB实例生命周期的不同阶段,您可以根据需要选择一种方式进行续费,具体如图 GaussDB实例生命周期所示。 图1 GaussDB实例生命周期 GaussDB实例从购买到到期前,处于正常运行阶段,资源状态为“运行中”。 到期后,资源状态变为“已过期”。 到期未续费时,GaussDB实例首先会进入宽限期,宽限期到期后仍未续费,资源状态变为“已冻结”。 超过宽限期仍未续费将进入保留期,如果保留期内仍未续费,资源将被自动删除。 华为云根据客户等级定义了不同客户的宽限期和保留期时长。 在GaussDB实例到期前均可开通自动续费,到期前7日凌晨3:00首次尝试自动续费,如果扣款失败,每天凌晨3:00尝试一次,直至GaussDB实例到期或者续费成功。到期前7日自动续费扣款是系统默认配置,您也可以根据需要修改此扣款日。
  • 计费说明 云数据库GaussDB的计费项由GaussDB实例费用、存储空间费用、备份空间费用和公网带宽费用组成。具体内容如表1所示。 标 * 的计费项为必选计费项。 表1 云数据库GaussDB计费项 计费项 计费项说明 适用的计费模式 计费公式 * 数据库实例 计费因子:vCPU和内存,不同规格的实例类型提供不同的计算和存储能力。 包年/包月、按需计费 实例单个节点对应时长单价 * 购买时长 * 收费节点的数量 单个节点单价与实例规格相关,请参见云数据库GaussDB价格详情中的“GaussDB价格”。 说明: 收费节点的数量 = CN的个数 + DN的个数。 独立部署:以默认配置3分片,3副本,3个协调节点(CN)为例,1个分片,3副本有3个DN,则3个分片共有9个DN,则收费节点的数量为 3 + 9 = 12。 高可用(1主2备):一主两备共计3个DN,则收费节点的数量为 3 。 * 存储空间 计费因子:存储类型和存储空间,按统一标准进行计费。 包年/包月、按需计费 存储空间对应时长单价 * 购买时长 * 存储容量(GB) 存储空间单价请参见云数据库GaussDB价格详情中的“存储空间价格”。 备份空间 计费因子:备份空间,按统一标准进行计费。 按需计费 备份空间单价 * 计费时长 * ( 备份容量 - 存储容量)(GB) 备份空间单价请参见云数据库GaussDB价格详情中的备份空间计费信息”。 说明: 计费时长:备份超过免费空间大小的使用时长。 公网带宽 如有互联网访问需求,您需要购买弹性公网IP。 计费因子:带宽费、流量费和IP保有费。 包年/包月计费模式支持按带宽计费方式,收取带宽费。 按需计费模式支持按带宽计费、按流量计费和加入共享带宽三种计费方式,分别收取带宽费+IP保有费、流量费+IP保有费、带宽费+IP保有费。 包年/包月、按需计费 带宽费支持使用带宽加油包抵扣,流量费支持使用共享流量包抵扣。 按固定带宽值采用阶梯计费 0Mbit/s~5Mbit/s(含):均为一个统一的单价 大于5Mbit/s:按每Mbit/s计费 公网带宽单价请参见弹性云服务器价格详情中的“带宽价格”,或者弹性公网IP价格详情。
  • 计费周期 按需计费GaussDB数据库按秒计费,每一个小时整点结算一次费用(以UTC+8时间为准),结算完毕后进入新的计费周期。计费的起点以GaussDB实例创建成功的时间点为准,终点以实例删除时间为准。 GaussDB实例从创建到启动需要一定时长,计费的起点是创建成功的时间点,而非创建时间。 例如,您在8:45:30购买了一台按需计费的GaussDB实例,相关资源包括计算资源(vCPU和内存)、数据库存储,然后在8:55:00将其删除,则计费周期为8:00:00 ~ 9:00:00,在8:45:30 ~ 8:55:30间产生费用,该计费周期内的计费时长为600秒。
  • 变更配置后对计费的影响 如果您在购买按需计费实例后变更了实例配置,会产生一个新订单并开始按新配置的价格计费,旧订单自动失效。 如果您在一个小时内变更了实例配置,将会产生多条计费信息。每条计费信息的开始时间和结束时间对应不同配置在该小时内的生效时间。 例如,您在9:00:00购买了一台按需计费实例,实例规格为 8 vCPUs 64GB,并在9:30:00升配为 16 vCPUs 128GB,那么在9:00:00 ~ 10:00:00间会产生两条计费信息。 第一条对应9:00:00 ~ 9:30:00,实例规格按照 8 vCPUs 64GB计费。 第二条对应9:30:00 ~ 10:00:00,实例规格按照 16 vCPUs 128GB计费。
  • 计费示例 假设您在2023/04/18 9:59:30购买了一台按需计费的GaussDB实例(分布式版、通用增强Ⅱ型、8 vCPUs 64 GB 、 1分片 、 3副本、1个协调节点,160GB存储空间),计费资源包括实例规格(vCPU、内存、节点数量)、存储空间和备份空间,然后在2023/04/18 10:45:46将其删除,则: 第一个计费周期为2023/04/18 9:00:00 ~ 2023/04/18 10:00:00 2023/04/18 9:59:30 ~ 2023/04/18 10:00:00期间产生费用,该计费周期内的计费时长为30秒。 第二个计费周期为2023/04/18 10:00:00 ~ 2023/04/18 11:00:00 2023/04/18 10:00:00 ~ 2023/04/18 10:45:46期间产生费用,该计费周期内的计费时长为2746秒。 2023/04/18 10:00:00 ~ 2023/04/18 10:45:00期间,使用免费备份空间。 2023/04/18 10:45:00 ~ 2023/04/18 10:45:46期间,使用计费备份空间10GB,计费时长46秒。 图 按需计费GaussDB费用计算示例给出了上述示例配置的费用计算过程。 图中价格仅供参考,实际计算请以云数据库GaussDB价格详情中的价格为准。 在按需付费模式下,价格计算器上的金额如果遇小数点,则保留小数点后两位,第三位四舍五入。如遇四舍五入后不足¥0.01,则按¥0.01展示。 图2 按需计费GaussDB费用计算示例
  • 适用计费项 按需计费包含以下计费项。 表1 使用计费项 计费项 说明 数据库实例 GaussDB实例对CN、DN节点进行收费;管理节点CMS、GTM不收费。 数据库存储(使用后扣费) 对数据库存储空间进行计费,按需计费的存储空间费用按照实际使用量每小时计费。 备份存储(使用后扣费) GaussDB提供了部分免费存储空间,用于存放您的备份数据,其总容量约为您购买存储容量的100%。 备份存储用量超过数据库存储空间的100%,超出部分将按照备份计费标准收费,计费方式为按需计费(每小时扣费一次),不足一小时按照实际使用时长收费。 公网带宽(可选) GaussDB实例支持公网访问,公网访问会产生带宽流量费;GaussDB数据库实例在云内部网络产生的流量不计费。 假设您计划购买规格为通用增强Ⅱ型 8 vCPUs 64GB、1分片、3副本、1个协调节点,存储空间为160GB的分布式版云数据库GaussDB。在购买页面底部,您将看到所需费用,如图 配置费用示例(不包含备份空间费用)所示。 图1 配置费用示例 备份空间费用,使用后按照统一标准计费,购买时不包含在配置费用中,可通过价格计算器的“价格详情”页签查看计费标准。
  • 约束与限制 按需计费云数据库绑定的资源(弹性公网IP)可能不支持随实例同步变更计费模式,请参考表1查看绑定资源的计费规则及处理措施。 表1 弹性公网IP计费模式变更规则 计费方式 带宽类型 是否支持随GaussDB按需转包年/包月 处理措施 按带宽计费 独享带宽 否 在控制台的弹性公网IP页面进行按需转包年/包月操作。 详细内容,请参见变更弹性公网IP计费方式。 按流量计费 独享带宽 否 按需、按流量计费EIP不支持直接转为包年/包月EIP。变更方法如下: 先转为按需、按带宽计费的EIP。 再由按需、按带宽计费EIP转为包年/包月EIP。 详细内容,请参见变更弹性公网IP计费方式。
  • 适用计费项 包年/包月包含以下计费项。 表1 适用计费项 计费项 说明 数据库实例 GaussDB实例对CN、DN节点进行收费,管理节点CMS、GTM不收费。 数据库存储 对数据库存储空间进行计费,包年/包月计费方式的存储空间如果超过当前容量,超出的部分将按需计费。 备份存储(可选) GaussDB提供了部分免费存储空间,用于存放您的备份数据,其总容量约为您购买存储容量的100%。 备份存储用量超过数据库存储空间的100%,超出部分将按照备份计费标准收费,计费方式为按需计费(每小时扣费一次),不足一小时按照实际使用时长收费。 公网带宽 GaussDB实例支持公网访问,公网访问会产生带宽流量费;GaussDB数据库实例在云内部网络产生的流量不计费。 假设您计划购买规格为8 vCPUs 64GB、1分片、3副本、1个协调节点,存储空间为160GB的分布式版云数据库GaussDB,购买周期为一个月。在购买数据库实例页面底部,您将看到所需费用,如图1所示。 图1 配置费用示例 备份空间费用,使用后按照统一标准计费,购买时不包含在配置费用中,可通过价格计算器查看。
  • 适用场景 包年/包月计费模式需要用户预先支付一定时长的费用,适用于长期、稳定的业务需求。以下是一些适用于包年/包月计费模式的业务场景: 稳定业务需求:对于长期运行且资源需求相对稳定的业务,如企业官网、在线商城、博客等,包年/包月计费模式能提供较高的成本效益。 长期项目:对于周期较长的项目,如科研项目、大型活动策划等,包年/包月计费模式可以确保在整个项目周期内资源的稳定使用。 业务高峰预测:如果能预测到业务高峰期,如电商促销季、节假日等,可提前购买包年/包月资源以应对高峰期的需求,避免资源紧张。 数据安全要求高:对于对数据安全性要求较高的业务,包年/包月计费模式可确保资源的持续使用,降低因资源欠费而导致的数据安全风险。
  • 计费示例 假设您在2023/03/08 15:50:04购买了一个包年/包月的GaussDB数据库实例(规格:分布式版 通用增强Ⅱ型 8 vCPUs 64 GB、 1分片 、 3副本、1个协调节点,160GB存储空间),计费资源包括实例规格(vCPU、内存、节点数量)、存储空间、备份空间、公网带宽。购买时长为一个月,并在到期前手动续费1个月,则: 第一个计费周期为:2023/03/08 15:50:04 ~ 2023/04/08 23:59:59 第二个计费周期为:2023/04/08 23:59:59 ~ 2023/05/08 23:59:59 2023/04/08 23:59:59~2023/05/01 23:59:59期间,使用免费备份空间60GB。 2023/05/01 23:59:59~2023/05/08 23:59:59期间,使用计费备份空间10GB,计费时长168小时。 图 包年/包月GaussDB费用计算示例给出了上述示例配置的费用计算过程。 图中价格仅供参考,实际计算请以云数据库GaussDB价格详情中的价格为准。 图2 包年/包月GaussDB费用计算示例
  • 到期后影响 图 包年/包月GaussDB资源生命周期描述了包年/包月GaussDB数据库各个阶段的状态。购买后,在计费周期内数据库正常运行,此阶段为有效期;资源到期而未续费时,将陆续进入宽限期和保留期。 图3 包年/包月GaussDB资源生命周期 到期预警 包年/包月GaussDB数据库在到期前第7天内,系统将向用户推送到期预警消息。预警消息将通过邮件、短信和站内信的方式通知到华为云帐号的创建者。 到期后影响 当您的包年/包月GaussDB数据库到期未续费,首先会进入宽限期,资源状态变为“已过期”。宽限期内您可以正常访问数据库,但以下操作将受到限制: 变更实例规格 包年/包月转按需 退订 如果您在宽限期内仍未续费包年/包月GaussDB数据库,那么就会进入保留期,资源状态变为“已冻结”,您将无法对处于保留期的包年/包月资源执行任何操作。 保留期到期后,若包年/包月GaussDB数据库仍未续费,那么实例将被释放,数据无法恢复。 华为云根据客户等级定义了不同客户的宽限期和保留期时长。 关于续费的详细介绍请参见续费概述。
  • 变更配置后对计费的影响 当前包年/包月GaussDB资源的规格不满足您的业务需要时,您可以在管理制台发起变更规格操作,变更时系统将按照如下规则为您计算变更费用: 资源升配:新配置价格高于老配置价格,此时您需要支付新老配置的差价。 资源降配:新配置价格低于老配置价格,此时华为云会将新老配置的差价退给您。 资源降配会影响云数据库性能,通常不建议您这样操作。这里以资源升配且无任何优惠的场景为例,假设您在2023/04/08购买了一个包年/包月GaussDB数据库(主备版 8 vCPUs 64 GB),购买时长为1个月,计划在2023/04/18变更规格为16 vCPUs 128GB。旧配置价格为31,728 元/月,新配置价格为61,728 元/月。计算公式如下: 升配费用=新配置价格*剩余周期-旧配置价格*剩余周期 公式中的剩余周期为每个自然月的剩余天数/对应自然月的最大天数。本示例中,剩余周期=12(4月份剩余天数)/ 30(4月份最大天数)+ 8(5月份剩余天数)/ 31(5月份最大天数)=0.6581,代入公式可得升配费用=61728*0.6581-31728*0.6581=19743(元)。 更多信息请参见变更资源规格费用说明。
  • 成本分配 成本管理的基础是树立成本责任制,让各部门、各业务团队、各责任人参与进来,为各自消耗云服务产生的成本负责。企业可以通过成本分配的方式,将云上成本分组,归集到特定的团队或项目业务中,让各责任组织及时了解各自的成本情况。 华为云成本中心支持通过多种不同的方式对成本进行归集和重新分配,您可以根据需要选择合适的分配工具。 通过关联账号进行成本分配 企业主客户可以使用关联账号对子客户的成本进行归集,从而对子账号进行财务管理。详细介绍请参见通过关联账号维度查看成本分配。 通过企业项目进行成本分配 在进行成本分配之前,建议开通企业项目并做好企业项目的规划,可以根据企业的组织架构或者业务项目来划分。在购买云资源时选择指定企业项目,新购云资源将按此企业项目进行成本分配。详细介绍请参见通过企业项目维度查看成本分配。 图2 为云数据库选择企业项目 通过成本标签进行成本分配 标签是华为云为了标识云资源,按各种维度(例如用途、所有者或环境)对云资源进行分类的标记。推荐企业使用预定义标签进行成本归集,具体流程如下: 图3 为云数据库添加标签 详细介绍请参见通过成本标签维度查看成本分配。 使用成本单元进行成本分配 企业可以使用成本中心的“成本单元”来拆分公共成本。公共成本是指多个部门共享的计算、网络、存储或资源包产生的云成本,或无法直接通过企业项目、成本标签分配的云成本。这些成本不能直接归属于单一所有者,因此不能直接归属到某一类别。使用拆分规则,可以在各团队或业务部门之间公平地分配这些成本。详细介绍请参见使用成本单元查看成本分配。
  • 成本优化 成本控制 企业可以在成本中心的“预算管理”页面创建精细粒度的预算来管理成本和使用量,在实际或预测超过预算阈值时,自动发送通知给指定消息接收人。企业还可以创建预算报告,定期将指定预算进展通知给指定消息接收人。 例如企业需要创建一个云数据库的按需成本预算,每月预算金额为2000元,当预测金额高于预算金额的80%时发送预算告警。那么,创建的预算如下: 图4 预算基本信息 图5 设置成本范围 图6 设置提醒 详细介绍请参见使用预测和预算来跟踪成本和使用量。 资源优化 成本中心可以通过监控云数据库的历史消费情况和CPU使用率,为客户提供云数据库资源的空闲识别和优化建议,寻找节约成本的机会。您还可以根据成本分析阶段的分析结果识别成本偏高的资源,通过云监控服务监控资源的使用情况,确定成本偏高的原因,然后采取针对性的优化措施。 监控资源利用率,评估当前配置是否过高。例如:CPU、内存、云硬盘、带宽等资源的利用率。 监控闲置的资源,避免浪费。例如:未挂载的云硬盘、未绑定的EIP等。 计费模式优化 不同类型的业务对资源使用周期有不同的要求,为每一类业务确定合适的计费模式,灵活组合以达到最优效果。 针对长期稳定的成熟业务,使用包年/包月计费模式。 针对不能中断的短期、突增或不可预测的业务,使用按需计费模式。
  • 自动高性能算子生成工具AKG AKG(Auto Kernel Generator)对深度神经网络中的算子进行优化,并提供特定模式下的算子自动融合功能。提升在昇腾硬件后端上运行网络的性能。 AKG由三个基本的优化模块组成:规范化、自动调度和后端优化。 规范化: 为了解决polyhedral表达能力的局限性(只能处理静态的线性程序),需要首先对计算公式IR进行规范化。规范化模块中的优化主要包括自动运算符inline、自动循环融合和公共子表达式优化等。 自动调度: 自动调度模块基于polyhedral技术,主要包括自动向量化、自动切分、thread/block映射、依赖分析和数据搬移等。 后端优化: 后端优化模块的优化主要包括TensorCore使能、双缓冲区、内存展开和同步指令插入等。
  • 模型精度调优 本小节通过一个具体问题案例,介绍模型精度调优的过程。 如下图所示,使用MindSpore Lite生成的图像和onnx模型的输出结果有明显的差异,因此需要对MindSpore Lite pipeline进行精度诊断。 图1 结果对比 在MindSpore Lite 2.0.0版本中,Stable Diffusion的五个模型的精度都能够保证一致性,但是在最新的2.1.0版本中,会出现text_encoder模型精度不一致的情况。该问题后续会发布补丁进行修复。 精度问题诊断 精度问题处理 父主题: AIGC推理业务迁移指导
  • 准备数据 本案例需要的数据集介绍。 人车检测数据集 用于物体检测,包含150张未标注样本 数据集一共包含两类:行人,车辆 创建OBS桶 OBS可以简单的理解成一个在线网盘,因为ModelArts本身目前没有数据存储的功能,所以需要从OBS里调用ModelArts上传的数据进行训练,进入OBS控制台,进入后单击右上角“创建桶”按钮。进入新建桶界面, 按照如下示例进行填写: 区域:华北-北京一 数据冗余存储策略:单AZ存储 桶名称:自定义,需要全局唯一,即在整个华为云上的名字唯一。 其它选项保持默认即可 图3 填写桶参数 填写完成后,单击右下角的“立即创建”按钮并确认,稍等几秒钟即可完成 OBS桶的创建。 导入数据 单击访问下载页面《人车检测数据集》,单击“下载”。 图4 下载数据集 下载方式:ModelArts数据集。 目标区域: 华北-北京一。 数据类型:根据实际情况选择该数据集的数据类型,例如该案例选择图片类型。 数据集输出位置:据集输出位置的OBS路径,此位置会存放输出的标注信息等文件,此位置不能和OBS数据源中的文件路径相同或为其子目录。 数据集输入位置:AI Gallery的数据集下载到OBS的路径,此位置会作为数据集的数据存储路径,数据集输入位置不能和输出位置相同。 名称:默认生成“data-xxxx”形式的数据集名称,该数据集会同步在ModelArts数据集列表中。 描述:可以添加对于该数据集的相关描述。 图5 参数填写 确认目标位置选择正确后,单击 “确定” 开始启动数据集下载并进入下载列表,查看下载进度。 图6 查看下载进度 此页面需要自己手动刷新页面查看最新下载进度,因数据集较大,下载预计要花费3~5分钟左右。 此处下载完成后,并不代表数据集完全创建成功,回到数据集管理页面,可以看到此处自动创建了一个数据集,并且正在运行中,我们需要等待它导入完成。 图7 等待数据集导入完成
  • 设置高精度并重新转换模型 在转换模型时,默认采用的精度模式是fp16,如果转换得到的模型和标杆数据的精度差异比较大,可以使用fp32精度模式提升模型的精度(这块无需全换成fp32,fp32相对于fp16性能较差,所以一般检测出来哪个模型精度有问题时,再尝试是否用fp32)。使用fp32精度模式的配置文件如下: 配置文件: # config.ini [ascend_context] precision_mode=enforce_fp32 #使用 fp32
  • 训练网络迁移总结 确保算法在GPU训练时,持续稳定可收敛。避免在迁移过程中排查可能的算法问题,并且要有好的对比标杆。如果是NPU上全新开发的网络参考Pytorch迁移精度调优,排查溢出和精度问题。 理解GPU和NPU的构造以及运行的差别,有助于在迁移过程中问题分析与发挥NPU的能力。由于构造和运行机制的差别,整个迁移过程并非是完全平替,GPU在灵活性上是有其独特的优势的,而NPU上的执行目前还是依赖于算子的下发,对于NPU构造的理解是昇腾训练迁移中必备的知识,只有对于昇腾有基础理解,配合一些诊断工具,面对复杂问题时,才能进行进一步诊断与定位,进而发挥NPU的能力。 性能调优可以先将重点放在NPU不亲和的问题处理上,确保一些已知的性能问题和优化方法得到较好的应用。通用的训练任务调优、参数调优可以通过可观测数据来进行分析与优化,一般来说分段对比GPU的运行性能会有比较好的参考。算子级的调优某些情况下如果是明显的瓶颈或者性能攻坚阶段,考虑到门槛较高,可以联系华为工程师获得帮助。 精度诊断过程当前确实门槛较高,一般还是需要GPU上充分稳定的网络(包含混合精度)再到NPU上排查精度问题。常见的精度调测手段,包含使用全精度FP32,或者关闭算子融合开关等,先进行排查。对于精度问题,系统工程人员需要对算法原理有一定的理解,仅从工程角度分析有时候会非常受限,同时也可联系华为工程师进行诊断与优化。 父主题: 训练业务昇腾迁移通用指导
  • 使用精度对比工具ait debug compare 在模型转换场景,误差的累积和算子溢出等都可能导致转换后的模型存在误差。当识别到模型误差较大时,可以使用一键式全流程精度比对工具ait debug compare对比转换前的onnx模型和转换后的OM模型。 使用该工具对比onnx模型和OM模型,指定onnx模型路径、 OM模型路径、生成文件的路径以及模型输入shape的信息。其中,-o表示对比结果的保存路径,需要是一个已经存在的路径。 #shell ait debug compare -gm ./model.onnx -om ./text_encoder.om -o ./ --input-shape "input_ids:1,77" 执行成功后,会在指定输出目录下输出{timestamp}文件夹,打开对应的文件夹,可以看到result_{timestamp}.csv文件,该文件统计了各个图算子在推理过程中的日志信息。具体各个字段代表的含义可以参考昇腾整网对比文档。 排查精度问题时可以通过检索.csv文件中CosineSimilarity(余弦相似度)和MaxAbsoluteError(最大绝对误差)两列的信息定位第一个发生突变的算子。一般认为余弦相似度小于0.99时算子的精度有偏差,这种情况表明:该突变行对应的Ascend算子和onnx算子的执行结果存在较大差异,从而将排查重点锁定在对应的算子上。 如下图所示,最大绝对误差在Trilu_233这个算子处发生突变(溢出)。如果用户对模型比较了解,可以继续排查模型网络中使用这个算子的地方,否则需要向华为工程师求助。 图3 误差分析 该算子精度问题是由MindSpore Lite 2.1.0版本引入,在华为工程师修复该问题后,端到端的pipeline模型的输出能够对齐。 图4 修复后推理结果
  • 模型转换报错如何查看日志和定位? 通过如下的配置项打开对应的模型转换日志,可以看到更底层的报错。如配置以下的环境变量之后,再重新转换模型,导出对应的日志和dump图进行分析: 报错日志中搜到“not support onnx data type”,表示MindSpore暂不支持该算子。 报错日志中搜到“Convert graph to om failed”,表示CANN模块进行图编译存在保存,需要结合CANN的报错日志和dump图进行具体分析。 配置方式参考如下: 打开DEBUG日志。 设置MindSpore日志环境变量。 export GLOG_v=0 # 0-DEBUG、1-INFO、2-WARNING、3-ERROR 设置CANN日志环境变量。 # 0:表示DEBUG。1:表示INFO。2:表示WARNING。3:表示ERROR。4: 表示NONE。 export ASCEND_GLOBAL_LOG_LEVEL=1 # 表示日志打印 export ASCEND_SLOG_PRINT_TO_STDOUT=1 DUMP模型转换中间图。 设置DUMP中间图环境变量。 # 1:表示dump图全量内容。2:表示不dump权重数据的基础图。3:表示只dump节点关系的精简图。 export DUMP_GE_GRAPH=2 # 1:表示dump图所有图。2:表示dump除子图外的所有图。3:表示只dump最后一张图。 export DUMP_GRAPH_LEVEL=2 父主题: 常见问题
  • 相关操作 关闭TensorBoard方式如下: 方式1:单击下图所示的,进入TensorBoard实例管理界面,该界面记录了所有启动的TensorBoard实例,单击对应实例后面的SHUT DOWN即可停止该实例。 图8 单击SHUT DOWN停该实例 方式2:在开发环境JupyterLab中的.ipynb文件窗口中输入命令,关闭 TensorBoard。PID在启动界面有提示或者通过 ps -ef | grep tensorboard 查看。 !kill PID 方式3:单击下方红框中的按钮可以关闭所有启动的TensorBoard实例。 图9 关闭所有启动的TensorBoard实例 方式4(不推荐):直接在JupyterLab中上关闭TensorBoard窗口,此方式仅关闭可视化窗口,并未关闭后台。
  • Ascend应用样例列表(高阶教程) 针对支持使用Ascend应用的算法,本文档提供了如下几个操作样例,您可以参考如下典型样例,使用ModelArts提供的预置算法(训练管理或AI Gallery),支撑您的业务应用。 表10 Ascend样例列表 样例 镜像 对应功能 场景 说明 开源大模型基于ModelArts的一键推理部署 MindSpore Ascend推理 开源大模型推理部署 此案例介绍如何从AI Gallery中订阅LLaMA系列和ChatGLM系列开源大模型,并在ModelArts上使用昇腾算力进行推理部署。 LLaMA系列模型基于ModelArts的全参数微调训练 MindSpore 订阅算法(AI Gallery)、Ascend训练、Ascend推理 LLaMA系列开源大模型全参微调训练 此案例介绍如何从AI Gallery中订阅LLaMA系列开源大模型算法,并在ModelArts上使用昇腾算力进行微调训练,最终将模型部署为在线服务。 ChatGLM系列模型基于ModelArts的全参微调训练 MindSpore MindSpore 订阅算法(AI Gallery)、Ascend训练、Ascend推理 ChatGLM系列开源大模型全参微调训练 此案例介绍如何从AI Gallery中订阅ChatGLM系列开源大模型算法,并在ModelArts上使用昇腾算力进行微调训练,最终将模型部署为在线服务。 推理业务昇腾迁移通用指导 MindSpore 模型迁移、Ascend推理部署 推理业务迁移 此案例介绍如何将客户已有的推理业务迁移到ModelArts上,使用昇腾算力进行推理部署。
  • AOE的自动性能调优使用上完全没有效果怎么办? 在MindSpore Lite Convertor2.1版本之前可能出现的调优不生效的场景,建议直接使用MindSpore Lite Convertor2.1及以后的版本。配置文件指定选项进行AOE调优。使用转换工具配置config参数,具体如下所示,其中”subgraph tuning”表示子图调优,”operator tuning”表示算子调优。 其中,“ge.op_compiler_cache_mode”在该场景下必须设置为“force”, 表明该场景下要强制刷新缓存,保证AOE调优后的知识库能够命中,实现模型调优。示例如下: # config.ini [ascend_context] aoe_mode="subgraph tuning, operator tuning" [acl_init_options] ge.op_compiler_cache_mode="force" 父主题: 常见问题
  • LoRA适配流是怎么样的? 因为现在pytorch-npu推理速度比较慢(固定shape比mindir慢4倍),在现在pth-onnx-mindir的模型转换方式下,暂时只能把lora合并到unet主模型内,在每次加载模型前lora特性就被固定了(无法做到pytorch每次推理都可以动态配置的能力)。 目前临时的静态方案可参考sd-scripts, 使用其中的“networks/merge_lora.py”把lora模型合入unet和text-encoder模型。 父主题: 常见问题
  • Stable Diffusion WebUI如何适配? WebUI一般可以分为前端和后端实现两部分,后端的实现模式种类多样,并且依赖了多个的第三方库,当前在WebUI适配时,并没有特别好的方式。在对后端实现比较理解的情况下,建议针对具体的功能进行Diffusers模块的适配与替换,然后针对替换上去的Diffusers,对其pipeline进行昇腾迁移适配,进而替代原有WebUI的功能。针对很多参数以及三方加速库(如xformers)的适配,当前没有特别好的处理方案。 父主题: 常见问题
  • 创建自增序列 使用客户端连接DDM实例。 连接成功后,打开目标逻辑库。 输入命令创建自增序列。 create sequence xxxxx ; xxxxx代表序列名。 建议使用bigint型作为自增键的数据类型。tinyint、smallint、mediumint、integer、int数据类型不建议作为自增键的类型,容易越界造成值重复。 通过“show sequences”命令可查看自增序列的使用率。如果使用率已达到或接近100%,请不要再插入数据,联系DDM客服人员进行处理。
  • 使用限制 此HINT只对SELECT/DML/TRUNCATE语句起作用。 此HINT仅在文本协议下工作,Prepare协议下无法使用。 从3.0.6版本开始,不支持/** 开头的注释。/**被识别为DDM内部hint保留关键字。 从3.0.6版本开始,为保证SQL安全性,确保hint的有效性,针对此类hint加强了内容校验。如果此类语句块中不含有效hint,则会产生语法合法性校验报错, 对应SQL语句将执行失败。
  • 语法限制 不支持使用子查询(相关子查询和非相关子查询)。 UPDATE语句中的where_condition不支持计算表达式及其子查询。 不支持在多表更新中修改广播表(广播表中的列不可出现在 SET 中赋值语句的左侧)。 不支持更新逻辑表的拆分键字段,更新拆分键字段可能导致数据重新分布,DDM 暂不支持。 UPDATE操作不支持datetime(YYYY-MM-DD HH:MM:SS)中“YYYY”取值1582年及之前年份。 UPDATE操作不支持更新拆分键值为DEFAULT关键字。 UPDATE不支持在一个语句中对同一字段重复更新。 UPDATE不支持关联更新拆分键。 不支持含有JSON类型字段的二级拆分表进行带子查询的拆分键更新。 UPDATE不支持自关联更新。 关联更新中,不支持在目标列的赋值语句或表达式中引用其它目标列,将造成更新结果不符合预期。 例如: update tbl_1 a,tbl_2 b set a.name=concat(b.name,'aaaa'),b.name=concat(a.name,'bbbb') on a.id=b.id。 关联更新不支持不带关联条件的Join。
  • 操作步骤 登录分布式数据库中间件控制台。 在“实例管理”页面,选择指定的目标实例,单击实例名称。 在实例基本信息页面,单击“实例信息”模块的“版本回滚”。 图1 版本回滚 在版本回滚弹窗中选单击“立即回滚”。 图2 版本回滚确认 确认无误后单击“是”进行版本回滚。 图3 确认回滚 版本回滚时,实例状态将变为“回滚中”。 图4 版本回滚中 版本回滚完成后,实例状态由“回滚中”变为“运行中”,版本将显示回滚后的版本号。 图5 版本回滚完成
共100000条