华为云计算 云知识 ModelArts数据管理的功能
ModelArts数据管理的功能

AI开发过程中经常需要处理海量数据,数据准备与标注往往耗费整体开发一半以上时间。ModelArts数据管理提供了一套高效便捷的管理和标注数据框架。不仅支持图片、文本、语音、视频等多种数据类型,涵盖图像分类、目标检测、音频分割、文本分类等多个标注场景,可适用于各种AI项目,如计算机视觉、 自然语言处理 、音视频分析等;同时提供数据筛选、数据分析、数据处理、智能标注、团队标注以及版本管理等功能,AI开发者可基于该框架实现数据标注全流程处理。如图所示。

图1数据标注全流程

ModelArts数据管理的功能

ModelArts数据管理为 数据集 提供聚类分析、数据清洗、数据增强、数据选择、特征分析等处理,可帮助开发者进一步理解数据、筛选数据、挖掘数据信息,从而准备出一份满足开发目标或项目要求的高价值数据。

开发者可利用数据管理提供的各个场景标注工具进行数据标注,也可以选择多种标注方式,包括通过预置算法或用户自定义算法训练得到的模型进行智能标注,仅需少量人工标注和修正则可以得到较准确的标注结果;通过创建团队进行多人合作标注,提升标注效率。满足个人开发者的独立标注、小团队的协作标注,和专业团队的大规模协同标注及项目化管理。

针对大规模团队的标注,提供专业的团队管理、人员管理、数据管理,实现从项目创建、分配、管理、标注、验收全流程。针对个人、小团队、小规模协作标注,提供便捷易用的标注工具,最小化项目管理开销。

此外,标注平台确保用户 数据安全 性,确保用户数据仅在授权范围内使用,标注对象分配策略确保用户数据的隐私性,实现标注数据脱敏需求。

上一篇:入驻华为云云市场人工智能子市场的条件 下一篇:分布式缓存服务实例日常维护

AI开发平台ModelArts 

ModelArts是面向开发者的一站式AI开发平台,为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。