一句话识别 ASR

一句话识别服务可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据,系统经过处理,生成语音对应的文字,支持的语言包含中文普通话、方言。


产品优势

高识别率:基于深度学习技术,对特定领域场景的语音识别进行优化,识别率达到业界领先。

• 前沿技术:使用工业界成熟的算法,结合学术界最新研究成果,为企业提供独特竞争力优势。

• 支持热词:针对专业词汇,支持上传至热词表,增加专业词汇的识别准确率。

• 可定制化:针对客户的特定场景需求,定制垂直领域的语音识别模型,识别效果更精确。

一句话识别 ASR 产品特性

  • 效果出众

    使用深度学习技术,语音识别准确率高,在业界具有一定的技术优势

    使用深度学习技术,语音识别准确率高,在业界具有一定的技术优势

  • 稳定可靠

    成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验

    成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验

  • 简单易用

    提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;帮助客户减少人力成本,节省业务支出

    提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;帮助客户减少人力成本,节省业务支出

  • 语音识别

    实时将语音转换成文字,一次性上传整个音频,能快速返回识别结果。

    实时将语音转换成文字,一次性上传整个音频,能快速返回识别结果。

  • 语言支持

    支持中文普通话、带方言口音的普通话以及方言,方言当前支持四川话、粤语和上海话识别。

    支持中文普通话、带方言口音的普通话以及方言,方言当前支持四川话、粤语和上海话识别。

  • 多语音格式支持

    支持11种输入语音格式,包含ulaw、alaw、pcm、mpx、wav等

    支持11种输入语音格式,包含ulaw、alaw、pcm、mpx、wav等

一句话识别 ASR 应用场景

识别准备 响应高效

通过语音发送或者接收短消息时,将音频消息转文字,提升阅读效率和交互体验

语音短消息
语音短消息

搜索内容直接以语音的方式输入,让搜索更加高效。支持各种场景下的语音搜索,比如地图导航、网页搜索等

语音搜索
语音搜索

将游戏娱乐中的语音聊天转成文字消息,提升用户阅读效率和交互体验

游戏娱乐
游戏娱乐

一句话识别ASR 常见问题

一句话识别ASR 常见问题

  • 一句话识别ASR支持哪些语言?

    ▶ 录音文件识别、语音合成支持中文普通话。

    ▶ 一句话识别和实时语音识别支持中文普通话,带方言口音的普通话和方言(四川话、粤语和上海话)。

  • 一句话识别ASR如何收费?

    语音服务收费是按照调用接口的次数或者时长来计算费用,详细收费明细请参见价格计算器。

    ▶支持两种计费方式:

    (1)按需计费,默认计费方式为“按需计费”。

    (2)折扣套餐包方式,是用户可以购买套餐包,扣费时调用次数会先在套餐包内进行抵扣,抵扣完后的剩余调用量默认转回按需计费方式。

  • 一句话识别ASR为什么录音文件识别出现重复转写结果?

    问题现象

    调用录音文件识别接口,识别的结果出现两条完全一致的结果。

    ▶ 解决方案

    由于声道设置的原因,单身道的音频按照双声道处理了。

    在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。

  • 一句话识别ASR如何查看套餐包剩余量、接口调用量?

    查看套餐包余量

    1. 登录控制台

    2. 点击右上角的“资源”按钮,进入资源中心界面。

    3. 选择左边菜单的“我的套餐”,选择购买的套餐包,即可查看套餐包使用量。

    ▶ 查看接口调用量

    1.登录控制台

    2.选择左侧导航栏中的“服务监控”。查看API总调用量、调用成功量、调用失败量。

  • 一句话识别ASR是否支持aac格式的语音文件转文字?

    一句话识别和录音文件识别以及实时语音识别均可实现语音转文字,一句话识别支持aac格式,录音文件识别和实时语音识别不支持aac格式。

  • 一句话识别ASR如何查看当前接口是否免费调用?

    ▶ 问题描述

    如何查看当前服务是否免费,属于公测阶段还是商用阶段?

    ▶ 解决方案

    1.登录华为云,单击右上角的“控制台”,进入“管理控制台”界面。

    2.在左侧服务列表中选择“EI企业智能 > 语音交互服务”。

    3.在语音交互服务主页,单击左侧导航栏子服务名称(如“一句话识别”),查看该服务是否已商用。

    • 当服务处于公测阶段,可以免费使用该服务,但是使用前需要先申请公测。

    • 当服务处于商用阶段,不需要开通服务,可以直接调用,使用该服务需要付费,计费方式详细请参考语音交互价格计算器。

  • 一句话识别ASR需要申请什么权限?

    一句话识别ASR服务本身无权限限制,用户不需要额外添加任何权限,即可对ASR服务执行操作。

    但是如下场景除外:

    当用户需要使用录音文件识别功能时,需要用户具有主帐号或者Security Administrator的权限。

    因为录音文件保存在用户的OBS(Object Storage Service,对象存储服务)桶中。考虑到数据的安全,语音交互服务无法直接获取到用户数据,需要用户授权录音文件引擎读取用户OBS桶权限,只有主帐号或者有Security Administrator权限的子帐号才可以授权。


    说明:主帐号:即在使用语音交互服务前注册的帐号,该帐号具有管理员权限,可执行所有操作。

  • 如何通过主帐号创建一个子帐号?

    一句话识别ASR服务不支持IAM细粒度划分策略,IAM账号与主账号具备相同的操作权限。

    您可以使用IAM的用户管理功能,给员工或应用程序创建IAM用户,可避免分享自己的帐号密码。详细创建步骤请参见创建IAM用户

  • 一句话识别ASR是强制绑定使用OBS进行录音文件存储吗?

    不是,只有录音文件识别需要使用OBS服务,语音交互服务对用户存储在OBS的数据,具有只读权限,没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据,需要用户根据自己的obs桶的使用情况或者容量大小确认,并在OBS服务上执行。