文字识别API

OCR API

OCR文字识别功能说明

文字识别api通用表格识别

文字识别api通用表格识别可以识别表格图片上的文字内容,并返回识别的结构化结果。

文字识别api通用文字识别

文字识别api通用文字识别可以识别图片上的文字内容,并返回识别的文字和坐标。

文字识别api网络图片识别

文字识别api网络图片识别可以识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。

文字识别api智能分类识别

文字识别api智能分类识别可以检测定位图片上指定要识别的票证(票据、证件或其他文字载体),并以JSON格式返回识别的结构化结果。

文字识别api手写文字识别

文字识别api手写文字识别可以识别手写文字图片中的文字内容。

文字识别api身份证识别

文字识别api身份证识别可以识别身份证图片中正面与反面的文字内容,并返回识别的文字和坐标。

文字识别api行驶证识别

文字识别api行驶证识别可以识别行驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。

文字识别api驾驶证识别

文字识别api驾驶证识别可以识别驾驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。

文字识别api护照识别

文字识别api护照识别可以识别护照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。

文字识别api银行卡识别

文字识别api银行卡识别可以识别银行卡上的关键文字信息,并以JSON格式返回识别的结构化结果。

文字识别api营业执照识别

文字识别api营业执照识别可以识别营业执照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。

ocr文字识别接口道路运输证识别

ocr文字识别接口道路运输证识别可以识别道路运输证首页中的文字信息,并以JSON格式返回识别的结构化结果。

ocr文字识别接口车牌识别

ocr文字识别接口车牌识别可以识别车牌图片中的车牌信息,并返回其坐标和内容。

ocr文字识别接口名片识别

ocr文字识别接口名片识别可以识别名片图片上的文字信息,并返回识别的结构化结果。支持对多种不同版式名片进行结构化信息提取。

ocr文字识别接口VIN码识别

ocr文字识别接口VIN码识别可以识别图片中的车架号信息,并将识别结果返回给用户。

ocr文字识别接口电子面单识别

ocr文字识别接口电子面单识别可以识别用户上传的电子面单图片中的文字内容,并将识别的结果返回给用户。

ocr文字识别接口道路运输从业资格证识别

ocr文字识别接口道路运输从业资格证识别可以识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。

ocr识别api防疫健康码识别

ocr识别api防疫健康码识别可以识别防疫健康码中的姓名、健康码更新时间、健康码颜色,并将识别的结构化结果返回给用户。

ocr识别api核酸检测记录识别可以支持对全国各地不同版式的核酸检测记录中的4个关键字段进行结构化识别,包括姓名、核酸检测采样时间、检测检测结果更新时间、核酸检测结果(阳性、阴性、未知)。

ocr识别api增值税发票识别

ocr识别api增值税发票识别可以识别增值税发票图片中的文字内容,并返回识别的结构化结果。

ocr识别api发票验真

ocr识别api发票验真可以支持9种增值税发票的信息核验。

ocr识别api机动车销售发票识别可以识别机动车销售发票图片中的文字内容,并返回识别的结构化结果。

ocr识别api出租车发票识别

ocr识别api出租车发票识别可以识别出租车发票中的文字信息,并以JSON格式返回识别的结构化结果。

ocr识别api火车票识别

ocr识别api火车票识别可以识别火车票中的文字信息,并以JSON格式返回识别的结构化结果。

OCR接口定额发票识别可以识别定额发票中的文字信息,并以JSON格式返回识别的结构化结果。

OCR接口车辆通行费发票识别可以识别车辆通行费发票中的关键文字信息,并以JSON格式返回识别的结构化结果。

OCR接口飞机行程单识别可以识别飞机行程单中的文字信息,并以JSON格式返回识别的结构化结果。

OCR接口保险单识别

OCR接口保险单识别可以识别保险单图片上的文字信息,并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。

OCR接口财务报表识别可以识别用户上传的表格图片中的文字内容,并将识别的结果返回给用户。

OCR文字识别功能说明

文字识别api通用表格识别可以识别表格图片上的文字内容,并返回识别的结构化结果。

OCR文字识别功能说明

文字识别api通用文字识别可以识别图片上的文字内容,并返回识别的文字和坐标。

OCR文字识别功能说明

文字识别api网络图片识别可以识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。

OCR文字识别功能说明

文字识别api智能分类识别可以检测定位图片上指定要识别的票证(票据、证件或其他文字载体),并以JSON格式返回识别的结构化结果。

OCR文字识别功能说明

文字识别api手写文字识别可以识别手写文字图片中的文字内容。

OCR文字识别功能说明

文字识别api身份证识别可以识别身份证图片中正面与反面的文字内容,并返回识别的文字和坐标。

OCR文字识别功能说明

文字识别api行驶证识别可以识别行驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。

OCR文字识别功能说明

文字识别api驾驶证识别可以识别驾驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。

OCR文字识别功能说明

文字识别api护照识别可以识别护照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。

OCR文字识别功能说明

文字识别api银行卡识别可以识别银行卡上的关键文字信息,并以JSON格式返回识别的结构化结果。

OCR文字识别功能说明

文字识别api营业执照识别可以识别营业执照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。

OCR文字识别功能说明

ocr文字识别接口道路运输证识别可以识别道路运输证首页中的文字信息,并以JSON格式返回识别的结构化结果。

OCR文字识别功能说明

ocr文字识别接口车牌识别可以识别车牌图片中的车牌信息,并返回其坐标和内容。

OCR文字识别功能说明

ocr文字识别接口名片识别可以识别名片图片上的文字信息,并返回识别的结构化结果。支持对多种不同版式名片进行结构化信息提取。

OCR文字识别功能说明

ocr文字识别接口VIN码识别可以识别图片中的车架号信息,并将识别结果返回给用户。

OCR文字识别功能说明

ocr文字识别接口电子面单识别可以识别用户上传的电子面单图片中的文字内容,并将识别的结果返回给用户。

OCR文字识别功能说明

ocr文字识别接口道路运输从业资格证识别可以识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。

OCR文字识别功能说明

ocr识别api防疫健康码识别可以识别防疫健康码中的姓名、健康码更新时间、健康码颜色,并将识别的结构化结果返回给用户。

OCR文字识别功能说明

ocr识别api核酸检测记录识别可以支持对全国各地不同版式的核酸检测记录中的4个关键字段进行结构化识别,包括姓名、核酸检测采样时间、检测检测结果更新时间、核酸检测结果(阳性、阴性、未知)。

OCR文字识别功能说明

ocr识别api增值税发票识别可以识别增值税发票图片中的文字内容,并返回识别的结构化结果。

OCR文字识别功能说明

ocr识别api发票验真可以支持9种增值税发票的信息核验。

OCR文字识别功能说明

ocr识别api机动车销售发票识别可以识别机动车销售发票图片中的文字内容,并返回识别的结构化结果。

OCR文字识别功能说明

ocr识别api出租车发票识别可以识别出租车发票中的文字信息,并以JSON格式返回识别的结构化结果。

OCR文字识别功能说明

ocr识别api火车票识别可以识别火车票中的文字信息,并以JSON格式返回识别的结构化结果。

OCR文字识别功能说明

OCR接口定额发票识别可以识别定额发票中的文字信息,并以JSON格式返回识别的结构化结果。

OCR文字识别功能说明

OCR接口车辆通行费发票识别可以识别车辆通行费发票中的关键文字信息,并以JSON格式返回识别的结构化结果。

OCR文字识别功能说明

OCR接口飞机行程单识别可以识别飞机行程单中的文字信息,并以JSON格式返回识别的结构化结果。

OCR文字识别功能说明

OCR接口保险单识别可以识别保险单图片上的文字信息,并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。

OCR文字识别功能说明

OCR接口财务报表识别可以识别用户上传的表格图片中的文字内容,并将识别的结果返回给用户。

ocr文字识别使用方法

  • ocr文字识别使用方法第一步:开通服务

    首先,进入文字识别控制台

    然后,在文字识别控制台“总览”页面,选择需要使用的服务,在操作列单击“开通服务”。服务开通成功后,开通状态显示“已开通”。

    OCR开通服务时,计费规则默认为“按需计费”,按需计费时,不使用OCR服务,则不收费。如果您购买了套餐包,套餐包扣减规则请参见计费说明,套餐包购买后暂不支持退款。

    如未开通服务,直接调用OCR API会提示ModelArts.4204报错。

    首先,进入文字识别控制台

    然后,在文字识别控制台“总览”页面,选择需要使用的服务,在操作列单击“开通服务”。服务开通成功后,开通状态显示“已开通”。

    OCR开通服务时,计费规则默认为“按需计费”,按需计费时,不使用OCR服务,则不收费。如果您购买了套餐包,套餐包扣减规则请参见计费说明,套餐包购买后暂不支持退款。

    如未开通服务,直接调用OCR API会提示ModelArts.4204报错。

  • ocr文字识别使用方法第二步:构造请求

    视频教程

    1.请求URI

    请求URI由如下部分组成:{URI-scheme} :// {endpoint} / {resource-path} ? {query-string}

    URI-scheme:表示用于传输请求的协议,当前所有API均采用HTTPS协议。

    endpoint:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的endpoint不同,您可以从终端节点章节查看。例如OCR服务在“华北-北京四”区域的“endpoint”为“ocr.cn-north-4.myhuaweicloud.com”。

    resource-path:资源路径,也即API访问路径。从具体OCR识别API的URI章节获取,例如OCR接口的网络图片识别API的“resource-path”为“v2/{project_id}/ocr/web-image”。

    query-string:查询参数,是可选部分,并不是每个API都有查询参数。查询参数前面需要带一个“?”,形式为“参数名=参数取值”,例如“limit=10”,表示查询不超过10条数据。


    2.请求方法

    HTTP请求方法(也称为操作或动词),它告诉服务你正在请求什么类型的操作。

    GET:请求服务器返回指定资源。

    PUT:请求服务器更新指定资源。

    POST:请求服务器新增资源或执行特殊操作。

    DELETE:请求服务器删除指定资源,如删除对象等。

    HEAD:请求服务器资源头部。

    PATCH:请求服务器更新资源的部分内容。当资源不存在的时候,PATCH可能会去创建一个新的资源。

    例如,OCR接口的网络图片识别URI部分,您可以看到其请求方法为“POST”,则其请求为:

    POST https://ocr.cn-north-4.myhuaweicloud.com/v2/{project_id}/ocr/web-image


    3.请求消息头

    附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。

    Content-Type:消息体的类型(格式),必选,默认取值为“application/json”,有其他取值时会在具体接口中专门说明。

    X-Auth-Token:用户Token,可选,当使用Token方式认证时,必须填充该字段。用户Token请参考认证鉴权。

    添加消息头后的请求如下所示。

    POST https://ocr.cn-north-4.myhuaweicloud.com/v2/{project_id}/ocr/web-image

    Content-Type: application/json

    x-auth-token: MIIaBgYJKoZIhvcNAQcC…


    4.请求消息体

    请求消息体通常以结构化格式发出,与请求消息头中Content-type对应,传递除请求消息头之外的内容。若请求消息体中参数支持中文,则中文字符必须为UTF-8编码。

    每个接口的请求消息体内容不同,也并不是每个接口都需要有请求消息体(或者说消息体为空),GET、DELETE操作类型的接口就不需要消息体,消息体具体内容需要根据具体接口而定。

    例如,对于OCR接口中的网络图片识别接口,您可以从接口的请求部分看到所需的请求参数及参数说明。将消息体加入后的请求如下所示。

    POST https://ocr.cn-north-4.myhuaweicloud.com/v2/{project_id}/ocr/web-image

    Request Header:

    Content-Type: application/json

    X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...

    Request Body:

    {

    "image":"/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAAgABwESAAMAA..."

    }

    到这里为止这个请求需要的内容就具备齐全了,您可以使用curl、Postman或直接编写代码等方式发送请求调用API。

    视频教程

    1.请求URI

    请求URI由如下部分组成:{URI-scheme} :// {endpoint} / {resource-path} ? {query-string}

    URI-scheme:表示用于传输请求的协议,当前所有API均采用HTTPS协议。

    endpoint:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的endpoint不同,您可以从终端节点章节查看。例如OCR服务在“华北-北京四”区域的“endpoint”为“ocr.cn-north-4.myhuaweicloud.com”。

    resource-path:资源路径,也即API访问路径。从具体OCR识别API的URI章节获取,例如OCR接口的网络图片识别API的“resource-path”为“v2/{project_id}/ocr/web-image”。

    query-string:查询参数,是可选部分,并不是每个API都有查询参数。查询参数前面需要带一个“?”,形式为“参数名=参数取值”,例如“limit=10”,表示查询不超过10条数据。


    2.请求方法

    HTTP请求方法(也称为操作或动词),它告诉服务你正在请求什么类型的操作。

    GET:请求服务器返回指定资源。

    PUT:请求服务器更新指定资源。

    POST:请求服务器新增资源或执行特殊操作。

    DELETE:请求服务器删除指定资源,如删除对象等。

    HEAD:请求服务器资源头部。

    PATCH:请求服务器更新资源的部分内容。当资源不存在的时候,PATCH可能会去创建一个新的资源。

    例如,OCR接口的网络图片识别URI部分,您可以看到其请求方法为“POST”,则其请求为:

    POST https://ocr.cn-north-4.myhuaweicloud.com/v2/{project_id}/ocr/web-image


    3.请求消息头

    附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。

    Content-Type:消息体的类型(格式),必选,默认取值为“application/json”,有其他取值时会在具体接口中专门说明。

    X-Auth-Token:用户Token,可选,当使用Token方式认证时,必须填充该字段。用户Token请参考认证鉴权。

    添加消息头后的请求如下所示。

    POST https://ocr.cn-north-4.myhuaweicloud.com/v2/{project_id}/ocr/web-image

    Content-Type: application/json

    x-auth-token: MIIaBgYJKoZIhvcNAQcC…


    4.请求消息体

    请求消息体通常以结构化格式发出,与请求消息头中Content-type对应,传递除请求消息头之外的内容。若请求消息体中参数支持中文,则中文字符必须为UTF-8编码。

    每个接口的请求消息体内容不同,也并不是每个接口都需要有请求消息体(或者说消息体为空),GET、DELETE操作类型的接口就不需要消息体,消息体具体内容需要根据具体接口而定。

    例如,对于OCR接口中的网络图片识别接口,您可以从接口的请求部分看到所需的请求参数及参数说明。将消息体加入后的请求如下所示。

    POST https://ocr.cn-north-4.myhuaweicloud.com/v2/{project_id}/ocr/web-image

    Request Header:

    Content-Type: application/json

    X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...

    Request Body:

    {

    "image":"/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAAgABwESAAMAA..."

    }

    到这里为止这个请求需要的内容就具备齐全了,您可以使用curl、Postman或直接编写代码等方式发送请求调用API。

  • ocr文字识别使用方法第三步:认证鉴权

    调用OCR接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。

    Token认证:通过Token认证调用请求。视频教程

    AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。

    调用OCR接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。

    Token认证:通过Token认证调用请求。视频教程

    AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。

  • ocr文字识别使用方法第四步:返回结果

    请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。状态码是一组数字代码,状态码表示了请求响应的状态,如果调用后返回状态码为2xx,则表示调用成功。对应请求消息头,响应同样也有消息头,如“Content-type”。Content-Length是响应消息体的字节长度,单位为Byte。Date代表系统响应的时间。Content-Type代表响应消息体的MIME类型。响应消息体通常以结构化格式返回,与响应消息头中Content-type对应,传递除响应消息头之外的内容。

    对于OCR接口的网络图片识别接口,返回如下消息体。

    {

    "result": {

    "words_block_count": 2,

    "words_block_list": [

    {

    "words": "文字块1",

    "confidence": 0.9950,

    "location": [

    [13, 476],

    [91, 332],

    [125, 351],

    [48, 494]

    ]

    },

    {

    "words": "文字块2",

    "confidence": 0.9910,

    "location": [

    [13, 476],

    [91, 332],

    [125, 351],

    [48, 494]

    ]

    }

    ],

    "extracted_data": {}

    }

    }

    当接口调用出错时,会返回错误码及错误信息说明,错误响应的Body体格式如下所示。

    {

    "error_code": "AIS.0103",

    "error_msg": "The image size does not meet the requirements."

    }

    其中,error_code表示错误码,error_msg表示错误描述信息。

    请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。状态码是一组数字代码,状态码表示了请求响应的状态,如果调用后返回状态码为2xx,则表示调用成功。对应请求消息头,响应同样也有消息头,如“Content-type”。Content-Length是响应消息体的字节长度,单位为Byte。Date代表系统响应的时间。Content-Type代表响应消息体的MIME类型。响应消息体通常以结构化格式返回,与响应消息头中Content-type对应,传递除响应消息头之外的内容。

    对于OCR接口的网络图片识别接口,返回如下消息体。

    {

    "result": {

    "words_block_count": 2,

    "words_block_list": [

    {

    "words": "文字块1",

    "confidence": 0.9950,

    "location": [

    [13, 476],

    [91, 332],

    [125, 351],

    [48, 494]

    ]

    },

    {

    "words": "文字块2",

    "confidence": 0.9910,

    "location": [

    [13, 476],

    [91, 332],

    [125, 351],

    [48, 494]

    ]

    }

    ],

    "extracted_data": {}

    }

    }

    当接口调用出错时,会返回错误码及错误信息说明,错误响应的Body体格式如下所示。

    {

    "error_code": "AIS.0103",

    "error_msg": "The image size does not meet the requirements."

    }

    其中,error_code表示错误码,error_msg表示错误描述信息。

ocr文字识别接口价格

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

您是否有这些问题?

  • 文字识别OCR按API调用次数进行收费。只有调用成功(返回2xx状态码)才会计算调用次数。

    套餐包价格相比“按需计费”具有更大折扣。API调用次数大时,套餐包更优惠。

  • 计费方式分为按需计费和套餐包计费两种。

    按需计费:文字识别OCR服务开通后,默认为按需计费(按API调用次数计费)。具体计费价格、计费规则请参见文字识别价格详情

    套餐包计费:调用量大、长期使用文字识别OCR服务,建议购买套餐包。套餐包相比按需计费有更大折扣力度。具体计费价格请参见文字识别价格详情

    购买套餐包后,扣费时,优先在套餐包内进行抵扣。超出套餐包额度,自动转回按需计费方式。