华为云用户手册

  • 请求示例 查询关联实体,最多返回两条结果 https://nlp-ext.cn-north-4.myhuaweicloud.com/v1/1604d8170cd84440a81281e5a3a04f8b/kg/kg-instances/6cdcea01-bac0-48f6-acb5-9385ea3e24ad/entities/8039469283414000536/adjacent-entities?offset=0&limit=2
  • 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 labels 否 Array of strings 实体类型列表。 offset 否 Integer 翻页偏移量,默认为0。 limit 否 Integer 最大返回结果条数,默认为10,最大为100。 conditions 是 conditions object 过滤查询条件。 condition_type 否 String 筛选条件之间的逻辑关系。 缺省值:and 枚举值: and or 表3 conditions 参数 是否必选 参数类型 描述 property_name 否 String 属性名称。 property_value 否 Array of strings 属性值,目前只支持设置一个属性值。
  • 请求示例 过滤查询名称为一条牧羊犬的电影 https://nlp-ext.cn-north-4.myhuaweicloud.com/v1/1604d8170cd84440a81281e5a3a04f8b/kg/kg-instances/6cdcea01-bac0-48f6-acb5-9385ea3e24ad/entities/property-query { "labels" : [ "电影" ], "offset" : 0, "limit" : 1, "conditions" : [ { "property_name" : "name", "property_values" : [ "一条牧羊犬" ] } ] }
  • URI POST /v1/{project_id}/kg/kg-instances/{kg_id}/entities/property-query 表1 路径参数 参数 是否必选 参数类型 描述 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID。
  • 响应示例 状态码: 200 OK { "count" : 1, "entities" : [ { "id" : "-8886811463068384992", "label" : "电影", "properties" : { "上映时间" : [ "1982年4月22日" ], "name" : [ "一条牧羊犬" ], "票房" : [ "34.72亿" ] } } ] }
  • 请求方法 HTTP请求方法(也称为操作或动词),它告诉服务你正在请求什么类型的操作。 GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分内容。当资源不存在的时候,PATCH可能会去创建一个新的资源。 在获取用户Token的URI部分,您可以看到其请求方法为“POST”,则其请求为。 POST https://iam.cn-north-1.myhuaweicloud.com/v3/auth/tokens
  • 请求消息头 附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 如下公共消息头需要添加到请求中。 Content-Type:消息体的类型(格式),必选,默认取值为“application/json”,有其他取值时会在具体接口中专门说明。 X-Auth-Token:用户Token,可选,当使用Token方式认证时,必须填充该字段。用户Token也就是调用获取用户Token接口的响应值,该接口是唯一不需要认证的接口。 公有云API同时支持使用AK/SK认证,AK/SK认证是使用SDK对请求进行签名,签名过程会自动往请求中添加Authorization(签名认证信息)和X-Sdk-Date(请求发送的时间)请求头。 AK/SK认证的详细说明请参见AK/SK认证。 X-Project-ID:子项目ID,可选,在多项目场景中使用。 X-Domain-ID:账号ID。 对于获取用户Token接口,由于不需要认证,所以只添加“Content-Type”即可,添加消息头后的请求如下所示。 POST https://iam.cn-north-1.myhuaweicloud.com/v3/auth/tokens Content-Type: application/json
  • 请求消息体 请求消息体通常以结构化格式发出,与请求消息头中Content-type对应,传递除请求消息头之外的内容。如果请求消息体中参数支持中文,则中文字符必须为UTF-8编码。 每个接口的请求消息体内容不同,也并不是每个接口都需要有请求消息体(或者说消息体为空),GET、DELETE操作类型的接口就不需要消息体,消息体具体内容需要根据具体接口而定。 对于获取用户Token接口,您可以从接口的请求部分看到所需的请求参数及参数说明。将消息体加入后的请求如下所示,加粗的斜体字段需要根据实际值填写,其中username为用户名,domainname为用户所属的账号名称,********为用户登录密码,xxxxxxxxxxxxxxxxxx为project的ID,获取方法请参见获取项目ID。 scope参数定义了Token的作用域,上面示例中获取的Token仅能访问project下的资源。您还可以设置Token作用域为某个账号下所有资源或账号的某个project下的资源,详细定义请参见获取用户Token。 POST https://iam.cn-north-1.myhuaweicloud.com/v3/auth/tokens Content-Type: application/json { "auth": { "identity": { "methods": [ "password" ], "password": { "user": { "name": "username", "password": "********", "domain": { "name": "domainname" } } } }, "scope": { "project": { "id": "xxxxxxxxxxxxxxxxxx" } } } } 到这里为止这个请求需要的内容就具备齐全了,您可以使用curl、Postman或直接编写代码等方式发送请求调用API。对于获取用户Token接口,返回的响应消息头中“x-subject-token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。
  • 请求URI 请求URI由如下部分组成。 {URI-scheme} :// {Endpoint} / {resource-path} ? {query-string} 尽管请求URI包含在请求消息头中,但大多数语言或框架都要求您从请求消息中单独传递它,所以在此单独强调。 URI-scheme:表示用于传输请求的协议,当前所有API均采用HTTPS协议。 Endpoint:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的Endpoint不同,您可以从地区和终端节点中获取终端节点。例如IAM服务在“华北-北京一”区域的Endpoint为“iam.cn-north-1.myhuaweicloud.com”。 resource-path:资源路径,也即API访问路径。从具体API的URI模块获取,例如“获取用户Token”API的resource-path为“/v3/auth/tokens”。 query-string:查询参数,是可选部分,并不是每个API都有查询参数。查询参数前面需要带一个“?”,形式为“参数名=参数取值”,例如“limit=10”,表示查询不超过10条数据。 例如您需要获取IAM在“华北-北京一”区域的Token,则需使用“华北-北京一”区域的Endpoint(iam.cn-north-1.myhuaweicloud.com),并在获取用户Token的URI部分找到resource-path(/v3/auth/tokens),拼接起来如下所示。 https://iam.cn-north-1.myhuaweicloud.com/v3/auth/tokens 图1 URI示意图 为查看方便,在每个具体API的URI部分,只给出resource-path部分,并将请求方法写在一起。这是因为URI-scheme都是HTTPS,而Endpoint在同一个区域也相同,所以简洁起见将这两部分省略。
  • Token认证 Token的有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限。 Token可通过调用获取用户Token接口获取,调用本服务API需要project级别的Token,即调用获取用户Token接口时,请求body中auth.scope的取值需要选择project,如下所示。 获取用户Token接口请求构造如下,您可以从接口的请求部分看到所需的请求参数及参数说明。获取Token消息头只需填写“Content-Type”。将消息体加入后的请求如下所示,加粗的斜体字段需要根据实际值填写,其中usernam用户名,domainname为用户所属的账号名称,********为用户登录密码。 获取Token的终端节点和projectname需与KG服务终端节点保持一致。当访问华北-北京四的终端节点(即nlp-ext.cn-north-4.myhuaweicloud.com时),获取Token请使用终端节点https://iam.cn-north-4.myhuaweicloud.com,projectname对应使用cn-north-4。 POST https://iam.cn-north-4.myhuaweicloud.com/v3/auth/tokens Content-Type: application/json { "auth": { "identity": { "methods": [ "password" ], "password": { "user": { "name": "username", "password": "********", "domain": { "name": "domainname" } } } }, "scope": { "project": { "name": "xxxxxxxx" } } } } 获取Token后,再调用其他接口时,您需要在请求消息头中添加“X-Auth-Token”,其值即为Token。例如Token值为“ABCDEFJ....”,则调用接口时将“X-Auth-Token: ABCDEFJ....”加到请求消息头即可,如下所示。 GET https://iam.cn-north-1.myhuaweicloud.com/v3/auth/projects Content-Type: application/json X-Auth-Token: ABCDEFJ.... 您还可以通过视频教程了解如何使用Token认证。
  • 请求示例 搜索不止英雄的票房,返回100条结果 https://nlp-ext.cn-north-4.myhuaweicloud.com/v1/1604d8170cd84440a81281e5a3a04f8b/kg/kg-instances/6cdcea01-bac0-48f6-acb5-9385ea3e24ad/apps/query { "query" : "不止英雄的票房", "limit" : 100 }
  • 响应示例 状态码: 200 OK { "total" : 2, "entities" : [ { "name" : "不止英雄", "score" : 1, "id" : "6751625866271911141", "label" : "电影", "properties" : { "票房" : "19.50亿" } }, { "name" : "乱世出英雄", "score" : 0.137613, "id" : "4861731593422907967", "label" : "电影", "properties" : { "上映时间" : "1965年1月4日", "票房" : "5.40亿" } } ] } 状态码: 400 Bad Request { "error_code" : "KGP.2001", "error_msg" : "Kg not found" } 状态码: 403 Forbidden { "error_code" : "KGP.0004", "error_msg" : "Auth failed" } 状态码: 500 Internal Server Error { "error_code" : "KGP.9001", "error_msg" : "Internal server error." }
  • 请求示例 根据不止英雄的主演卜发推荐一部电影,推荐算法总的游走步数为200000 https://nlp-ext.cn-north-4.myhuaweicloud.com/v1/1604d8170cd84440a81281e5a3a04f8b/kg/kg-instances/6cdcea01-bac0-48f6-acb5-9385ea3e24ad/apps/recommand { "text" : "不止英雄的主演卜发", "size" : 1, "steps" : 200000, "label" : "电影" }
  • 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 total Integer 推荐结果个数。 entities KgRecommendRespEntities object 推荐结果详情。 表4 KgRecommendRespEntities 参数 参数类型 描述 id String 推荐的实体节点ID。 name String 推荐的实体节点名称。 score Double 推荐得分,供参考,分值越高说明推荐程度越高。 状态码: 400 表5 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误信息 状态码: 403 表6 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误信息 状态码: 500 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误信息
  • 响应示例 状态码: 200 OK { "total" : 1, "entities" : [ { "id" : "9171851267583370758", "name" : "忆青春", "score" : 42514.35090209614 } ] } 状态码: 400 Bad Request { "error_code" : "KGP.2001", "error_msg" : "Kg not found" } 状态码: 403 Forbidden { "error_code" : "KGP.0004", "error_msg" : "Auth failed" } 状态码: 500 Internal Server Error { "error_code" : "KGP.9001", "error_msg" : "Internal server error." }
  • URI POST /v1/{project_id}/kg/kg-instances/{kg_id}/apps/recommendation 表1 路径参数 参数 是否必选 参数类型 描述 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID。
  • 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 text 否 String 输入语句,根据语句中的实体信息推荐相应知识。 说明: 请求参数中,“sources” 和“ text”必须有一个为非空。如果同时为非空,则忽略“text”的值,以“sources”为推荐算法输入。 最小长度:0 最大长度:512 size 否 Integer 希望返回的节点总个数,1~100,默认为10。 最小值:1 最大值:100 steps 否 Integer 推荐算法总的游走步数,1~200000,默认为1000。 最小值:1 最大值:200000 缺省值:1000 label 否 String 希望输出的概念类型。 最小长度:0 最大长度:512 sources 否 String 实体id,可以是多个。但不能超过10个。多个用“,”间隔。 最小长度:0 最大长度:750
  • 响应示例 状态码: 200 OK { "id" : "9062852764642362192", "label" : "电影", "properties" : { "上映时间" : [ "1952年9月13日" ], "name" : [ "大卫和麦克的故事" ], "票房" : [ "4.01亿" ] } } 状态码: 400 Bad Request { "error_code" : "KGP.2007", "error_msg" : "entity not found" } 状态码: 403 Forbidden { "error_code" : "KGP.0004", "error_msg" : "Auth failed" } 状态码: 500 Internal Server Error { "error_code" : "KGP.9001", "error_msg" : "Internal server error." }
  • URI GET /v1/{project_id}/kg/kg-instances/{kg_id}/entities/{entity_id} 表1 路径参数 参数 是否必选 参数类型 描述 entity_id 是 String 实体ID。 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID。
  • 解决方案 图谱规格为体验版图谱 由于当前知识图谱服务仅支持在控制台创建一次体验版图谱,即创建一次体验版图谱后,无法第二次创建体验版图谱。需要确认体验版图谱是否到期冻结。 如果体验版图谱到期导致冻结,需要通过官网产品页服务咨询联系我们开通购买权限,购买并继续使用图谱,详情请见计费说明。如果不继续使用图谱,等待图谱资源释放即可。 图谱规格为标准版图谱或高级版图谱 确认账号是否欠费,如果继续使用,及时前往华为云控制台费用中心进行充值。
  • 选择图谱规格 登录KG服务管理控制台,默认进入“我的图谱”页面。 单击,在创建图谱页面按表2填写信息。 图1 服务选型 表2 服务选型参数说明 参数 说明 “图谱名称” 待创建图谱的名称,名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。 “图谱规格” 待创建图谱的规格大小。当前仅支持在控制台选择“体验版 一万边”,如果根据业务需要,选择标准版 百万边、标准版 千万边、高级版 千万边,请通过官网产品页“服务咨询”联系我们进行咨询购买。 说明: 如果无法选择图谱规格,说明已创建过一次体验版图谱,且体验版图谱已过30天免费体验期限。请通过官网产品页“服务咨询”联系服务进行咨询购买。 “是否购买套餐包” 体验版图谱默认不能开通套餐包。如果需要选择业务版图谱,请通过官网产品页“服务咨询”联系我们进行咨询购买。 单击右下角“下一步”,在“版本确认”页签确认版本信息。 单击右下角“确认创建”。 页面提示“知识图谱创建任务提交成功”。单击“返回”,返回至“我的图谱”页面,您会看到新创建的图谱卡片,“运行状态”为“创建中”。 图2 图谱创建中 等待十几分钟后,运行状态变为“初始化”状态,您就可以开始构建图谱。
  • 图谱规格 体验版图谱 图谱规模为一万边,最多能支撑12000实体和12000关系,数据量超过会被裁剪。 当前KG服务仅支持在控制台创建一次体验版图谱,即创建一次体验版图谱后,无法第二次创建体验版图谱。 体验版创建后仅支持体验30天,30天后KG服务会将图谱冻结,后续会自动删除超过期限的体验版图谱。 标准版图谱 图谱规模为百万边和千万边,百万边最多支撑120万实体和120万关系,千万边最多支撑1200万实体和1200万关系,数据量超过会被裁剪。 当前KG服务不支持在控制台直接购买,需要通过官网产品页服务咨询联系我们进行咨询购买。 高级版图谱 图谱规模为千万边,最多支撑1200万实体和1200万关系,数据量超过会被裁剪。 当前KG服务不支持在控制台直接购买,需要通过官网产品页服务咨询联系我们进行咨询购买。
  • 购买套餐包(可选) 购买套餐包之前,请通过官网产品页服务咨询联系我们进行咨询购买。 登录华为云控制台,单击左上角,选择“自然语言处理-知识图谱 KG”,进入KG服务管理控制台。 默认进入“我的图谱”页签。 单击右上角的“购买套餐包”。 进入“购买套餐包”页面。 在“购买套餐包”页面,选择“图谱规格”和“购买时长”。 单击“下一步”,进入“订单确认”。 订单确认无误后,单击“下一步”,在支付页面完成付款,付款成功后即完成套餐包的购买。 购买套餐包后,选择图谱规格。 也可登录华为云官网,进入“费用中心”页面,在左侧导航栏选择“资源包(原我的套餐包)”,可查看已购买的知识图谱套餐包。
  • 配置方式 信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围 具体方式 操作指引 结构化抽取 基础数据格式为xlsx、csv、json格式 交互界面配置:通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。 交互界面配置 代码编辑:将交互界面中的配置转换为json格式配置,通过编辑json配置信息,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。 代码编辑 非结构化抽取 基础数据格式为txt文本的自然语言短句 通过选择合适的算法,完成信息抽取配置。 可选择已有的预置模型模板,也可选择您自定义的模型。 非结构化抽取 在通过结构化抽取方式进行信息抽取时,交互界面配置与代码编辑配置可以相互切换。 信息抽取配置完成后,鼠标悬浮在信息抽取方框区域,显示清空图标,单击后可一键清空信息抽取配置。
  • 解决方案 因为当前使用的是子账号,如果子账号要使用的话需要给子账号用户组添加对应区域的“Tenant Administrator”权限或者“NLP Administrator”权限,需要让账号管理员配置一下。 创建子账号的操作步骤如下: 主账号登录华为云,进入控制台。 创建用户组并授权。 在统一身份认证服务左侧导航窗格中,单击“用户组”。 在“用户组”界面中,单击“创建用户组”。 输入“用户组名称”。 单击“确定”。 返回用户组列表,用户组列表中显示新创建的用户组。 在用户组列表中,单击新建用户组“开发人员组”,右侧的“权限配置”。 在用户组权限页签中,单击列表左上方的“配置权限”。 选择权限的作用范围。此处如选择区域级项目,则还需要在下拉框中选择需要授权的区域。 全局服务:服务部署时不区分物理区域,为全局级服务,在全局服务中授权。包括对象存储服务(OBS)、内容分发网络(CDN)、标签管理服务(TMS)等。 区域级项目:服务部署时通过物理区域划分,在区域级项目中授权,并且只在授权区域生效。 所有项目:选择所有项目后,授权将对所有项目都生效,包括全局服务和所有项目(包括未来创建的项目)。 项目:选择对应项目,授权将对指定项目生效。 勾选需要授予用户组的权限,单击“确定”,完成用户组授权。 创建用户并加入用户组。 在统一身份认证服务左侧导航窗格中,单击“用户”。 在“用户”界面,单击“创建用户”。 在“创建用户”界面,输入“用户名”“邮箱”。 “访问方式”选择“华为云管理控制台访问”中的“首次登录时设置”。 “登录保护”选择“开启”,并选择身份验证方式,单击“下一步”。 在“所属用户组”的下拉框中,选择步骤2中创建的用户组,单击“下一步”。 单击“确定”。 账号登录。 使用步骤3创建的用户,使用“IAM用户登录”方式,登录华为云。登录方法请参见:IAM用户登录。
  • 定义三元组类型(schema) 为了训练自定义的信息抽取模型,需要定义该抽取模型能够抽取的三元组类型,并在训练数据中进行标注。 三元组是知识图谱构建的基本元组,三元组借鉴了语言学中主谓宾结构,语言学中一句话由主语(subject)、谓语(predicate)、宾语(object)组成,自然语言中的知识也可以建模为三个元素构成的组合格式,如“中国的首都是北京”这句话中,就有“中国-首都-北京”这样的三元组。 为了将三元组分类,我们定义三元组的类型由主语类型(subject type)、谓语(predicate)类型、宾语类型(object type),如上述三元组“中国-首都-北京”的类型是“国家-首都-城市”。通常我们将这些三元组类型组成的集合称为模型的schema。
  • 流水线配置构建图谱 在“我的图谱”页面鼠标移至待创建的图谱卡片,单击“图谱构建WorkSpace”。 进入普通配置构建图谱页面。 图2 智能构建图谱 按照流水线依次进行配置,详细的操作指引请见表1。 图3 创建流程图 表1 创建流程表 流程 方法 说明 详细指导 配置数据源 - 数据是知识图谱的基础。 基于已存储在OBS中的基础数据,您可以从OBS导入用于构建知识图谱的基础数据。 配置数据源 配置图谱本体 - 您可以选择已在控制台创建的本体,或者选择从OBS导入的本体,用于组织待创建图谱的信息结构。 配置图谱本体 配置信息抽取 自定义抽取模型(可选) 如果您在创建知识图谱时,选择使用自定义模型进行信息抽取,您需要在创建知识图谱之前,自定义抽取模型。 创建模型 创建新版本 发布版本 配置信息抽取项 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。 通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取的配置。 配置信息抽取 配置知识映射 - 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系。 通过设置映射前后的相关字段,完成知识映射的信息配置。 配置知识映射 配置知识融合 - 知识融合来自多个数据来源的关于同一个实体或概念的描述信息。 通过设置知识融合相关属性及相似函数参数,完成知识融合的信息配置。 配置知识融合 配置图谱质检 - 图谱质检是对当前版本的知识图谱的知识质量和流水线构建进行评估,并生成质检报告。 配置图谱质检 配置完后,单击右上角的“生成图谱”。 跳至“我的图谱”页面,等待“运行状态”变为“可用”,即图谱构建完成。您可以单击已构建的图谱卡片,进入图谱详情页面查看图谱详情。
  • 版本统计 基本信息 可查看当前已有图谱版本的上线个数、未上线个数、增量更新次数、全量更新次数和发布次数。 图谱版本 图谱版本列表,包括“版本名称”、“状态”、“实体个数”、“关系个数”、“更新时间”、“描述”、“操作”。 其中,操作包括“验证”、“发布”、“查看”、“删除”、“修改本体”。 验证:融合验证,详情请见配置知识融合。 发布:发布图谱版本。版本处于“已上线”状态时不能执行发布操作。详情请见发布图谱版本。 查看流水线:查看图谱创建流程的配置信息,详情请见查看流水线。 删除:可删除当前图谱版本。版本处于“已上线”状态时不能执行删除操作,详情请见删除图谱版本。 查看本体:查看图谱的本体信息结构。 修改本体:可基于已有图谱,修改本体的信息结构,详细操作请见查看/修改本体。 基于已有图谱修改本体,是指在已有本体基础上新建一个新的本体。 基于已有图谱修改本体,不能修改已有属性的类型。 更新日志 可查看日志更新列表,包括“运行编号”、“事件类型”、“本体”、“状态”、“开始时间”、“结束时间”、“操作”。
  • 数据格式要求 XLSX文件 该类型为结构化数据输入格式。使用XLSX文件,即表格文件作为数据源时,文件必须为.xlsx格式,文件中每一个工作簿为一类数据,工作簿名为数据类型名。每个工作簿中,第一行为数据头,从第二行开始,每一行为一条数据。XLSX文件模板示例请单击下载。 CSV文件 该类型为结构化数据输入格式。使用CSV文件作为数据源时,首先需要把CSV文件上传至OBS的一个文件夹,构建图谱时,会读取该文件夹下所有以.csv为后缀的文件。每一个文件为一类数据,文件名(不包含.csv后缀)为数据类型名,文件编码需要为UTF-8 无BOM。每个文件中,第一行为数据头,从第二行开始,每一行为一条数据。CSV文件示例请单击下载。 多行JSON文件(JSON Lines) 该类型为结构化数据输入格式。文件中,每一行为一个完整的紧凑(单行)JSON字符串。文件编码格式需为UTF-8,文件名需以.json结尾,如“input.json”。文件内容如下所示。 {"entity_type": "Person", "中文名": "康时", "国籍": "中国", "职业": "演员", "出生日期": "1985年3月3日", "url": "/film.kg.huawei.com/康时/165882308"} {"entity_type": "Person", "中文名": "戴奇", "国籍": "韩国", "职业": "演员,歌手", "出生日期": "1987年6月22日", "url": "/film.kg.huawei.com/戴奇"} JSON数据样例请单击下载。 多行单句文本文件 该类型为非结构化输入格式。文件中,每一行为一个自然语言短句。文件编码格式需为UTF-8,文件名需以.txt结尾,如“input.txt”。 项羽,名籍 项羽是楚国武将 文昭甄皇后史称甄夫人 文昭甄皇后中山无极(今河北省无极县)人,上蔡令甄逸之女 文昭甄皇后魏文帝曹丕的妻子,魏明帝曹叡的生母 …….
  • 智能构建图谱 在KG服务管理控制台“我的图谱”页面,鼠标移至新创建的图谱卡片,单击“智能一键构建”。 进入智能构建图谱页面。 图1 智能构建图谱 按表1填写信息。 图2 填写信息 表1 智能一键构建图谱 参数 说明 图谱名称 待创建图谱的名称。在选择图谱规格时已确定,无法更改。 选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。 “存储路径”:选择数据源文件存放在OBS桶的文件路径。 说明: 数据源存储的OBS路径不允许使用加密的OBS路径。 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 实体类型字段 数据中标识该实体属于何种类型的字段。 当数据源的数据格式为“JSON”时,需要填写该字段。 单击“下一步”。 查看自动生成的本体结构,您也可以对本体进行修改。 单击“下一步”。 进入图谱流水线配置页面,无需手动配置,已自动配置好。 图3 流水线配置 单击“运行”。 跳至图谱详情页面,等待“运行状态”变为“可用”,即图谱构建完成。
共100000条