华为云用户手册

数据仓库服务 GAUSSDB(DWS)-自定义密码策略:密码设置和修改

密码设置和修改建议系统管理员和普通用户都要定期修改自己的账户密码，避免账户密码被非法窃取。以修改用户user1密码为例，使用管理员用户连接数据库并执行如下命令： 1 ALTER USER user1 IDENTIFIED BY 'newpassword' REPLACE 'oldpassword'; 密码要符合规则，否则会执行失败。管理员可以修改自己的或者其他账户的密码。通过修改其他账户的密码，解决用户密码遗失所造成无法登录的问题。以修改用户joe账户密码为例，命令格式如下： 1 ALTER USER joe IDENTIFIED BY 'password'; 系统管理员之间不允许互相修改对方密码。系统管理员可以修改普通用户密码且不需要用户原密码。系统管理员可以修改自己的密码但需要管理员原密码。密码验证设置当前会话的用户和角色时，需要验证密码。如果输入密码与用户的存储密码不一致，则会报错。以设置用户joe为例，命令格式如下： 1 SET ROLE joe PASSWORD 'password'; 显示如下命令表示设置成功： SET ROLE

数据仓库服务 GAUSSDB(DWS) 管理用户及权限
数据仓库服务 GAUSSDB(DWS)-显式游标:处理步骤

处理步骤显式游标处理需六个PL/SQL步骤：定义静态游标：就是定义一个游标名，以及与其相对应的SELECT语句。定义静态游标的语法图，请参见图1。图1 static_cursor_define::= 参数说明： cursor_name：定义的游标名。 parameter：游标参数，只能为输入参数，其格式为： parameter_name datatype select_statement：查询语句。根据执行计划的不同，系统会自动判断该游标是否可以用于以倒序的方式检索数据行。定义动态游标：指ref游标，可以通过一组静态的SQL语句动态的打开游标。首先定义ref游标类型，然后定义该游标类型的游标变量，在打开游标时通过OPEN FOR动态绑定SELECT语句。定义动态游标的语法图，请参见图2和图3。图2 cursor_typename::= GaussDB(DWS)支持sys_refcursor动态游标类型，函数或存储过程可以通过sys_refcursor参数传入或传出游标结果集合，函数也可以通过返回sys_refcursor来返回游标结果集合。图3 dynamic_cursor_define::= 打开静态游标：就是执行游标所对应的SELECT语句，将其查询结果放入工作区，并且指针指向工作区的首部，标识游标结果集合。如果游标查询语句中带有FOR UPDATE选项，OPEN语句还将锁定数据库表中游标结果集合对应的数据行。打开静态游标的语法图，请参见图4。图4 open_static_cursor::= 打开动态游标：可以通过OPEN FOR语句打开动态游标，动态绑定SQL语句。打开动态游标的语法图，请参见图5。图5 open_dynamic_cursor::= PL/SQL程序不能用OPEN语句重复打开一个游标。提取游标数据：检索结果集合中的数据行，放入指定的输出变量中。提取游标数据的语法图，请参见图6。图6 fetch_cursor::= 对该记录进行处理。继续处理，直到活动集合中没有记录。关闭游标：当提取和处理完游标结果集合数据后，应及时关闭游标，以释放该游标所占用的系统资源，并使该游标的工作区变成无效，不能再使用FETCH语句获取其中数据。关闭后的游标可以使用OPEN语句重新打开。关闭游标的语法图，请参见图7。图7 close_cursor::=

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-显式游标:属性

属性游标的属性用于控制程序流程或者了解程序的状态。当运行DML语句时，PL/SQL打开一个内建游标并处理结果，游标是维护查询结果的内存中的一个区域，游标在运行DML语句时打开，完成后关闭。显式游标的属性为： %FOUND布尔型属性：当最近一次读记录时成功返回，则值为TRUE。 %NOTFOUND布尔型属性：与%FOUND相反。 %ISOPEN布尔型属性：当游标已打开时返回TRUE。 %ROWCOUNT数值型属性：返回已从游标中读取的记录数。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-实时TopSQL:前提条件

前提条件 GUC参数enable_resource_track为on （默认为on）。 GUC参数resource_track_level为query、perf或operator（默认为query）。监控作业的类型为：优化器估算的执行代价大于或等于resource_track_cost取值的作业。 Cgroups功能正常加载，可通过gs_cgroup -P查看控制组信息。 GUC参数enable_track_record_subsql控制是否记录存储过程、匿名块内部语句。在上述条件中，enable_resource_track为系统级参数，用于设置是否开启资源监控功能。resource_track_level为session级参数，可以对某个session的资源监控级别进行灵活设置。这两个参数的设置方法如下表：表2 设置资源监控信息统计级别 enable_resource_track resource_track_level query级别信息算子级别信息 on(default) none 不统计不统计 query(default) 统计不统计 perf 统计不统计 operator 统计统计 off none/query/operator 不统计不统计

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-实时TopSQL:操作步骤

操作步骤通过视图gs_session_cpu_statistics查询实时CPU信息。 1 SELECT * FROM gs_session_cpu_statistics; 通过视图gs_session_memory_statistics查询实时memory信息。 1 SELECT * FROM gs_session_memory_statistics; 通过视图gs_wlm_session_statistics查询当前CN的实时资源。 1 SELECT * FROM gs_wlm_session_statistics; 通过视图pgxc_wlm_session_statistics查询所有CN的实时资源。 1 SELECT * FROM pgxc_wlm_session_statistics; 通过视图gs_wlm_operator_statistics查询当前CN作业算子执行实时资源信息。 1 SELECT * FROM gs_wlm_operator_statistics; 通过视图pgxc_wlm_operator_statistics查询所有CN作业算子执行实时资源信息。 1 SELECT * FROM pgxc_wlm_operator_statistics; 通过视图pg_session_wlmstat查询当前用户执行作业正在运行时的负载管理信息。 1 SELECT * FROM pg_session_wlmstat; 通过视图pgxc_wlm_workload_records（动态负载功能开启，即enable_dynamic_workload为on时该视图有效）查询当前用户在每个CN上作业执行时的状态信息。 1 SELECT * FROM pgxc_wlm_workload_records;

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-WITH表达式:WITH中的数据修改语句

WITH中的数据修改语句在WITH子句中使用数据修改命令INSERT、UPDATE、DELETE。这允许用户在同一个查询中执行多个不同操作。示例如下所示： 1 2 3 4 5 6 WITH moved_tree AS ( DELETE FROM tree WHERE parentid = 4 RETURNING * ) INSERT INTO tree_log SELECT * FROM moved_tree; 上述查询示例实际上从tree把行移动到tree_log。WITH中的DELETE删除来自tree的指定行，以它的RETURNING子句返回它们的内容，并且接着主查询读该输出并将它插入到tree_log。 WIYH子句中的数据修改语句必须有RETURNING子句，用来返回RETURNING子句的输出，而不是数据修改语句的目标表，RETURNING子句形成了可以被查询的其余部分引用的临时表。如果一个WITH中的数据修改语句缺少一个RETURNING子句，则它形不成临时表并且不能在剩余的查询中被引用。如果声明了RECURSIVE关键字，则不允许在数据修改语句中进行递归自引用。在某些情况中可以通过引用递归WITH的输出来绕过这个限制，例如： 1 2 3 4 5 6 7 8 9 WITH RECURSIVE included_parts(sub_part, part) AS ( SELECT sub_part, part FROM parts WHERE part = 'our_product' UNION ALL SELECT p.sub_part, p.part FROM included_parts pr, parts p WHERE p.part = pr.sub_part ) DELETE FROM parts WHERE part IN (SELECT part FROM included_parts); 这个查询将会移除一个产品的所有直接或间接子部件。 WITH子句中的子语句与主查询同时执行。因此，在使用WITH中的数据修改语句时，指定更新的顺序实际是以不可预测的方式发生的。所有的语句都使用同一个快照中执行，语句的效果在目标表上不可见。这减轻了行更新的实际顺序的不可预见性的影响，并且意味着RETURNING数据是在不同WITH子语句和主查询之间传达改变的唯一方法。本示例中外层SELECT可以返回更新之前的数据： 1 2 3 4 WITH t AS ( UPDATE tree SET id = id + 1 RETURNING * ) SELECT * FROM tree; 本示例中外部SELECT将返回更新过的数据： 1 2 3 4 WITH t AS ( UPDATE tree SET id = id + 1 RETURNING * ) SELECT * FROM t; 不支持在单个语句中更新同一行两次。这种语句的效果是不可预测的。如果只有一个修改发生了，但却不容易（有时也不可能）预测哪一个发生了修改。

数据仓库服务 GAUSSDB(DWS) 数据读取
数据仓库服务 GAUSSDB(DWS)-WITH表达式:WITH递归查询

WITH递归查询通过声明RECURSIVE关键字，一个WITH查询可以引用它自己的输出。递归WITH查询的通常形式如下： 1 non_recursive_term UNION [ALL] recursive_term 其中：UNION在合并集合时会执行去重操作，而UNION ALLL则直接将结果集合并、不执行去重；只有递归项能够包含对于查询自身输出的引用。使用递归WITH时，必须确保查询的递归项最终不会返回元组，否则查询将无限循环。使用表tree来存储下图中的所有节点信息：表定义语句如下： 1 CREATE TABLE tree(id INT, parentid INT); 表中数据如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 INSERT INTO tree VALUES(1,0),(2,1),(3,1),(4,2),(5,2),(6,3),(7,3),(8,4),(9,4),(10,6),(11,6),(12,10); SELECT * FROM tree; id | parentid ----+---------- 1 | 0 2 | 1 3 | 1 4 | 2 5 | 2 6 | 3 7 | 3 8 | 4 9 | 4 10 | 6 11 | 6 12 | 10 (12 rows) 通过以下WITH RECURSIVE语句，我们可以返回从顶层1号节点开始，整个树的节点，以及层次信息： 1 2 3 4 5 6 7 8 9 10 11 WITH RECURSIVE nodeset AS ( -- recursive initializing query SELECT id, parentid, 1 AS level FROM tree WHERE id = 1 UNION ALL -- recursive join query SELECT tree.id, tree.parentid, level + 1 FROM tree, nodeset WHERE tree.parentid = nodeset.id ) SELECT * FROM nodeset ORDER BY id; 上述查询中，我们可以看出，一个典型的WITH RECURSIVE表达式包含至少一个递归查询的CTE，该CTE中的定义为一个UNION ALL集合操作，第一个分支为递归起始查询，第二个分支为递归关联查询，需要自引用第一部分进行不断递归关联。该语句执行时，递归起始查询执行一次，关联查询执行若干次并将结果叠加到起始查询结果集中，直到某一些关联查询结果为空，则返回。上述查询的执行结果如下： id | parentid | level ----+----------+------- 1 | 0 | 1 2 | 1 | 2 3 | 1 | 2 4 | 2 | 3 5 | 2 | 3 6 | 3 | 3 7 | 3 | 3 8 | 4 | 4 9 | 4 | 4 10 | 6 | 4 11 | 6 | 4 12 | 10 | 5 (12 rows) 从返回结果可以看出，起始查询结果包含level=1的结果集，关联查询执行了五次，前四次分别输出level=2,3,4,5的结果集，在第五次执行时，由于没有parentid和输出结果集id相等的记录，也就是再没有多余的孩子节点，因此查询结束。对于WITH RECURSIVE表达式，GaussDB(DWS)支持其分布式执行。由于WITH RECURSIVE涉及到循环运算，GaussDB(DWS)引入了参数max_recursive_times，用于控制WITH RECURSIVE的最大循环次数，默认值为200，超过该次数则报错。

数据仓库服务 GAUSSDB(DWS) 数据读取
数据仓库服务 GAUSSDB(DWS)-创建和管理数据库:创建数据库

创建数据库使用CREATE DATABASE语句创建一个新的数据库。 1 CREATE DATABASE mydatabase; 创建数据库时，若数据库名称长度超过63字节，server端会对数据库名称进行截断，保留前63个字节，因此建议数据库名称长度不要超过63个字节，不要使用多字节字符作为对象名。（如果出现因为误操作导致在多字节字符的中间截断进而无法删除数据库对象的现象，请使用截断前的数据库对象名进行删除操作，或将该对象从各个数据库节点的相应系统表中依次删掉。）数据库名称遵循SQL标识符的一般规则。当前用户自动成为此新数据库的所有者。如果一个数据库系统用于承载相互独立的用户和项目，建议把它们放在不同的数据库里。如果项目或者用户是相互关联的，并且可以相互使用对方的资源，则应该把它们放在同一个数据库里，但可以规划在不同的Schema中。 GaussDB(DWS)允许创建的数据库总数目上限为128个。用户必须拥有数据库创建的权限或者是数据库的系统管理员权限才能创建数据库。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-创建和管理数据库:模板和默认数据

模板和默认数据 GaussDB(DWS)提供了两个模板数据库template0、template1，以及一个默认的数据库gaussdb。默认情况下，每个新创建的数据库都是基于一个模板数据库。GaussDB(DWS)数据库默认使用template1作为模板，编码格式为SQL_ASCII，且不允许自定义字符编码。若创建数据库时需指定字符编码，请使用template0创建数据库。请避免使用客户端或其他手段连接及操作两个模板数据库。通过“show server_encoding”命令可以查看当前数据库存储编码。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-调试:语法

语法 RAISE有以下五种语法格式：图1 raise_format::= 图2 raise_condition::= 图3 raise_sqlstate::= 图4 raise_option::= 图5 raise::= 参数说明： level选项用于指定错误级别，有DEBUG，LOG，INFO，NOTICE，WARNING以及EXCEPTION（默认值）。EXCEPTION抛出一个正常终止当前事务的异常，其他的仅产生不同异常级别的信息。特殊级别的错误信息是否报告到客户端、写到服务器日志由log_min_messages和client_min_messages这两个配置参数控制。 format：格式字符串，指定要报告的错误消息文本。格式字符串后可跟表达式，用于向消息文本中插入。在格式字符串中，%由format后面跟着的参数的值替换，%%用于打印出%。例如： --v_job_id 将替换字符串中的 %： RAISE NOTICE 'Calling cs_create_job(%)',v_job_id; option = expression：向错误报告中添加另外的信息。关键字option可以是MESSAGE、DETAIL、HINT以及ERRCODE，并且每一个expression可以是任意的字符串。 MESSAGE，指定错误消息文本，这个选项不能用于在USING前包含一个格式字符串的RAISE语句中。 DETAIL，说明错误的详细信息。 HINT，用于打印出提示信息。 ERRCODE，向报告中指定错误码（SQLSTATE）。可以使用条件名称或者直接用五位字符的SQLSTATE错误码。 condition_name：错误码对应的条件名。 sqlstate：错误码。如果在RAISE EXCEPTION命令中既没有指定条件名也没有指定SQLSTATE，默认用RAISE EXCEPTION (P0001)。如果没有指定消息文本，默认用条件名或者SQLSTATE作为消息文本。当由SQLSTATE指定了错误码，则不局限于已定义的错误码，可以选择任意包含五个数字或者大写的ASCII字母的错误码，而不是00000。建议避免使用以三个0结尾的错误码，因为这种错误码是类别码，会被整个种类捕获。图5所示的语法不接任何参数。这种形式仅用于一个BEGIN块中的EXCEPTION语句，它使得错误重新被处理。

数据仓库服务 GAUSSDB(DWS) 存储过程
数据仓库服务 GAUSSDB(DWS)-动态调用存储过程:语法

语法语法请参见图1。图1 call_procedure::= using_clause子句的语法参见图2。图2 using_clause-3 对以上语法格式的解释如下： CALL procedure_name，调用存储过程。 [:placeholder1，:placeholder2，…]，存储过程参数占位符列表。占位符个数与参数个数相同。 USING [IN|OUT|IN OUT] bind_argument，用于指定存放传递给存储过程参数值的变量。bind_argument前的修饰符与对应参数的修饰符一致。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-动态调用存储过程:示例

示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 --创建存储过程proc_add。 CREATE OR REPLACE PROCEDURE proc_add ( param1 in INTEGER, param2 out INTEGER, param3 in INTEGER ) AS BEGIN param2:= param1 + param3; END; / DECLARE input1 INTEGER:=1; input2 INTEGER:=2; statement VARCHAR2(200); param2 INTEGER; BEGIN --声明调用语句 statement := 'call proc_add(:col_1, :col_2, :col_3)'; --执行语句 EXECUTE IMMEDIATE statement USING IN input1, OUT param2, IN input2; dbms_output.put_line('result is: '||to_char(param2)); END; / --删除存储过程 DROP PROCEDURE proc_add;

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-执行动态查询语句:OPEN FOR

OPEN FOR 动态查询语句还可以使用OPEN FOR打开动态游标来执行。语法参见图3。图3 open_for::= 参数说明： cursor_name：要打开的游标名。 dynamic_string：动态查询语句。 USING value：在dynamic_string中存在占位符时使用。游标的使用请参考游标。示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 DECLARE name VARCHAR2(20); phone_number VARCHAR2(20); salary NUMBER(8,2); sqlstr VARCHAR2(1024); TYPE app_ref_cur_type IS REF CURSOR; --定义游标类型 my_cur app_ref_cur_type; --定义游标变量 BEGIN sqlstr := 'select first_name,phone_number,salary from staffs where section_id = :1'; OPEN my_cur FOR sqlstr USING '30'; --打开游标, using是可选的 FETCH my_cur INTO name, phone_number, salary; --获取数据 WHILE my_cur%FOUND LOOP dbms_output.put_line(name||'#'||phone_number||'#'||salary); FETCH my_cur INTO name, phone_number, salary; END LOOP; CLOSE my_cur; --关闭游标 END; /

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-执行动态查询语句:EXECUTE IMMEDIATE

EXECUTE IMMEDIATE 语法图请参见图1。图1 EXECUTE IMMEDIATE dynamic_select_clause::= using_clause子句的语法图参见图2。图2 using_clause-1 对以上语法格式的解释如下： define_variable，用于指定存放单行查询结果的变量。 USING IN bind_argument，用于指定存放传递给动态SQL值的变量，即在dynamic_select_string中存在占位符时使用。 USING OUT bind_argument，用于指定存放动态SQL返回值的变量。查询语句中，into和out不能同时存在；占位符命名以“:”开始，后面可跟数字、字符或字符串，与USING子句的bind_argument一一对应； bind_argument只能是值、变量或表达式，不能是表名、列名、数据类型等数据库对象，即不支持使用bind_argument为动态SQL语句传递模式对象。如果存储过程需要通过声明参数传递数据库对象来构造动态SQL语句（常见于执行DDL语句时），建议采用连接运算符“||”拼接dynamic_select_clause；动态PL/SQL块允许出现重复的占位符，即相同占位符只能与USING子句的一个bind_argument按位置对应。示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 --从动态语句检索值（INTO 子句）： DECLARE staff_count VARCHAR2(20); BEGIN EXECUTE IMMEDIATE 'select count(*) from staffs' INTO staff_count; dbms_output.put_line(staff_count); END; / --传递并检索值（INTO子句用在USING子句前）： CREATE OR REPLACE PROCEDURE dynamic_proc AS staff_id NUMBER(6) := 200; first_name VARCHAR2(20); salary NUMBER(8,2); BEGIN EXECUTE IMMEDIATE 'select first_name, salary from staffs where staff_id = :1' INTO first_name, salary USING IN staff_id; dbms_output.put_line(first_name || ' ' || salary); END; / --调用存储过程 CALL dynamic_proc(); --删除存储过程 DROP PROCEDURE dynamic_proc;

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-历史TopSQL:前提条件

前提条件 GUC参数enable_resource_track为on （默认为on）。 GUC参数resource_track_level为query、perf或operator（默认为query）。设置方法详见表2。 GUC参数enable_resource_record为on（默认为on）。 GUC参数resource_track_duration小于作业执行时间（默认为60s）。 GUC参数enable_track_record_subsql控制是否记录存储过程、匿名块内部语句（默认为off）。监控作业类型为：资源监控实时视图（参见表1）中记录的作业结束时的执行时间大于或等于resource_track_duration的作业。 Cgroups功能正常加载，可通过gs_cgroup -P查看控制组信息。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-动态调用匿名块:语法

语法语法请参见图1。图1 call_anonymous_block::= using_clause子句的语法参见图2。图2 using_clause-4 对以上语法格式的解释如下：匿名块程序实施部分，以BEGIN语句开始，以END语句停顿，以一个分号结束。 USING [IN|OUT|IN OUT] bind_argument，用于指定存放传递给存储过程参数值的变量。bind_argument前的修饰符与对应参数的修饰符一致。匿名块中间的输入输出参数使用占位符来指明，要求占位符个数与参数个数相同，并且占位符所对应参数的顺序和USING中参数的顺序一致。目前GaussDB(DWS)在动态语句调用匿名块时，EXCEPTION语句中暂不支持使用占位符进行输入输出参数的传递。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-动态调用匿名块:示例

示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 --创建存储过程dynamic_proc CREATE OR REPLACE PROCEDURE dynamic_proc AS staff_id NUMBER(6) := 200; first_name VARCHAR2(20); salary NUMBER(8,2); BEGIN --执行匿名块 EXECUTE IMMEDIATE 'begin select first_name, salary into :first_name, :salary from staffs where staff_id= :dno; end;' USING OUT first_name, OUT salary, IN staff_id; dbms_output.put_line(first_name|| ' ' || salary); END; / --调用存储过程 CALL dynamic_proc(); --删除存储过程 DROP PROCEDURE dynamic_proc;

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-查看GUC参数

查看GUC参数 GaussDB(DWS)的GUC参数影响数据库的系统行为，用户可根据业务场景和数据量查看并调整GUC参数取值。查看GUC参数方式一：集群创建成功后，用户可在GaussDB(DWS) 管理控制台上查看常用的数据库参数。查看GUC参数方式二：成功连接集群后，通过SQL命令的方式查看数据库GUC参数。使用SHOW命令。使用如下命令查看单个参数： 1 SHOW server_version; server_version显示数据库版本信息的参数。使用如下命令查看所有参数： 1 SHOW ALL; 使用pg_settings视图。使用如下命令查看单个参数： 1 SELECT * FROM pg_settings WHERE NAME='server_version'; 使用如下命令查看所有参数： 1 SELECT * FROM pg_settings; 父主题： GUC参数

数据仓库服务 GAUSSDB(DWS) GUC参数
数据仓库服务 GAUSSDB(DWS)-选择表存储模型:使用压缩

使用压缩表压缩可以在创建表时开启，压缩表能够使表中的数据以压缩格式存储，意味着占用相对少的内存。对于I/O读写量大，CPU富足（计算相对小）的场景，选择高压缩比；反之选择低压缩比。建议依据此原则进行不同压缩下的测试和对比，以选择符合自身业务情况的最优压缩比。压缩比通过COMPRESSION参数指定，其支持的取值如下：列存表为：YES/NO/LOW/MIDDLE/HIGH，默认值为LOW。行存表为：YES/NO，默认值为NO。（行存表压缩功能暂未商用，如需使用请联系技术支持工程师）各压缩级别所适用的业务场景说明如下：压缩级别所适用的业务场景低级别压缩系统CPU使用率高，存储磁盘空间充足。中度压缩系统CPU使用率适中，但存储磁盘空间不是特别充足。高级别压缩系统CPU使用率低，磁盘空间不充裕。例如，创建一个名为customer_t3的列存压缩表： 1 2 3 4 5 6 7 CREATE TABLE customer_t3 ( state_ID CHAR(2), state_NAME VARCHAR2(40), area_ID NUMBER ) WITH (ORIENTATION = COLUMN,COMPRESSION=middle);

数据仓库服务 GAUSSDB(DWS) 定义数据库对象
数据仓库服务 GAUSSDB(DWS)-执行动态非查询语句:示例

示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 --创建表 CREATE TABLE sections_t1 ( section NUMBER(4) , section_name VARCHAR2(30), manager_id NUMBER(6), place_id NUMBER(4) ) DISTRIBUTE BY hash(manager_id); --声明变量 DECLARE section NUMBER(4) := 280; section_name VARCHAR2(30) := 'Info support'; manager_id NUMBER(6) := 103; place_id NUMBER(4) := 1400; new_colname VARCHAR2(10) := 'sec_name'; BEGIN --执行查询 EXECUTE IMMEDIATE 'insert into sections_t1 values(:1, :2, :3, :4)' USING section, section_name, manager_id,place_id; --执行查询（重复占位符） EXECUTE IMMEDIATE 'insert into sections_t1 values(:1, :2, :3, :1)' USING section, section_name, manager_id; --执行ALTER语句（建议采用“||”拼接数据库对象构造DDL语句） EXECUTE IMMEDIATE 'alter table sections_t1 rename section_name to ' || new_colname; END; / --查询数据 SELECT * FROM sections_t1; --删除表 DROP TABLE sections_t1;

数据仓库服务 GAUSSDB(DWS) 动态语句
数据仓库服务 GAUSSDB(DWS)-执行动态非查询语句:语法

语法语法请参见图1。图1 noselect::= using_clause子句的语法参见图2。图2 using_clause-2 对以上语法格式的解释如下： USING IN bind_argument用于指定存放传递给动态SQL值的变量，在dynamic_noselect_string中存在占位符时使用，即动态SQL语句执行时，bind_argument将替换相对应的占位符。要注意的是，bind_argument只能是值、变量或表达式，不能是表名、列名、数据类型等数据库对象。如果存储过程需要通过声明参数传递数据库对象来构造动态SQL语句（常见于执行DDL语句时），建议采用连接运算符“||”拼接dynamic_select_clause。另外，动态语句允许出现重复的占位符，相同占位符只能与唯一一个bind_argument按位置一一对应。

数据仓库服务 GAUSSDB(DWS) 动态语句
数据仓库服务 GAUSSDB(DWS)-循环语句:FORALL批量查询语句

FORALL批量查询语句语法图图5 forall::= 变量index会自动定义为integer类型并且只在此循环里存在。index的取值介于low_bound和upper_bound之间。示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 CREATE TABLE hdfs_t1 ( title NUMBER(6), did VARCHAR2(20), data_peroid VARCHAR2(25), kind VARCHAR2(25), interval VARCHAR2(20), time DATE, isModified VARCHAR2(10) ) DISTRIBUTE BY hash(did); INSERT INTO hdfs_t1 VALUES( 8, 'Donald', 'OConnell', 'DOCONNEL', '650.507.9833', to_date('21-06-1999', 'dd-mm-yyyy'), 'SH_CLERK' ); CREATE OR REPLACE PROCEDURE proc_forall() AS BEGIN FORALL i IN 100..120 insert into hdfs_t1(title) values(i); END; / --调用函数 CALL proc_forall(); --查询存储过程调用结果 SELECT * FROM hdfs_t1 WHERE title BETWEEN 100 AND 120; --删除存储过程和表 DROP PROCEDURE proc_forall; DROP TABLE hdfs_t1;

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-循环语句:FOR_LOOP查询语句

FOR_LOOP查询语句语法图图4 for_loop_query::= 变量target会自动定义，类型和query的查询结果的类型一致，并且只在此循环中有效。target的取值就是query的查询结果。示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 --循环输出查询结果。 CREATE OR REPLACE PROCEDURE proc_for_loop_query() AS record VARCHAR2(50); BEGIN FOR record IN SELECT spcname FROM pg_tablespace LOOP dbms_output.put_line(record); END LOOP; END; / --调用函数 CALL proc_for_loop_query(); --删除存储过程 DROP PROCEDURE proc_for_loop_query;

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-循环语句:FOR_LOOP（integer变量）语句

FOR_LOOP（integer变量）语句语法图图3 for_loop::= 变量name会自动定义为integer类型并且只在此循环里存在。变量name介于lower_bound和upper_bound之间。当使用REVERSE关键字时，lower_bound必须大于等于upper_bound，否则循环体不会被执行。示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 --从0到5进行循环 CREATE OR REPLACE PROCEDURE proc_for_loop() AS BEGIN FOR I IN 0..5 LOOP DBMS_OUTPUT.PUT_LINE('It is '||to_char(I) || ' time;') ; END LOOP; END; / --调用函数 CALL proc_for_loop(); --删除存储过程 DROP PROCEDURE proc_for_loop;

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-TopSQL查询示例:配置集群参数

配置集群参数查询TopSQL资源监控信息之前，需要先配置相关的GUC参数，以便能查询到作业的资源监控历史信息或归档信息。步骤如下：登录GaussDB(DWS)管理控制台。在“集群管理”页面，找到所需要的集群，单击集群名称，进入集群详情页面。单击“参数修改”标签页，可以看到当前集群的参数值。修改参数resource_track_duration值为合适的值，单击“保存”按钮进行保存。 enable_resource_record开关打开后，会引起存储空间膨胀及轻微性能影响，不用时请关闭。返回集群管理页面，单击右上角的刷新按钮，等待集群参数配置完成。

数据仓库服务 GAUSSDB(DWS) 资源监控
数据仓库服务 GAUSSDB(DWS)-调用语句:示例

示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 --创建存储过程proc_staffs CREATE OR REPLACE PROCEDURE proc_staffs ( section NUMBER(6), salary_sum out NUMBER(8,2), staffs_count out INTEGER ) IS BEGIN SELECT sum(salary), count(*) INTO salary_sum, staffs_count FROM staffs where section_id = section; END; / --创建存储过程proc_return. CREATE OR REPLACE PROCEDURE proc_return AS v_num NUMBER(8,2); v_sum INTEGER; BEGIN proc_staffs(30, v_sum, v_num); --调用语句 dbms_output.put_line(v_sum||'#'||v_num); RETURN; --返回语句 END; / --调用存储过程proc_return. CALL proc_return(); --清除存储过程 DROP PROCEDURE proc_staffs; DROP PROCEDURE proc_return; --创建函数func_return. CREATE OR REPLACE FUNCTION func_return returns void language plpgsql AS $$ DECLARE v_num INTEGER := 1; BEGIN dbms_output.put_line(v_num); RETURN; --返回语句 END $$; -- 调用函数func_return CALL func_return(); 1 -- 清除函数 DROP FUNCTION func_return;

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-RETURN:示例

示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 --创建存储过程proc_staffs CREATE OR REPLACE PROCEDURE proc_staffs ( section NUMBER(6), salary_sum out NUMBER(8,2), staffs_count out INTEGER ) IS BEGIN SELECT sum(salary), count(*) INTO salary_sum, staffs_count FROM staffs where section_id = section; END; / --创建存储过程proc_return. CREATE OR REPLACE PROCEDURE proc_return AS v_num NUMBER(8,2); v_sum INTEGER; BEGIN proc_staffs(30, v_sum, v_num); --调用语句 dbms_output.put_line(v_sum||'#'||v_num); RETURN; --返回语句 END; / --调用存储过程proc_return. CALL proc_return(); --清除存储过程 DROP PROCEDURE proc_staffs; DROP PROCEDURE proc_return; --创建函数func_return. CREATE OR REPLACE FUNCTION func_return returns void language plpgsql AS $$ DECLARE v_num INTEGER := 1; BEGIN dbms_output.put_line(v_num); RETURN; --返回语句 END $$; -- 调用函数func_return CALL func_return(); 1 -- 清除函数 DROP FUNCTION func_return;

数据仓库服务 GAUSSDB(DWS) 返回语句
数据仓库服务 GAUSSDB(DWS)-冷热数据管理:使用示例

使用示例创建列存冷热数据管理表，指定热数据有效期LMT为100天。 1 2 3 4 5 6 7 8 CREATE TABLE lifecycle_table(i int, val text) WITH (ORIENTATION = COLUMN, storage_policy = 'LMT:100') PARTITION BY RANGE (i) ( PARTITION P1 VALUES LESS THAN(5), PARTITION P2 VALUES LESS THAN(10), PARTITION P3 VALUES LESS THAN(15), PARTITION P8 VALUES LESS THAN(MAXVALUE) )ENABLE ROW MOVEMENT; 切换冷数据至OBS表空间。自动切换：每日0点调度框架自动触发，无需关注切换情况。可自定义自动切换时间：根据业务情况调整自动触发时间，修改为每天早晨6点30分。 1 SELECT * FROM pg_obs_cold_refresh_time('lifecycle_table', '06:30:00'); 手动切换。执行如下操作手动切换单表： 1 ALTER TABLE lifecycle_table refresh storage; 执行如下操作批量切换所有冷热表： 1 SELECT pg_catalog.pg_refresh_storage(); 查看冷热表数据分布情况。查看单表数据分布情况： 1 SELECT * FROM pg_catalog.pg_lifecycle_table_data_distribute('lifecycle_table'); 查看所有冷热表数据分布情况： 1 SELECT * FROM pg_catalog.pg_lifecycle_node_data_distribute();

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-冷热数据管理:冷热切换策略

冷热切换策略目前冷热切换的策略名称支持LMT（last modify time）和HPN（hot partition number），LMT指按分区的最后更新时间切换，HPN指保留热分区的个数切换。 LMT：表示切换[day]时间前修改的热分区数据为冷分区，将该数据迁至OBS表空间中。其中[day]为整型，范围[0，36500]，单位为天。如下图中，设置day为2，即在冷热切换时，根据分区数据的最晚修改时间，保留2日内所修改的分区为热分区，其余数据为冷分区数据。假设当前时间为4月30日，4月30日对[4-26]分区进行了delete操作，4月29日对[4-27]分区进行了insert操作，故在冷热切换时，保留[4-26][4-27][4-29][4-30]四个分区为热分区。 HPN：表示保留HPN个有数据的分区为热分区。分区顺序按照分区的Sequence ID来确定，分区的Sequence ID是根据分区边界值的大小，内置生成的序号，此序号不对外呈现。对于RANGE分区，分区的边界值越大，分区对应的Sequence ID越大；对于LIST分区，分区边界枚举值中的最大值越大，分区对应的Sequence ID越大。在冷热切换时，需要将数据迁移至OBS表空间中。其中HPN为整型，范围为[0,1600]。其中HPN为0时，表示不保留热分区，在进行冷热切换时，将所有有数据的分区都转为冷分区并存储在OBS上。如下图中，设置HPN为3，即在冷热切换时，保留最新的3个有数据的分区为热分区数据，其余分区均切为冷分区。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-冷热数据管理:冷热数据管理的约束限制

冷热数据管理的约束限制目前冷热表只支持列存2.0版本的分区表，外表不支持冷热分区。仅支持从热数据切换为冷数据，不支持从冷数据切换为热数据。对于已经切冷分区再次插入数据，数据直接会进入OBS，不会改变分区的冷热属性。对于同一分区在同一DN只会存在冷或热的一种情况，对于同一分区在不同DN可能存在部分DN为热数据，部分DN为冷数据。对于同时存在冷热分区的表，查询时会变慢，因为冷数据存储在OBS上，读写速度和时延都比在本地查询要慢。只支持修改冷热表的冷热切换策略，不支持修改冷热表的冷数据的表空间。冷热表的分区操作约束：不支持对冷分区的数据进行exchange操作。 Merge partition分区只支持热分区和热分区合并、冷分区和冷分区合并，不支持冷热分区合并。 ADD/Merge/Split Partition等分区操作不支持指定表空间为OBS表空间。不支持创建时指定和修改冷热表分区的表空间。冷热切换不是只要满足条件就立刻进行冷热数据切换，依赖用户手动调用切换命令，或者通过调度器调用切换命令后才真正进行数据切换。目前自动调度时间为每日0点，可进行修改。目前冷热切换规则只支持LMT和HPN两种。冷热数据表不支持物理细粒度备份和恢复，由于物理备份时只备份热数据，在备份恢复前后OBS上冷数据为同一份，不支持truncate和drop table等涉及删除文件操作语句的备份恢复操作。

数据仓库服务 GAUSSDB(DWS)

共100000条

undefined

意见反馈

0/200

提交取消

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

华为云用户手册

7*24

备案

专业服务

退订

建议反馈

售前咨询热线