首页 > 快讯 >

每日热门:GaussDB(DWS)查询过滤器原理与应用

2023-06-08 07:19:42 来源:博客园
摘要:GaussDB(DWS)查询过滤器(黑名单)提供查询过滤功能,支持自动隔离反复被终止的查询,防止烂SQL再次执行。

本文分享自华为云社区《GaussDB(DWS)查询过滤器原理与应用》,作者:门前一棵葡萄树 。


【资料图】

一、概述

GaussDB(DWS)查询过滤器(黑名单)提供查询过滤功能,支持自动隔离反复被终止的查询,防止烂SQL再次执行。

主要应用场景包含以下两种:

1. 异常熔断机制

配置异常规则后,查询触发异常规则后,异常信息将被记录在dbms_om.gs_blocklist_query系统表中。同一个查询触发异常规则次数超限(query_exception_count_limit)后,查询自动加入黑名单,黑名单信息同样保存在dbms_om.gs_blocklist_query系统表中。加入黑名单后,该查询将被隔离,拒绝执行。

2. 紧急拦截

作业引发CORE、hang或性能大幅下降等问题时,需要紧急规避时,可以将作业加入黑名单进行过滤。

原理介绍

查询过滤器使用作业Unique SQL ID保存和识别作业黑名单和异常信息,在SQL中常数值发生变化时作业Unique SQL ID不会随之发生变化。Unique SQL ID是遍历查询解析树计算出来的一个整数值,用于标识一类SQL。通常对于DML语句,在计算Unique SQL ID的过程中会忽略常量值。但对于DDL、DCL以及设置参数等语句,常量值不会忽略。例如,以下两个查询:

select * from t1 where id = 1;select * from t1 where id = 2;

这两条SQL除过滤条件中的常量不同外,其他全部相同,由此生成的解析树拓扑完全相同,因此Unique SQL ID相同。Unique SQL ID的计算只会忽略常数值,而不会忽略其他差异,SQL语句“select * from t2 where id = 1;”与上述两个SQL的Unique SQL ID就不相同。

将作业加入黑名单主要有以下两种方式:

作业执行前判断作业是否在黑名单中,如果作业在黑名单中,拒绝作业执行,直接报错退出。

作业被拒绝执行后,对作业加入黑名单原因进行分析,问题解决后调用内置函数gs_remove_blocklist(unique_sql_id int8)将作业移除黑名单。

二、应用示例

2.1 异常熔断示例

1. 设置异常熔断阈值。假设设置query_exception_count_limit=1,即只要作业触发异常规则作业就会被加入黑名单。

2. 配置异常规则

创建CPU平均使用率异常规则cpu_percent_except,作业运行时间超过2000秒且CPU使用率达到30%时触发异常退出:

CREATE EXCEPT RULE cpu_percent_except WITH(ELAPSEDTIME=2000, CPUAVGPERCENT=30);

异常规则还支持BLOCKTIME、ALLCPUTIME、SPILLSIZE等异常的识别处理,具体可参考:异常规则简介与演变。

3. 创建资源池respool1关联异常规则cpu_percent_except

CREATE RESOURCE POOL respool1 WITH(except_rule="cpu_percent_except");

资源池支持最多关联63个异常规则集,每个异常规则集间独立生效,互不影响。

4. 创建业务用户usr1,关联资源池respool1:

CREATE USER usr1 RESOURCE POOL "respool1" PASSWORD "XXXXXX";

5. 用户usr1运行作业,作业运行时间超过2000秒且CPU使用率达到30%时触发“cpu_percent_except”异常规则,作业触发异常规则后资源管理对作业进行以下处理:

6. 查询作业黑名单和异常信息:

SELECT * FROM dbms_om.gs_blocklist_query; unique_sql_id | block_list | except_num | except_time---------------+------------+------------+---------------------------- 4066836196 | t          | 1 | 2022-08-08 18:00:00.596269(1 row)

7. 用户usr1再次运行作业触发异常熔断,GaussDB(DWS)的异常熔断机制禁止该作业执行。

ERROR:  The query is in the blocklist and cannot be run, unique_sql_id(4066836196).HINT:  If you want to run the query later, confirm the reason why the query is blocklisted and remove the query from the blocklist after resolving the problem.

8. 优化用户usr1所运行ID为4066836196的SQL后,将ID为4066836196的SQL从黑名单移除。

确认SQL异常原因,如果异常规则配置不合理,修改异常规则;如果异常规则合理,对SQL进行优化后重新运行。确认问题解决后将SQL移除黑名单。

select gs_remove_blocklist(4066836196); gs_remove_blocklist--------------------- t(1 row)

2.2 紧急拦截示例

查询过滤器使用作业Unique SQL ID识别和保存黑名单信息,为有效运用查询过滤器紧急拦截功能,建议TopSQL开启,在作业引发CORE、报错、性能下降等问题时可以快速获取作业Unique SQL ID。

2.2.1 获取作业Unique SQL ID

获取作业Unique SQL ID的几种方法:

1. 作业引发报错/性能下降

CN日志中获取作业query_id,执行以下命令查询作业Unique SQL ID。

select queryid,unique_sql_id,query from pgxc_wlm_session_info where queryid=query_id;

2. 作业引发CN示例CORE

解析CORE打印内存中保存的Unique SQL ID对应的变量参数值。

3. 作业引发DN实例CORE

作业引发DN实例CORE时,CN侧体现为作业报错,Unique SQL ID获取方式可以参考作业报错时Unique SQL ID获取方式。

4. EXPLAIN VERBOSE获取Unique SQL ID(通用方法,但是仅821及以上版本支持)

EXPLAIN VERBOSE不会实际执行SQL,因此一般不会导致问题发生,使用EXPLAIN VERBOSE XXX;可以打印得到作业Unique SQL ID。示例:

postgres=# explain verbose select count(1) from pg_class;                                                                           QUERY PLAN-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------  id |               operation                | E-rows | E-distinct | E-width | E-costs ----+----------------------------------------+--------+------------+---------+--------- 1 | ->  Aggregate | 2 | | 8 | 52.94 2 | ->  Seq Scan on pg_catalog.pg_class | 1034 | | 0 | 50.34 Targetlist Information (identified by plan id) ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- 1 --Aggregate         Output: count(1) 2 --Seq Scan on pg_catalog.pg_class         Output: relname, relnamespace, reltype, reloftype, relowner, relam, relfilenode, reltablespace, relpages, reltuples, relallvisible, reltoastrelid, reltoastidxid, reldeltarelid, reldeltaidx, relcudescrelid, relcudescidx, relhasindex, relisshared, relpersistence, relkind, relnatts, relchecks, relhasoids, relhaspkey, relhasrules, relhastriggers, relhassubclass, relcmprs, relhasclusterkey, relrowmovement, parttype, relfrozenxid, relacl, reloptions, relreplident, relfrozenxid64 ====== Query Summary ===== -------------------------- Parser runtime: 0.027 ms Planner runtime: 0.561 ms Unique SQL Id: 2307078791(17 rows)

2.2.2 将作业加入黑名单

获取到作业Unique SQL ID后,调用内置函数gs_append_blocklist(unique_sql_id int8)将作业加入黑名单:

postgres=# select * from gs_append_blocklist(2307078791); gs_append_blocklist--------------------- t(1 row)

2.2.3 查询黑名单信息

作业加入黑名单后,查询系统表确认黑名单加入是否成功:

postgres=# SELECT * FROM dbms_om.gs_blocklist_query; unique_sql_id | block_list | except_num | except_time---------------+------------+------------+------------- 2307078791 | t          | 0 |(1 row)

2.2.4 再次执行作业触发紧急拦截

postgres=# select count(1) from pg_class;ERROR:  The query is in the blocklist and cannot be run, unique_sql_id(2307078791).HINT:  If you want to run the query later, confirm the reason why the query is blocklisted and remove the query from the blocklist after resolving the problem.

2.2.5 问题解决,将作业移出黑名单

postgres=# select gs_remove_blocklist(2307078791); gs_remove_blocklist--------------------- t(1 row)

点击关注,第一时间了解华为云新鲜技术~

上一篇:

崇山峻岭的意思和拼音_崇山峻岭的意思 全球热点

下一篇:

最后一页

x
推荐阅读

每日热门:GaussDB(DWS)查询过滤器原理与应用

崇山峻岭的意思和拼音_崇山峻岭的意思 全球热点

大衣哥真当爷爷了?陈萌连续三次晒出双胞胎照片,朱单伟喜当爹_每日播报

云辇-P加持仰望U8,让越野和公路都从容不迫|热文

【新视野】地球的宜居时间还有多少年_为什么说地球宜居的时间只有10亿年了

全球快资讯丨组图|2023海南高考首场考试结束

寻找叛徒任务流程(寻找叛徒任务怎么做?)

今日热门!金禄电子涨20.01%

北京开启不动产登记“跨省通办”新模式

江西临川:“维权娘家”情系农民工

协鑫能科调整发行可转债方案 删减“年产3万吨电池级碳酸锂项目”

环球热头条丨天龙集团:公司四大系统平台已初步实现AI升级植入的运营模式

国恩股份:浙江一塑2023年1季度经营状况良好 焦点日报

沈阳市气象局发布雷雨大风黄色预警【Ⅲ级/较重】【2023-06-07】

视点!电视剧错婚的主演是谁_错婚 2012年安战军执导的电视剧

高温下,江苏单日用电负荷破1亿千瓦提前出现江苏用电负荷增超17%|全球速读

建工修复拟定增募不超2.25亿元 2021年上市募3.04亿元 焦点热文

庄浪县气象台发布雷电黄色预警信号【2023-06-07】_当前消息

雷阵雨+8级阵风,将影响晚高峰!天津发布雷雨大风蓝色预警

小米14系列两大新升级曝光!消灭多年遗憾

高雅艺术进校园雷波民族音乐专场走进四川农业大学

“梦想守护者”——高考将至,他们合力为福州学子“保驾护航”! 全球快播

环球观点:下列属于信息技术范畴的是_信息技术 用于管理和处理信息所采用各种技术总称

天天快消息!景津装备:公司产品可用于养殖行业的屠宰、粪便污水及沼渣沼液处理等

EDUCAUSE 2023年度十大IT议题⑤丨改进高校IT服务 支持混合工作模式

朱雀基金增持金力永磁(06680)11.08万股 每股作价17.12港元

惠誉下调美国不动产相关产业评级展望至恶化

“中国飞船把我的梦想带上太空”

铜陵有色:公司阴极铜的原材料来源分为自产铜精矿和国内、国外采购铜精矿模式

全球实时:每经操盘必知(下午版)丨创业板指跌1.61%,AI概念股逆势大涨;长春高新回应股价跌停;中国消费者协会:警惕培训班退费骗局

环球简讯:清穿之九福晋日常生活 清穿之九福晋生了七个

环球焦点!概念动态|康冠科技新增“虚拟现实”概念

治网暴没有局外人_世界播报

首批10只“国宝”朱鹮落户盐城

牦牛控股研发费用率低于可比公司均值,本科及以上员工占比不足6% 天天热门

环球聚焦:塞尔达传说王国之泪格鲁德之枪✨在哪里

国网武邑县供电公司:全力护航高考 保障供电可靠-焦点简讯

全球通讯!新房开荒保洁怎么做

以人民币计价 中国5月份出口同比下降0.8% 今亮点

为荷是什么意思_为荷|天天快看点

观课堂样态 军山中学举行新岗教师汇报课展示-观察

全球视点!国内期货主力合约涨跌互现

今日热文:西安市第一医院新院区全面开诊

今日观点!罗博特科:参股公司ficonTEC一直有向英伟达提供设备

无花果治痔疮怎么用效果好_无花果治痔疮怎么用 环球快看点

我愚蠢的欧豆豆梗表情包_欧豆豆是啥意思日语我愚蠢的欧豆豆梗

世界热文:什么叫跨高比不小于5_什么叫跨高比

首都机场国门安检陈星:用青春守护国门安全

天天快看:韩傀读gui还是kui_韩傀

仲姓名人_仲姓