在Klustron集群中执行长时耗语句所需的设置

Klustron大约 8 分钟

在Klustron集群中执行长时耗语句所需的设置

前言

一个分布式计算和存储系统的任何节点都可能因为节点负载过重，节点的计算、存储资源不足，网络延时，网络短暂不可达、计算或者存储工作量巨大等原因而导致操作超时。
分布式系统的任何操作在等待远程节点返回期间，通常会持有各种资源，不可以无限制等待下去，否则系统整体运行都会因此被阻塞而逐步停滞。

所以超时控制是所有分布式系统需要去解决好的问题，而解决不好就会导致系统运行停滞，无法正常工作。klustron有一系列超时控制变量，在执行特殊任务时需要特殊设置。

另外，在执行OLAP类型的查询时，需要增大CPU、内存资源配置，以便提升OLAP查询的性能。

本文介绍这些需要在特殊场景设置的超时参数和资源参数。

当执行OLAP分析时，通常应用发起的连接数量并不多，但是每个语句执行所需的CPU和内存资源较大，所以需要在计算节点和存储节点中做适当设置以便达到最好的性能。本文列出这些变量，具体设置的数值可以按需调整，需要参考PostgreSQL或者MySQL的参考文档理解相关变量的意义和合理值范围。另外，可以在独立的若干个服务器上面专门安装若干个计算节点用于执行OLAP查询，并且使用Klustron的读写分离功能连接到备机执行OLAP功能，这样就完全把OLTP负载和OLAP负载分隔在不同的服务器上，不会相互干扰影响性能。

从1.3版本开始，用户可以设置enable_olap_mode=true来一次性在计算节点和存储节点中完成下述设置。

在计算节点(Klustron-server)中设置如下变量

max_parallel_workers_per_gather = 32
max_parallel_workers = 128
work_mem = 64MB

在存储节点(Klustron-storage)中设置如下变量

optimizer_switch='mrr_cost_based=off,batched_key_access=on'
join_buffer_size = 128M
sort_buffer_size = 64M 
read_rnd_buffer_size = 64M

结语

Klustron 具备完善的超时控制机制，在任何节点间通信机制中都有超时控制，确保任何操作都有最大时耗上限，确保系统状态可以持续推进，系统资源持续可服务更多的服务请求。

在Klustron集群中执行长时耗语句所需的设置

在Klustron集群中执行长时耗语句所需的设置

前言

Klustron 的超时控制机制简介

Klustron 有以下超时控制变量

在以下特殊场景需要修改超时变量

Klustron 计算节点的超时变量功能

1. statement_timeout：语句超时。

2. mysql_read_timeout 和 mysql_write_timeout：计算节点于存储节点/元数据节点之间的通信收发（读写）超时。

3. lock_timeout：计算节点等待表锁的时间。

4. log_min_duration_statement：超过这个时间的语句会作为慢查询记录到日志文件中。

Klustron 存储节点的超时变量功能

OLAP mode的设置

在计算节点(Klustron-server)中设置如下变量

在存储节点(Klustron-storage)中设置如下变量

结语

END