且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

pgpool-II的性能缺陷

更新时间:2022-09-24 19:51:44

pgpool-II在运行在 replication mode的时候,性能低下。

经过分析,发现无解:这是由pgpool-II的执行方式决定的。
pgpool-II 刚开始运行的时候,就会开很多子进程,缺省值128。
但是,每当客户端来一个请求,就会有一个子进程全权负责,别的子进程不插手。

而在replication mode,该子进程需要和多个DB节点打交道:
比如把客户端的SQL文,发送给每一个DB节点。
在给各个节点发送SQL文的时候,如果想要效率高,要么开子进程或线程来并行。要么采用某种非阻塞方式向各个节点发请求。

然而,pgpool-II的开发者,采用了效率最为低下的做法:顺次执行。就是说对第一个DB节点发SQL文,待第一个DB节点运行此SQL文结束,再向第二个DB节点发SQL文。

此种做法,如果运行在业务不繁忙的系统里尚可,在繁忙的系统里,那就是致命的缺陷。

验证如下:先在各个DB节点,作如下的函数:

pgpool-II的性能缺陷
CREATE FUNCTION loopforid()
RETURNS INTEGER LANGUAGE plpgsql AS $$
  DECLARE
     ret INTEGER;
  BEGIN
     PERFORM pg_sleep(30);
     ret:=100;
     
     RETURN ret;
  END; $$;
pgpool-II的性能缺陷

然后,在pgpool-II中执行类似:update a8 set id=(select loopforid() ) where id=10; 的操作。

再来看pgpool-II的log,可以看到:

在DB1 节点执行完毕后,又过了大约30秒,才开始在DB2节点执行。所以说,它是串行的。

因此,当后台DB节点增加的时候,通过pgpool-II的replication mode来运行的程序,其insert/update/delete性能将随着节点数目的增加而成比例下降。








本文转自健哥的数据花园博客园博客,原文链接:http://www.cnblogs.com/gaojian/archive/2012/08/08/2627868.html,如需转载请自行联系原作者