TiDB TPC-H 性能对比测试报告 - v5.4 MPP 模式对比 Greenplum 6.15.0 以及 Apache Spark 3.1.1

    TiDB v5.0 中引入的 组件的 MPP 模式大大幅增强了 TiDB HTAP 形态。本文的测试对象如下:

    • Greenplum 6.15.0
    • Apache Spark 3.1.1 + Parquet
    • CPU:Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz,40 核
    • 内存:189 GB

    TiDB v5.4 配置

    v5.4 的 TiDB 集群除以下配置项外均使用默认参数配置。所有 TPC-H 测试表均以 TiFlash 列存进行同步,无额外分区和索引。

    使用 SQL 语句设置以下会话变量:

    Greenplum 配置

    Greenplum 集群使用额外的一台 Master 节点部署(共四台),每台 Segment Server 部署 8 Segments(每个 NVMe SSD 各 4 个),总共 24 Segments。存储格式为 append-only / 列式存储,分区键为主键。

    Apache Spark 配置

    以上性能图中蓝色为 TiDB v5.4,红色为 Greenplum 6.15.0,黄色为 Apache Spark 3.1.1,纵坐标是查询的处理时间。纵坐标数值越低,表示 TPC-H 性能越好。