ClickHouse 列式存储的优点有哪些?

2022-10-24T11:04:00

当分析场景中往往需要读大量行但是少数几个列时,在行存模式下,数据按行连续存储,所有列的数据都存储在一个 block 中,不参与计算的列在 IO时也要全部读出,读取操作被严重放大。而列存模式下,只需要读取参与计算的列即可,极大的减低了 IO cost,加速了查询。
同一列中的数据属于同一类型,压缩效果显著。列存往往有着高达十倍甚至更高的压缩比,节省了大量的存储空间,降低了存储成本。
更高的压缩比意味着更小的 data size,从磁盘中读取相应数据耗时更短。
自由的压缩算法选择。不同列的数据具有不同的数据类型,适用的压缩算法
也就不尽相同。可以针对不同列类型,选择最合适的压缩算法。
高压缩比,意味着同等大小的内存能够存放更多数据,系统 cache 效果更好。

当前页面是本站的「Baidu MIP」版。发表评论请点击:完整版 »