列式数据库是一种与传统的行式数据库不同的数据存储方式。在列式数据库中,数据是按照列来存储的,而不是像行式数据库那样按行存储。这种存储方式具有以下一些显著的优点:高效的压缩:由于同一列的数据通常具有相似的特征,所以可以进行更高效的数据压缩,从而节省存储空间。
在读取时,由于会读取大量无效列数据,譬如 select name from R where age < 40,那么对于每次 age 的遍历,除了会将无用的其他数据一起读入,每次读取 record,都可能会引起 cache miss。
列存储数据库:数据按列来存储,可能每行有大量的列,也可能每行的列数不一样。例子包括Apache HBase、Azure Table Storage、Apache Cassandra和Google Cloud Bigtable。
4月20日消息,蚂蚁集团自研数据库OceanBase发布4.3版本,推出全新列式存储引擎,打造PB级实时分析数据库,可实现秒级实时分析,进一步加强TP/AP一体化。现场跑分显示,在同等硬件条件下,OceanBase4.3的AP查询性能已达到业内一流列存大宽表数据库同一水平。