数据库对比
列式存储: 按列进去,适合单列分析(聚合运算sum).按列查询., 同列数据类型一致,压缩率可达行式存储的5-10倍,
批量写操作,因为可以按列io,
单行写入需多次磁头调度(每次耗时1-10ms),而行式存储仅需单次定位,
同一分区内批量写入可减少跨节点/分区的协调开销,显著提升吞吐量,若批量操作包含多个分区键,会导致跨节点协调和锁竞争,反而降低吞吐量
批量写入,5-50条+,应该<5M, 避免触发发压制机制.
稀疏数据存储, 比如存在大量空值或稀疏字段。
避免行式存储中空值占用冗余空间
行式存储: 需要频繁插入、更新或基于整行数据进行操作,按行操作
写入模式 | 列式存储吞吐量 | 行式存储吞吐量 | 优势场景 |
---|---|---|---|
单行随机写入 | 低(约1k TPS) | 中(约5k TPS) | 行式存储占优56 |
批量顺序写入 | 高(约50k TPS) | 中(约10k TPS) | 列式存储占优35 |
问: 写入密集但是每次单行写入,无需事务,用什么数据库好