简介
Apache Kylin 和 Doris 都是面向大数据的 OLAP 解决方案,旨在提供灵活的 SQL 查询能力以及高性能的分析能力。但两者的架构、使用场景和支持特性有所不同。
架构对比
Apache Kylin
- 架构设计:Kylin 是基于 Hadoop 的列式存储框架,使用 CUBRID 和 HBase 存储事实表和维度表。
- 数据处理:Kylin 使用 Hive 作为元数据存储,并提前在 HDFS 中建立 MOLAP 型索引。
- 实时性:Kylin 通常是批处理模式,不太适合实时查询。
- 扩展性:Kylin 需要预先计算数据,因此在大规模数据处理时扩展性有限。
Doris
- 架构设计:Doris 采用 MillWheel 实时计算引擎和分布式存储技术。
- 数据处理:Doris 支持实时和批量数据处理,同时具备较好的数据倾斜处理能力。
- 实时性:Doris 能够支持毫秒级延迟的查询,高效地支持实时数据分析。
- 扩展性:Doris 依靠分片和水平扩展,可以轻松应对大数据环境下的高数据量和高并发查询需求。