ClickHouse 到底是什么?-clickhouse深度揭秘

2023-08-07 10:57:44

 

为什么叫ClickHouse?

ClickHouse的全称由两部分组成,第一个是Click Stream点击流,第二个是数据仓库Data Ware House,把这两个单词的一首一尾合起来就叫ClickHouse。如果大家很了解这个领域的话,只通过这个名字,就可以一眼看出它的初衷,ClickHouse最原本要去解决的问题是如何支撑基于点击流的数据仓库

ClickHouse最开始是从在Yandex发迹起来的。Yandex是一家来自俄罗斯的互联网公司,以搜索引擎起家,是俄国第一的搜索引擎。除了搜索引擎以外,还有50多种b2b和b2c的产品,体量很大。众所周知,搜索引擎的很大一部分营收是广告流量带来的,所以通常一家搜索引擎公司的背后都会伴生一个流量站点的分析网站。Yandex也有一个自己的流量站点分析工具平台,叫Metrica,它是现在全球第三大网络流量分析工具,每天处理超过30亿个事件,其中分析覆盖数百万网站,每天拥有超过10万分析师用户,而ClickHouse就是在背后去支撑这个平台运转的。

在2021年,ClickHouse的初创团队也独立成立了同名的商业化公司,并在9月获得了5000万美元的A轮投资,同年10月获得了2.5亿美元的B轮投资,公司聚焦在ClickHouse云服务上。

ClickHouse的显著特征

①入门简单

是一款OLAP数据库,具备完整的DBMS功能,支持SQL,提供DDL、DML语句。以ROLAP模型为主,同时也支持 MOLAP(特殊的表引擎+物化视图),支持 Projection。

②Everything is table

面向表编程,提供数十种表引擎,包含代理访问外部资源(例如Zookeeper,HDFS,文件等)。内置Mysql,PostgreSQL binlog监听。甚至贡献者名单也有专门一张表。

③接口丰富

提供TCP、HTTP底层访问接口,提供JDBC、CLI等封装接口。

兼容 MySQL、Postgres 客户端 支持Java、Python、Nodejs等众多第三方接口,内置数百个函数。

④在线查询

实时应答,无需预处理。也支持立方体预聚合

分布式架构

MPP架构,支持集群模式,支持数据分区、分片、副本。

⑥高性能

列存、高压缩、向量化引擎,秒杀一切的性能。单机部署,即拥有高性能。

⑦安全可靠

熔断机制,防误删机制

⑧完善的权限系统

RBAC,客户端接入权限,资源访问权限,操作访问权限,数据行级权限。

开源软件,社区活跃

2016年开源,Apache-2.0协议。

850+ Contributors、21.1K+ Star 、4.1K Forks,发版速度和它的性能一样快。


以上就是关于《ClickHouse 到底是什么?-clickhouse深度揭秘》的全部内容,本文网址:https://www.7ca.cn/baike/59634.shtml,如对您有帮助可以分享给好友,谢谢。
标签:
声明

排行榜