Clickhouse原理与应用实践（一）基础介绍

Clickhouse原理与应用实践（一）基础介绍

作者: kaiker | 来源:发表于2022-08-05 14:10 被阅读0次

Clickhouse原理与应用实践（一）基础介绍
ClickHouse原理解析与应用实践
《ClickHouse原理解析与应用实践》读书总结
Clickhouse原理与应用实践（三）MergeTree原理解
Clickhouse原理与应用实践（五）副本与分片
Javascript
《深度学习：原理与应用实践.pdf》PDF高清完整版-免费下载
ClickHouse 基础介绍
Clickhouse原理与应用实践（四）表引擎以及查询
Materialize MySQL引擎：MySQL到Click

1、ClickHouse发展历程及不适用场景

Mysql MyISAM - Metrage LSM、预聚合 - OLAPServer - Clickhouse

发展

不适用的场景：

不支持事务。
按行查询、删除。

2、核心特性

2.1 列式存储和数据压缩

数据按列进行组织，术语同一列的数据会被保存在一起。列与列之间也会由不同的文件分别保存。
数据默认使用LZ4算法压缩。

2.2 向量化执行引擎

向量化执行，可以简单地看做一项消除程序中循环执行的优化。
实现向量化执行需要利用CPU的SIMD指令。通过数据并行以提高性能的一种实现方式，在CPU寄存器层面实现数据的并行操作。

2.3 多样化的表引擎

将存储部分进行抽象，把存储引擎作为一层独立接口。
合并树、内存、文件等类型。

2.4 多线程与分布式

SIMD不适合用于带有较多分支判断的场景，使用多线程技术提速。
在数据存取方面，既支持分区，也支持分片。

2.5 多主架构

集群中的每个节点角色对等，客户端访问任意一个节点都能得到相同效果。

2.6 数据分片与分布式查询。

每个集群由一到多个分片组成，每个分片对应了ClickHouse的1个服务节点。
分片的数量上限取决于节点数量。
提供本地表和分布式表概念。一张本地表等同于一份数据分片，分布式表本身不存储任何数据，它是本地表的访问代理。

3、架构设计

3.1 Column与Field

内存中的一列数据由一个Column对象表示。
如果需要操作单个具体数值则需要使用Field对象，Field对象代表一个单值。

3.2 DataType

负责数据序列化和反序列化。
不直接负责数据读取，转由Column或Field对象获取。

3.3 Block与Block流

Clickhouse内部数据操作是面向Block对象进行的，采用流形式。
Block对象本质是由数据对象、数据类型和列名组成的三元组。Column + DataType + 列名。
Block没有直接聚合Column和DataType对象，通过ColumnWithTypeAndName对象进行间接引用。
IBlockInputStream负责读取数据和关系运算，IBlockOutputStream负责将数据输出到下一环节。

核心模块

3.4 Table

直接使用IStorage接口指代数据表。
IStorage接口定义了DDL、read和write方法。
查询时，IStorage负责根据AST查询语句的指示要求，返回指定列的原始数据。后续对数据的进一步加计算统一交由Interpreter解释器对象处理。

3.5 Parser与Interpreter

Parser负责创建AST对象。将一条SQL执行语句以递归下降的方法解析成AST语法树的形式。
Interpreter解释器负责解释AST并进一步创建查询执行管道。就像服务层一样，起到串联整个查询过程的作用。它会根据解释器类型聚合它所需要的资源，首先解析AST对象，执行业务逻辑，最终返回IBlock对象。

3.6 Functions与Aggregate Functions

普通函数由IFunction定义。
聚合函数由IAggregateFunction定义，聚合函数的状态支持序列化反序列化以实现在分布式节点间传输。

3.7 Cluster与Replication

集群由分片组成。分片由副本组成。
一个节点只能拥有一个分片。
分片知识一个逻辑概念，物理承载由副本承担。这个副本也不能理解成一份数据的副本，应该理解成一个数据存储的载体概念。

相关文章

Clickhouse原理与应用实践（一）基础介绍
1、ClickHouse发展历程及不适用场景 Mysql MyISAM - Metrage LSM、预聚合 - O...
ClickHouse原理解析与应用实践
第1章 ClickHouse的前世今生在大量数据分析场景的解决方案中，传统关系型数据库很快就被Hadoop生态所...
《ClickHouse原理解析与应用实践》读书总结
本文是对《ClickHouse原理解析与应用实践》一书的概括性总结，整体章节和结构尊重原文，由于书的出版在2019...
Clickhouse原理与应用实践（三）MergeTree原理解
1、MergeTree创建方式与存储结构 MergeTree在写入一批数据时，数据总会以数据片段的形式写入磁盘，且...
Clickhouse原理与应用实践（五）副本与分片
1、概述下图中N1和N2内容不同，则N1 N2互为分片。如果内容相同，则互为副本。 2、数据副本只有使用了Re...
Javascript
JS基础《Javascript原理、方法与实践》《JS原理、方法与实践》- Javascript简介《JS原...
《深度学习：原理与应用实践.pdf》PDF高清完整版-免费下载
《深度学习：原理与应用实践.pdf》PDF高清完整版-免费下载《深度学习：原理与应用实践.pdf》PDF高清完整...
ClickHouse 基础介绍
什么是ClickHouse? ClickHouse 是面向 OLAP 的分布式列式 DBMS. 在“正常”的面向行...
Clickhouse原理与应用实践（四）表引擎以及查询
1、MergeTree 1.1 TTL 存在列级TTL、表级TTL。 TTL create_time + INTE...
Materialize MySQL引擎：MySQL到Click
摘要： MySQL到ClickHouse数据同步原理及实践引言熟悉MySQL的朋友应该都知道，MySQL集群主...

网友评论

本文标题：Clickhouse原理与应用实践（一）基础介绍

本文链接：https://www.haomeiwen.com/subject/ccmkwrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Clickhouse原理与应用实践（一）基础介绍|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！