转摘4 Introducing ClickHouse Fast Open Source Columnar Dat

希叡阅读量 11

作者:禅与计算机程序设计艺术

1.简介

Clickhouse是由yandex公司开源的一款列存数据库产品。它的设计目标是解决传统数据库在海量数据存储和高查询性能上的两个难点:第一个难点是由于索引过于复杂导致的查询效率低下;第二个难点是传统的基于行的结构无法有效支持海量数据的实时分析和查询。因此,Yandex创造了一种新的数据模型-"列式"模型,使得在一个基于磁盘的列存储引擎上存储海量数据成为可能。

Clickhouse是一个高度可扩展、可靠性好、支持多种数据源的数据仓库系统,能够快速地响应复杂的查询请求。它通过分布式集群架构将计算和存储分离开,实现了高可用、水平扩展等功能。它的特点包括以下几方面:

1)支持SQL和非SQL查询语言;

2)自动数据分片和索引;

3)提供实时的查询;

4)支持多种存储引擎;

5)支持快速导入和导出;

6)支持高并发读写;

7)支持在线数据备份和恢复。

本文首先介绍Clickhouse产品的背景、特性和功能。然后对其底层数据存储结构及其优化策略进行详细阐述,以及如何结合SQL语法、函数库和其他组件开发出具有独到功能的应用系统。最后,作者会讨论Clickhouse未来的发展方向,以及作者认为还有哪些待完成的工作,以及如何贡献给社区。希望能够从Clickhouse的角度,带领读者了解更多有关列存数据库的知识。

2.相关概念和术语

数据模型和存储结构

列存数据库概览

列存数据库(Columnar database)是一种用来存储

复制代码
    ===========================
    【来源: CSDN】
    【作者: 禅与计算机程序设计艺术】
    【原文链接】 https://dreamit.blog.csdn.net/article/details/132522072
    声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。
0/300
全部评论0
0/300