From 6cdf8a68a3082e048b76b825bb0997d49ea5bd18 Mon Sep 17 00:00:00 2001 From: lilin90 Date: Tue, 21 Aug 2018 11:11:50 +0800 Subject: [PATCH] overview: add content about TiSpark Via: https://github.com/pingcap/docs-cn/pull/838/commits/39449275e458dbceceaff1fb82cebaaa75e84a46 --- overview.md | 8 +++++--- 1 file changed, 5 insertions(+), 3 deletions(-) diff --git a/overview.md b/overview.md index d2a247190733..f638b1956eed 100644 --- a/overview.md +++ b/overview.md @@ -47,12 +47,10 @@ TiDB 对业务没有任何侵入性,能优雅的替换传统的数据库中间 ## TiDB 整体架构 -要深入了解 TiDB 的水平扩展和高可用特点,首先需要了解 TiDB 的整体架构。 +要深入了解 TiDB 的水平扩展和高可用特点,首先需要了解 TiDB 的整体架构。TiDB 集群主要包括三个核心组件:TiDB Server,PD Server 和 TiKV Server。此外,还有用于解决用户复杂 OLAP 需求的 [TiSpark](https://github.com/pingcap/tispark/) 组件。 ![TiDB Architecture](media/tidb-architecture.png) -TiDB 集群主要分为三个组件: - ### TiDB Server TiDB Server 负责接收 SQL 请求,处理 SQL 相关的逻辑,并通过 PD 找到存储计算所需数据的 TiKV 地址,与 TiKV 交互获取数据,最终返回结果。TiDB Server 是无状态的,其本身并不存储数据,只负责计算,可以无限水平扩展,可以通过负载均衡组件(如LVS、HAProxy 或 F5)对外提供统一的接入地址。 @@ -67,6 +65,10 @@ PD 是一个集群,需要部署奇数个节点,一般线上推荐至少部 TiKV Server 负责存储数据,从外部看 TiKV 是一个分布式的提供事务的 Key-Value 存储引擎。存储数据的基本单位是 Region,每个 Region 负责存储一个 Key Range(从 StartKey 到 EndKey 的左闭右开区间)的数据,每个 TiKV 节点会负责多个 Region。TiKV 使用 Raft 协议做复制,保持数据的一致性和容灾。副本以 Region 为单位进行管理,不同节点上的多个 Region 构成一个 Raft Group,互为副本。数据在多个 TiKV 之间的负载均衡由 PD 调度,这里也是以 Region 为单位进行调度。 +### TiSpark + +TiSpark 作为 TiDB 中解决用户复杂 OLAP 需求的主要组件,将 Spark SQL 直接运行在 TiDB 存储层上,同时融合 TiKV 分布式集群的优势,并融入大数据社区生态。至此,TiDB 可以通过一套系统,同时支持 OLTP 与 OLAP,免除用户数据同步的烦恼。 + ## 核心特性 ### 水平扩展