From 6cdf8a68a3082e048b76b825bb0997d49ea5bd18 Mon Sep 17 00:00:00 2001
From: lilin90 <lilin@pingcap.com>
Date: Tue, 21 Aug 2018 11:11:50 +0800
Subject: [PATCH] overview: add content about TiSpark

Via: https://github.com/pingcap/docs-cn/pull/838/commits/39449275e458dbceceaff1fb82cebaaa75e84a46
---
 overview.md | 8 +++++---
 1 file changed, 5 insertions(+), 3 deletions(-)

diff --git a/overview.md b/overview.md
index d2a247190733..f638b1956eed 100644
--- a/overview.md
+++ b/overview.md
@@ -47,12 +47,10 @@ TiDB 对业务没有任何侵入性，能优雅的替换传统的数据库中间
 
 ## TiDB 整体架构
 
-要深入了解 TiDB 的水平扩展和高可用特点，首先需要了解 TiDB 的整体架构。
+要深入了解 TiDB 的水平扩展和高可用特点，首先需要了解 TiDB 的整体架构。TiDB 集群主要包括三个核心组件：TiDB Server，PD Server 和 TiKV Server。此外，还有用于解决用户复杂 OLAP 需求的 [TiSpark](https://github.com/pingcap/tispark/) 组件。
 
 ![TiDB Architecture](media/tidb-architecture.png)
 
-TiDB 集群主要分为三个组件：
-
 ### TiDB Server
 
 TiDB Server 负责接收 SQL 请求，处理 SQL 相关的逻辑，并通过 PD 找到存储计算所需数据的 TiKV 地址，与 TiKV 交互获取数据，最终返回结果。TiDB Server 是无状态的，其本身并不存储数据，只负责计算，可以无限水平扩展，可以通过负载均衡组件（如LVS、HAProxy 或 F5）对外提供统一的接入地址。
@@ -67,6 +65,10 @@ PD 是一个集群，需要部署奇数个节点，一般线上推荐至少部
 
 TiKV Server 负责存储数据，从外部看 TiKV 是一个分布式的提供事务的 Key-Value 存储引擎。存储数据的基本单位是 Region，每个 Region 负责存储一个 Key Range（从 StartKey 到 EndKey 的左闭右开区间）的数据，每个 TiKV 节点会负责多个 Region。TiKV 使用 Raft 协议做复制，保持数据的一致性和容灾。副本以 Region 为单位进行管理，不同节点上的多个 Region 构成一个 Raft Group，互为副本。数据在多个 TiKV 之间的负载均衡由 PD 调度，这里也是以 Region 为单位进行调度。
 
+### TiSpark
+
+TiSpark 作为 TiDB 中解决用户复杂 OLAP 需求的主要组件，将 Spark SQL 直接运行在 TiDB 存储层上，同时融合 TiKV 分布式集群的优势，并融入大数据社区生态。至此，TiDB 可以通过一套系统，同时支持 OLTP 与 OLAP，免除用户数据同步的烦恼。
+
 ## 核心特性
 
 ### 水平扩展