diff --git a/docs/zh/introduction/Architecture.md b/docs/zh/introduction/Architecture.md index 4692e51c33216..0ac7f41366959 100644 --- a/docs/zh/introduction/Architecture.md +++ b/docs/zh/introduction/Architecture.md @@ -4,13 +4,13 @@ displayed_sidebar: Chinese # 架构 -StarRocks 的架构简单明了。整个系统仅由两种组件组成:前端和后端。前端节点称为 **FE**。后端节点有两种类型,**BE** 和 **CN** (计算节点)。当使用本地存储数据时,部署 BE;当数据存储在对象存储或 HDFS 时,部署 CN。StarRocks 不依赖任何外部组件,简化了部署和维护。节点可以水平扩展而不影响服务正常运行。此外,StarRocks 具有元数据和服务数据副本机制,提高了数据可靠性,有效防止单点故障 (SPOF)。 +StarRocks 架构简洁明了,整个系统仅由两种组件组成:前端和后端。前端节点称为 **FE**。后端节点有两种类型,**BE** 和 **CN** (计算节点)。当使用本地存储数据时,您需要部署 BE;当数据存储在对象存储或 HDFS 时,需要部署 CN。StarRocks 不依赖任何外部组件,简化了部署和维护。节点可以水平扩展而不影响服务正常运行。此外,StarRocks 具有元数据和服务数据副本机制,提高了数据可靠性,有效防止单点故障 (SPOF)。 -StarRocks 兼容 MySQL 协议,支持标准 SQL。用户可以轻松地通过 MySQL 客户端连接到 StarRocks,从而获得即时且有价值的见解。 +StarRocks 兼容 MySQL 协议,支持标准 SQL。用户可以轻松地通过 MySQL 客户端连接到 StarRocks 实时查询分析数据。 ## 架构选择 -StarRocks 支持存算一体 (每个 BE 将其数据存储在本地存储) 和存算分离 (所有数据存储在对象存储或 HDFS 中,每个 CN 仅在本地存储缓存)。您可以根据需要决定数据存储的位置。 +StarRocks 支持存算一体架构 (每个 BE 节点将其数据存储在本地存储) 和存算分离架构 (所有数据存储在对象存储或 HDFS 中,每个 CN 仅在本地存储缓存)。您可以根据需要决定数据存储的位置。 ![Architecture choices](../assets/architecture_choices.png) @@ -18,7 +18,7 @@ StarRocks 支持存算一体 (每个 BE 将其数据存储在本地存储) 和 本地存储为实时查询提供了更低的查询延迟。 -作为典型的大规模并行处理 (MPP) 数据库,StarRocks 支持存算一体架构。在这种架构中,BE 负责数据存储和计算。直接访问 BE 本地数据允许本地计算,避免了数据传输和复制,从而提供超快的查询和分析性能。该架构支持多副本数据存储,增强了集群处理高并发查询的能力并确保数据可靠性。非常适合追求最佳查询性能的场景。 +作为典型的大规模并行处理 (MPP) 数据库,StarRocks 支持存算一体架构。在存算一体架构中,BE 负责数据存储和计算。将数据存储在 BE 中使得数据可以在当前节点中计算,避免了数据传输和复制,从而提供极快的查询和分析性能。该架构支持多副本数据存储,增强了集群处理高并发查询的能力并确保数据可靠性,非常适合追求最佳查询性能的场景。 ![shared-data-arch](../assets/shared-nothing.png) @@ -31,25 +31,25 @@ StarRocks 支持存算一体 (每个 BE 将其数据存储在本地存储) 和 ##### FE -FE 负责元数据管理、客户端连接管理、查询规划和查询调度。每个 FE 在其内存中存储和维护一份完整的元数据副本,这保证了 FE 之间服务的一致性。FE 可以作为主节点、从节点和观察者工作。从节点可以根据类似 Paxos 的 BDB JE 协议选举主节点。BDB JE 是 Berkeley DB Java Edition 的缩写。 +FE 负责元数据管理、客户端连接管理、查询规划和查询调度。每个 FE 在其内存中存储和维护一份完整的元数据副本,保证 FE 之间服务的一致性。FE 分为 Leader FE 节点、Follower 节点和 Observer 节点。Follower 节点可以根据类似 Paxos 的 BDB JE(Berkeley DB Java Edition)协议选举主节点。 -| **FE 角色** | **元数据管理** | **主节点选举** | +| **FE 角色** | **元数据管理** | **节点选主** | | ----------- | ----------------------- | ---------------------------------- | -| 主节点 | 主 FE 负责读写元数据。从节点和观察者节点只能读取元数据,它们将元数据写请求路由到主 FE。主 FE 更新元数据,然后使用 BDE JE 将元数据更改同步到从节点和观察者节点。只有在元数据更改同步到超过一半的从节点后,数据写入才被认为成功。 | 主 FE 技术上也是一个从节点,是从从节点中选举出来的。要执行主节点选举,集群中必须有超过一半的从节点处于活动状态。当主 FE 发生故障时,从节点将开始另一轮主节点选举。 | -| 从节点 | 从节点只能读取元数据。它们从主 FE 同步和重放日志以更新元数据。 | 从节点参与主节点选举,这需要集群中超过一半的从节点处于活动状态。 | -| 观察者 | 观察者从主 FE 同步和重放日志以更新元数据。 | 观察者主要用于增加集群的查询并发性。观察者不参与主节点选举,因此不会增加集群的主节点选举压力。| +| Leader 节点 | Leader FE 负责读写元数据。Follower 节点和 Observer 节点只能读取元数据,并将元数据写请求路由到 Leader FE。Leader FE 更新元数据,然后使用 BDE JE 将元数据更改同步到 Follower 节点和 Observer 节点。只有在元数据更改同步到超过一半的Follower 节点后,数据写入才被认为成功。 | Leader FE 技术上也是一个 Follower 节点,是从Follower 节点中选举出来的。要执行主节点选举,集群中必须有超过一半的Follower 节点处于活动状态。当 Leader FE 发生故障时,Follower 节点将开始另一轮主节点选举。 | +| Follower 节点 | Follower 节点只能读取元数据。它们从 Leader FE 同步和重放日志以更新元数据。 | Follower 节点参与主节点选举,这需要集群中超过一半的 Follower 节点处于活动状态。 | +| Observer 节点 | Observer 节点从 Leader FE 同步和重放日志以更新元数据。 | Observer 节点 主要用于增加集群的查询并发性。 Observer 节点不参与主节点选举,因此不会增加集群的主节点选举压力。| ##### BE BE 负责数据存储和 SQL 执行。 -- 数据存储:BE 具有等效的数据存储能力。FE 根据预定义规则将数据分发到 BE。BE 转换摄取的数据,将数据写入所需格式,并为数据生成索引。 +- 数据存储:BE 具有等效的数据存储能力。FE 根据预定义规则将数据分发到各个 BE。BE 转换导入的数据,将数据写入所需格式,并为数据生成索引。 -- SQL 执行:FE 根据查询的语义将每个 SQL 查询解析为逻辑执行计划,然后将逻辑计划转换为可以在 BE 上执行的物理执行计划。存储目标数据的 BE 执行查询,这消除了数据传输和复制的需求,实现了高查询性能。 +- SQL 执行:FE 根据查询的语义将每个 SQL 查询解析为逻辑执行计划,然后将逻辑计划转换为可以在 BE 上执行的物理执行计划。BE 在本地存储数据以及执行查询,避免了数据传输和复制,极大地提高了查询性能。 ### 存算分离 -对象存储和 HDFS 提供成本、可靠性和可扩展性优势。除了存储的可扩展性外,CN 节点可以随时添加和删除,无需重新平衡数据,因为存储和计算是分离的。 +对象存储和 HDFS 提供低成本、搞可靠性和可扩展性等优势。除了可以扩展存储外,还可以随时添加和删除 CN 节点。因为存储和计算分离,增删节点也无需重新平衡数据。 在存算分离架构中,BE 被“计算节点 (CN)”取代,后者仅负责数据计算任务和缓存热数据。数据存储在低成本且可靠的远端存储系统中,如 Amazon S3、GCP、Azure Blob Storage、MinIO 等。当缓存命中时,查询性能可与存算一体架构相媲美。CN 节点可以根据需要在几秒钟内添加或删除。这种架构降低了存储成本,确保更好的资源隔离,并具有高度的弹性和可扩展性。 @@ -61,25 +61,25 @@ BE 负责数据存储和 SQL 执行。 在存算分离架构中,FE 提供的功能与存算一体架构中的相同。 -BE 被 CN (计算节点) 取代,存储功能被转移到对象存储或 HDFS。CN 是无状态的计算节点,执行所有 BE 的功能,除了存储数据。 +BE 被 CN (计算节点) 取代,存储功能被转移到对象存储或 HDFS。CN 是无状态的计算节点,可以执行除存储数据外所有 BE 的功能。 #### 存储 StarRocks 存算分离集群支持两种存储解决方案:对象存储 (例如,AWS S3、Google GCS、Azure Blob Storage 或 MinIO) 和 HDFS。 -在存算分离集群中,数据文件格式与存算一体集群 (存储和计算耦合) 保持一致。数据组织成段文件,各种索引技术在云原生表中重复使用,这些表专门用于存算分离集群。 +在存算分离集群中,数据文件格式与存算一体集群 (存储和计算耦合) 保持一致。数据存储为 Segment 文件,云原生表(专门用于存算分离集群的表)也可以利用存算一体架构中支持的各种索引技术。 #### 缓存 -StarRocks 存算分离集群将数据存储与计算分离,使其能够独立扩展,从而降低成本并提高弹性。然而,这种架构会影响查询性能。 +StarRocks 存算分离集群将数据存储与计算分离,使两方都能够独立扩展,从而降低成本并提高系统弹性扩展能力。然而,这种架构会影响查询性能。 -为减小影响,StarRocks 建立了包含内存、本地磁盘和远端存储的多层数据访问系统,以便更好地满足各种业务需求。 +为减少架构对于性能的影响,StarRocks 建立了包含内存、本地磁盘和远端存储的多层数据访问系统,以便更好地满足各种业务需求。 -对于热数据的查询直接扫描缓存,然后扫描本地磁盘,而冷数据需要从对象存储中加载到本地缓存中以加速后续查询。通过将热数据保持在计算单元附近,StarRocks 实现了真正的高性能计算和性价比高的存储。此外,通过数据预取策略优化了对冷数据的访问,有效消除了查询的性能限制。 +对于针对热数据的查询,StarRocks 会先扫描缓存,然后扫描本地磁盘。而针对冷数据的查询,需要先将数据从对象存储中加载到本地缓存中,加速后续查询。通过将热数据缓存在计算单元内,StarRocks 实现了真正的高计算性能和高性价比存储。此外,还通过数据预取策略优化了对冷数据的访问,有效消除了查询的性能限制。 -在创建表时可以启用缓存。如果启用缓存,数据将同时写入本地磁盘和后端对象存储。在查询过程中,CN 节点首先从本地磁盘读取数据。如果未找到数据,将从后端对象存储中检索,并同时缓存到本地磁盘中。 +可以在建表时启用缓存。启用缓存后,数据将同时写入本地磁盘和后端对象存储。在查询过程中,CN 节点首先从本地磁盘读取数据。如果未找到数据,将从后端对象存储中检索,并将数据缓存到本地磁盘中。 ## 实践学习 -- 使用 MinIO 进行对象存储,尝试 [shared-data](../quick_start/shared-data.md)。 -- Kubernetes 用户可以使用 [Helm quick start](../quick_start/helm.md) 部署三个 FE 和三个 BE,在使用持久卷的存算一体架构中。 +- 使用 MinIO 进行对象存储,尝试 [存算分离集群](../quick_start/shared-data.md)。 +- Kubernetes 用户可以使用 [Helm 快速开始](../quick_start/helm.md) 部署包含三个 FE 和三个 BE 的存算一体集群。 diff --git a/docs/zh/quick_start/helm.md b/docs/zh/quick_start/helm.md index 36728a0507235..4a834c731cd4e 100644 --- a/docs/zh/quick_start/helm.md +++ b/docs/zh/quick_start/helm.md @@ -18,29 +18,29 @@ import Curl from '../assets/quick-start/_curl.mdx' 本快速入门的目标是: -- 使用 Helm 部署 StarRocks Kubernetes Operator 和一个 StarRocks 集群 +- 使用 Helm 部署 StarRocks Kubernetes Operator 和 StarRocks 集群 - 为 StarRocks 数据库用户 `root` 配置密码 -- 提供具有三个 FEs 和三个 BEs 的高可用性 +- 通过部署三个 FE 和三个 BE 保证高可用性 - 在持久化存储中存储元数据 - 在持久化存储中存储数据 -- 允许 MySQL 客户端从 Kubernetes 集群外部连接 -- 允许使用 Stream Load 从 Kubernetes 集群外部加载数据 -- 加载一些公共数据集 +- 通过 MySQL 客户端从外部连接 Kubernetes 集群 +- 通过 Stream Load 从外部向 Kubernetes 集群中导入数据 +- 导入公共数据集 - 查询数据 :::tip -这些数据集和查询与基础快速入门中使用的相同。这里的主要区别在于使用 Helm 和 StarRocks Operator 部署。 +本教程中的数据集和查询与基础快速入门中使用的相同。主要区别在于使用 Helm 和 StarRocks Operator 部署。 ::: -使用的数据由 NYC OpenData 和国家环境信息中心提供。 +使用的数据由 NYC OpenData 和美国国家环境信息中心提供。 -这些数据集都很大,因为本教程旨在帮助您熟悉使用 StarRocks,我们不会加载过去 120 年的数据。您可以在三个 e2-standard-4 机器(或类似的)构建的 GKE Kubernetes 集群上运行此命令,磁盘大小为 80GB。对于更大规模的部署,我们有其他文档并会提供。 +这些数据集都很大,因为本教程旨在帮助您熟悉使用 StarRocks,所以不会导入过去 120 年的数据。推荐您使用三个 `e2-standard-4` (或类似的)机器构建的 GKE Kubernetes 集群,磁盘大小为 80GB。对于更大规模的部署,请参考部署文档。 本文档包含大量信息,在文档的开头是分步内容,技术细节在文章末尾,这样的顺序安排是为了: 1. 使用 Helm 部署系统。 -2. 允许读者在 StarRocks 中加载数据并分析这些数据。 -3. 解释加载过程中数据转换的基本知识。 +2. 允许读者在 StarRocks 中导入数据并分析这些数据。 +3. 解释导入过程中数据转换的基本知识。 --- @@ -54,7 +54,7 @@ import Curl from '../assets/quick-start/_curl.mdx' ### curl -`curl` 用于向 StarRocks 发送数据加载任务,并下载数据集。通过在操作系统提示符下运行 `curl` 或 `curl.exe` 检查您是否安装了它。如果没有安装 curl,[点击这里获取 curl](https://curl.se/dlwiz/?type=bin)。 +`curl` 用于向 StarRocks 发送数据导入任务,以及下载数据集。您可以通过在操作系统命令提示符下运行 `curl` 或 `curl.exe` 检查您是否安装了它。如果没有安装 curl,[点击这里获取 curl](https://curl.se/dlwiz/?type=bin)。 --- @@ -62,15 +62,15 @@ import Curl from '../assets/quick-start/_curl.mdx' ### FE -前端节点负责元数据管理、客户端连接管理、查询规划和查询调度。每个 FE 在其内存中存储并维护完整的元数据副本,保证 FEs 之间服务无差别。 +FE 节点负责元数据管理、客户端连接管理、查询规划和查询调度。每个 FE 在其内存中存储并维护完整的元数据副本,保证 FE 之间服务无差别。 ### BE -后端节点负责数据存储和执行查询计划。 +BE 节点负责数据存储和执行查询计划。 --- -## 添加 StarRocks Helm chart 仓库 +## 添加 StarRocks Helm Chart 仓库 Helm Chart 包含 StarRocks Operator 的定义和自定义资源 StarRocksCluster。 1. 添加 Helm Chart 仓库。 @@ -124,13 +124,13 @@ curl -O https://raw.githubusercontent.com/StarRocks/demo/master/documentation-sa 本快速入门的目标是: 1. 为 StarRocks 数据库用户 `root` 配置密码 -2. 提供具有三个 FEs 和三个 BEs 的高可用性 +2. 提供具有三个 FE 和三个 BE 的高可用性 3. 在持久化存储中存储元数据 4. 在持久化存储中存储数据 -5. 允许 MySQL 客户端从 Kubernetes 集群外部连接 -6. 允许使用 Stream Load 从 Kubernetes 集群外部加载数据 +5. 允许 MySQL 客户端从外部连接 Kubernetes 集群 +6. 允许使用 Stream Load 从 Kubernetes 集群外部导入数据 -Helm chart 提供了解决所有这些目标的选项,但默认情况下未配置。本部分的其余部分涵盖了实现所有这些目标所需的配置。将提供完整的 values 规范,但首先阅读每个部分的详细信息,然后复制完整规范。 +Helm Chart 提供了达成所有这些目标的选项,但默认情况下未配置。本小节的其余部分涵盖了实现所有这些目标所需的配置。小节最后将提供完整的 values 规范,但首先请阅读每个部分的详细信息,然后复制完整规范。 ### 1. 数据库用户密码 @@ -151,9 +151,9 @@ starrocks: kubectl create secret generic starrocks-root-pass --from-literal=password='g()()dpa$$word' ``` -### 2. 具有 3 个 FEs 和 3 个 BEs 的高可用性 +### 2. 具有 3 个 FE 和 3 个 BE 的高可用性 -通过将 `starrocks.starrockFESpec.replicas` 设置为 3,以及 `starrocks.starrockBeSpec.replicas` 设置为 3,您将拥有足够的 FEs 和 BEs 用于高可用性。将 CPU 和内存请求设置得较低可以在小型 Kubernetes 环境中创建 pod。 +通过将 `starrocks.starrockFESpec.replicas` 和 `starrocks.starrockBeSpec.replicas` 设置为 3,部署足够的 FE 和 BE 保证高可用性。将 CPU 和内存请求设置得较低可以在小型 Kubernetes 环境中创建 pod。 ```yaml starrocks: @@ -211,7 +211,7 @@ starrocks: storageSize: 15Gi ``` -### 5. MySQL 客户端的负载均衡器 +### 5. 用于 MySQL 客户端的负载均衡器 默认情况下,通过集群 IP 访问 FE 服务。要允许外部访问,请将 `service.type` 设置为 `LoadBalancer` @@ -222,7 +222,7 @@ starrocks: type: LoadBalancer ``` -### 6. 外部数据加载的负载均衡器 +### 6. 用于外部数据导入的负载均衡器 Stream Load 需要对 FEs 和 BEs 的外部访问。请求发送到 FE,然后 FE 将分配 BE 处理上传。为了允许 `curl` 命令重定向到 BE,需要启用并将 `starroclFeProxySpec` 设置为 `LoadBalancer` 类型。 @@ -275,7 +275,7 @@ starrocks: ## 设置 StarRocks root 数据库用户密码 -为了从 Kubernetes 集群外部加载数据,StarRocks 数据库将被外部暴露。您应为 StarRocks 数据库用户 `root` 设置密码。操作员将密码应用到 FE 和 BE 节点。 +为了从 Kubernetes 集群外部导入数据,需要向外部暴露 StarRocks 数据库。您需要为 StarRocks 数据库用户 `root` 设置密码。Operator 会将密码应用到 FE 和 BE 节点。 ```bash kubectl create secret generic starrocks-root-pass --from-literal=password='g()()dpa$$word' @@ -286,7 +286,7 @@ secret/starrocks-root-pass created ``` --- -## 部署操作员及 StarRocks 集群 +## 部署 Operator 及 StarRocks 集群 ```bash helm install -f my-values.yaml starrocks starrocks/kube-starrocks @@ -324,7 +324,7 @@ kubectl get pods ``` :::note -`kube-starrocks-initpwd` pod 会在连接 FE 和 BE pods 设置 StarRocks root 密码时进入 `error` 和 `CrashLoopBackOff` 状态。您应该忽略这些错误,等待此 pod 的状态为 `Completed`。 +`kube-starrocks-initpwd` pod 会在连接 FE 和 BE pod 设置 StarRocks root 密码时打印 `error` 和 `CrashLoopBackOff` 状态。您可以忽略这些错误,并等待此 pod 的状态变为 `Completed`。 ::: ``` @@ -359,10 +359,11 @@ fe-meta-kube-starrocks-fe-0 Bound pvc-5130c9ff-b797-4f79-a1d2-4214af860d70 fe-meta-kube-starrocks-fe-1 Bound pvc-13545330-63be-42cf-b1ca-3ed6f96a8c98 10Gi RWO standard-rwo 2m23s fe-meta-kube-starrocks-fe-2 Bound pvc-609cadd4-c7b7-4cf9-84b0-a75678bb3c4d 10Gi RWO standard-rwo 2m23s ``` + ### 确认集群健康 :::tip -这些是与上面相同的命令,但显示了预期状态。 +此处命令与上一小节部分相同,但返回了集群正常运转时的预期状态。 ::: ```bash @@ -379,7 +380,7 @@ kubectl get pods ``` :::tip -当除 `kube-starrocks-initpwd` 外的所有 pods 在 `READY` 列显示 `1/1` 时,系统已准备好。`kube-starrocks-initpwd` pod 应显示 `0/1` 和 `STATUS` 为 `Completed`。 +当除 `kube-starrocks-initpwd` 外的所有 pod 在 `READY` 列显示 `1/1` 时,表示系统已准备完成。`kube-starrocks-initpwd` pod 应显示 `0/1`,其 `STATUS` 为 `Completed`。 ::: ``` @@ -395,7 +396,7 @@ kube-starrocks-initpwd-m84br 0/1 Completed 4 2m9s kube-starrocks-operator-54ffcf8c5c-xsjc8 1/1 Running 0 2m9s ``` -高亮显示的行中的 `EXTERNAL-IP` 地址将用于提供从 Kubernetes 集群外部访问 SQL 客户端和 Stream Load。 +高亮显示的行中的 `EXTERNAL-IP` 地址将用于从 Kubernetes 集群外部访问 SQL 客户端和 Stream Load。 ```bash kubectl get services @@ -442,14 +443,15 @@ kubectl exec --stdin --tty kube-starrocks-fe-0 -- \ mysql -P9030 -h127.0.0.1 -u root --prompt="StarRocks > " ``` -如果您在本地安装了 mysql CLI,则可以使用它而不是 Kubernetes 集群中的那个: +如果您在本地安装了 mysql CLI,则可以直接使用: ```sql mysql -P9030 -h $MYSQL_IP -u root --prompt="StarRocks > " -p ``` --- -## 创建一些表 + +## 建表 ```bash mysql -P9030 -h $MYSQL_IP -u root --prompt="StarRocks > " -p @@ -458,7 +460,7 @@ mysql -P9030 -h $MYSQL_IP -u root --prompt="StarRocks > " -p -退出 MySQL 客户端,或打开一个新 shell 以在命令行运行命令上传数据。 +退出 MySQL 客户端,或打开一个新 shell,在其中运行命令上传数据。 ```sql exit @@ -468,12 +470,12 @@ exit ## 上传数据 -有很多方法可以将数据加载到 StarRocks。本教程中最简单的方法是使用 curl 和 StarRocks Stream Load。 +有很多方法可以将数据导入到 StarRocks。本教程中最简单的方法是使用 curl 和 StarRocks Stream Load。 上传您之前下载的两个数据集。 :::tip -打开一个新 shell,因为这些 curl 命令是在操作系统提示符下运行的,而不是在 `mysql` 客户端中。命令中引用了您下载的数据集,因此请从您下载文件的目录中运行它们。 +您需要开启一个新 shell,因为 curl 命令需要在操作系统提示符中运行,而非 `mysql` 客户端。命令中引用了您下载的数据集,因此您请从下载文件的目录中运行它们。 由于这是一个新的 shell,请再次运行 export 命令: @@ -484,10 +486,10 @@ export MYSQL_IP=`kubectl get services kube-starrocks-fe-service --output jsonpat export FE_PROXY=`kubectl get services kube-starrocks-fe-proxy-service --output jsonpath='{.status.loadBalancer.ingress[0].ip}'`:8080 ``` -系统会提示您输入密码。使用您添加到 Kubernetes secret `starrocks-root-pass` 的密码。如果您使用了提供的命令,密码是 `g()()dpa$$word`。 +系统会提示您输入密码。使用您添加到 Kubernetes secret `starrocks-root-pass` 的密码。如果您使用了预先提供的命令,密码是 `g()()dpa$$word`。 ::: -`curl` 命令看起来很复杂,但它们的详细解释在教程的最后部分。如今,我们建议运行这些命令并运行一些 SQL 来分析数据,然后阅读教程末尾的数据加载细节。 +尽管 `curl` 命令看起来很复杂,但此教程的最后部分提供了详细解释。当前,建议您直接运行这些命令导入数据并运行 SQL 分析数据,然后在教程末尾了解数据导入细节。 ```bash curl --location-trusted -u root \ @@ -560,13 +562,13 @@ Enter host password for user 'root': ## 使用 MySQL 客户端连接 -如果您尚未连接,请使用 MySQL 客户端连接。请记住使用 `kube-starrocks-fe-service` 服务的外部 IP 地址和您在 Kubernetes secret `starrocks-root-pass` 中配置的密码。 +如果您尚未连接,请使用 MySQL 客户端连接。请使用 `kube-starrocks-fe-service` 服务的外部 IP 地址和您在 Kubernetes secret `starrocks-root-pass` 中配置的密码。 ```bash mysql -P9030 -h $MYSQL_IP -u root --prompt="StarRocks > " -p ``` -## 回答一些问题 +## 分析数据 @@ -576,7 +578,7 @@ exit ## 清理 -如果您完成了并希望删除 StarRocks 集群和 StarRocks operator,请运行此命令。 +如果您完成了并希望删除 StarRocks 集群和 StarRocks Operator,请运行此命令。 ```bash helm delete starrocks @@ -589,10 +591,10 @@ helm delete starrocks 在本教程中,您: - 使用 Helm 和 StarRocks Operator 部署了 StarRocks -- 加载了纽约市提供的交通事故数据和 NOAA 提供的天气数据 -- 使用 SQL JOIN 分析数据,发现能见度低或街道结冰时驾车不是一个好主意 +- 导入了纽约市提供的交通事故数据和 NOAA 提供的天气数据 +- 使用 SQL JOIN 分析数据,数据显示在能见度低或街道结冰时驾车有更高几率导致车祸 -还有很多需要学习的内容;我们有意略过了 Stream Load 过程中进行的数据转换。关于这些的详细信息在下文的 curl 命令注释中。 +更多学习内容;此教程有意略过了 Stream Load 过程中进行的数据转换。关于这些的详细信息在包含下文的 curl 命令注释中。 --- @@ -608,11 +610,11 @@ helm delete starrocks [Stream Load](../sql-reference/sql-statements/data-manipulation/STREAM_LOAD.md) -[Motor Vehicle Collisions - Crashes](https://data.cityofnewyork.us/Public-Safety/Motor-Vehicle-Collisions-Crashes/h9gi-nx95) 数据集由纽约市提供,受这些 [使用条款](https://www.nyc.gov/home/terms-of-use.page) 和 [隐私政策](https://www.nyc.gov/home/privacy-policy.page) 约束。 +[Motor Vehicle Collisions - Crashes](https://data.cityofnewyork.us/Public-Safety/Motor-Vehicle-Collisions-Crashes/h9gi-nx95) 数据集由纽约市提供,受其 [使用条款](https://www.nyc.gov/home/terms-of-use.page) 和 [隐私政策](https://www.nyc.gov/home/privacy-policy.page) 约束。 -[Local Climatological Data](https://www.ncdc.noaa.gov/cdo-web/datatools/lcd)(LCD) 由 NOAA 提供,并附有此 [免责声明](https://www.noaa.gov/disclaimer) 和此 [隐私政策](https://www.noaa.gov/protecting-your-privacy)。 +[Local Climatological Data](https://www.ncdc.noaa.gov/cdo-web/datatools/lcd)(LCD) 由 NOAA 提供,并附其 [免责声明](https://www.noaa.gov/disclaimer) 和此 [隐私政策](https://www.noaa.gov/protecting-your-privacy)。 [Helm](https://helm.sh/) 是 Kubernetes 的包管理器。[Helm Chart](https://helm.sh/docs/topics/charts/) 是一个 Helm 包,包含在 Kubernetes 集群上运行应用程序所需的所有资源定义。 [`starrocks-kubernetes-operator` 和 `kube-starrocks` Helm Chart](https://github.com/StarRocks/starrocks-kubernetes-operator)。 -``` +