AI Translate 55-performance to Simplified-Chinese (#2457)

github-actions[bot] · Chasen-Zhang · web-flow · commit 29c6da2260ba · 2025-06-23T21:02:12.000+08:00
* [INIT] Start translation to Simplified-Chinese

* 🌐 Translate ngram-index.md to Simplified-Chinese

* 🌐 Translate ngram-index.md to Simplified-Chinese

* 🌐 Translate ngram-index.md to Simplified-Chinese

---------

Co-authored-by: github-actions[bot] &lt;github-actions[bot]@users.noreply.github.com&gt;
Co-authored-by: z &lt;787025321@qq.com&gt;
diff --git a/.translation-init b/.translation-init
@@ -1 +1 @@
-Translation initialization: 2025-06-23T07:12:01.410852
+Translation initialization: 2025-06-23T07:16:51.071305
diff --git a/docs/cn/guides/55-performance/ngram-index.md b/docs/cn/guides/55-performance/ngram-index.md
@@ -2,107 +2,107 @@
 title: Ngram 索引
 ---
 
-# Ngram 索引：LIKE 查询的高速模式匹配
+# Ngram 索引（Ngram Index）：为 LIKE 查询实现快速模式匹配
 
 import EEFeature from '@site/src/components/EEFeature';
 
 <EEFeature featureName='NGRAM INDEX'/>
 
-Ngram 索引通过带通配符 (`%`) 的 `LIKE` 操作符加速模式匹配查询，无需全表扫描即可实现快速子字符串搜索。
+Ngram 索引（Ngram Index）能够加速使用 `LIKE` 操作符和通配符（`%`）的模式匹配查询，实现快速的子字符串搜索，而无需进行全表扫描。
 
-## 解决什么问题？
+## 它解决了什么问题？
 
-`LIKE` 模式匹配在大数据集上存在显著性能挑战：
+在使用 `LIKE` 进行模式匹配查询时，大型数据集会面临严峻的性能挑战：
 
-| 问题 | 影响 | Ngram 索引解决方案 |
+| 问题 | 影响 | Ngram 索引（Ngram Index）解决方案 |
 |---------|--------|---------------------|
-| **通配符搜索慢** | `WHERE content LIKE '%keyword%'` 需扫描全表 | 使用 n-gram 片段预过滤数据块 |
-| **全表扫描** | 每次模式搜索都需读取所有行 | 仅读取包含模式的相关数据块 |
-| **搜索性能差** | 子字符串搜索结果等待时间长 | 亚秒级模式匹配响应时间 |
-| **传统索引失效** | B-tree 索引无法优化中间通配符 | 字符级索引处理任意通配符位置 |
+| **通配符搜索缓慢** | `WHERE content LIKE '%keyword%'` 会扫描整个表 | 使用 n-gram 片段预过滤数据块 |
+| **全表扫描** | 每次模式搜索都会读取所有行 | 仅读取包含模式的相关数据块 |
+| **搜索性能不佳** | 用户等待子字符串搜索结果的时间很长 | 亚秒级模式匹配响应时间 |
+| **传统索引效率低下** | B-tree 索引无法优化中间的通配符 | 字符级索引可处理任何通配符位置 |
 
-**示例**：在 1000 万条日志中搜索 `'%error log%'`。无 ngram 索引时需扫描全部 1000 万行；使用 ngram 索引可立即预过滤至约 1000 个相关数据块。
+**示例**：在 1000 万条日志条目中搜索 `'%error log%'`。如果没有 Ngram 索引（Ngram Index），查询会扫描全部 1000 万行。而使用 Ngram 索引（Ngram Index），查询可以立即将范围预过滤到约 1000 个相关的数据块。
 
 ## Ngram 索引 vs 全文索引：如何选择？
 
-| 特性 | Ngram 索引 | 全文索引 |
+| 特性 | Ngram 索引（Ngram Index） | 全文索引（Full-Text Index） |
 |---------|-------------|-----------------|
-| **主要用途** | `LIKE '%pattern%'` 模式匹配 | `MATCH()` 语义文本搜索 |
-| **搜索类型** | 精确子字符串匹配 | 基于词汇的搜索（含相关性） |
+| **主要使用场景** | 使用 `LIKE '%pattern%'` 进行模式匹配 | 使用 `MATCH()` 进行语义文本搜索 |
+| **搜索类型** | 精确子字符串匹配 | 基于词语的相关性搜索 |
 | **查询语法** | `WHERE column LIKE '%text%'` | `WHERE MATCH(column, 'text')` |
-| **高级功能** | 不区分大小写匹配 | 模糊搜索、相关性评分、布尔运算符 |
-| **性能重点** | 加速现有 LIKE 查询 | 用高级搜索替代 LIKE |
-| **适用场景** | 日志分析、代码搜索、精确匹配 | 文档搜索、内容发现、搜索引擎 |
+| **高级功能** | 不区分大小写的匹配 | 模糊搜索、相关性评分、布尔运算符 |
+| **性能重点** | 加速现有的 LIKE 查询 | 用高级搜索功能替代 LIKE |
+| **最适合** | 日志分析、代码搜索、精确模式匹配 | 文档搜索、内容发现、搜索引擎 |
 
-**选择 Ngram 索引当：**
-- 需优化现有 `LIKE '%pattern%'` 查询
-- 要求精确子字符串匹配（不区分大小写）
-- 处理日志、代码或 ID 等结构化数据
-- 需提升性能但不改变查询语法
+**选择 Ngram 索引（Ngram Index）的情况：**
+- 您需要优化现有的 `LIKE '%pattern%'` 查询
+- 需要精确的子字符串匹配（不区分大小写）
+- 处理结构化数据，如日志、代码或 ID
+- 希望在不更改查询语法的情况下提高性能
 
-**选择全文索引当：**
+**选择全文索引（Full-Text Index）的情况：**
 - 为文档或内容构建搜索功能
 - 需要模糊搜索、相关性评分或复杂查询
 - 处理自然语言文本
-- 需要超越简单模式匹配的高级搜索能力
+- 希望获得超越简单模式匹配的高级搜索能力
 
-## 工作原理
+## Ngram 索引（Ngram Index）工作原理
 
-Ngram 索引将文本拆分为重叠字符子串（n-gram）实现快速模式查找：
+Ngram 索引（Ngram Index）将文本分解为重叠的字符子串（n-gram），以实现快速的模式查找：
 
-**`gram_size = 3` 示例：**
+**`gram_size = 3` 的示例：**
 ```text
-输入: "The quick brown"
-N-grams: "The", "he ", "e q", " qu", "qui", "uic", "ick", "ck ", "k b", " br", "bro", "row", "own"
+输入："The quick brown"
+N-grams："The", "he ", "e q", " qu", "qui", "uic", "ick", "ck ", "k b", " br", "bro", "row", "own"
 ```
 
-**查询处理流程：**
+**查询处理：**
 ```sql
 SELECT * FROM t WHERE content LIKE '%quick br%'
 ```
-1. 模式 `'quick br'` 拆解为 n-gram: "qui", "uic", "ick", "ck ", "k b", " br"
-2. 索引过滤包含这些 n-gram 的数据块
-3. 完整 `LIKE` 过滤仅作用于预筛选数据块
-
-:::note **关键限制**
-- 模式长度至少需 `gram_size` 字符（如 `gram_size=3` 时 `'%yo%'` 无法使用索引）
-- 匹配不区分大小写（"FOO" 可匹配 "foo", "Foo", "fOo"）
-- 仅支持 `LIKE` 操作符，不适用其他模式匹配函数
+1. 模式 `'quick br'` 被分词为 n-gram："qui", "uic", "ick", "ck ", "k b", " br"
+2. 索引过滤出包含这些 n-gram 的数据块
+3. 完整的 `LIKE` 过滤器仅应用于预过滤的数据块
+
+:::note **重要限制**
+- 模式长度必须至少为 `gram_size` 个字符（例如，当 `gram_size=3` 时，像 `'%yo%'` 这样的短模式将不会使用索引）
+- 匹配不区分大小写（"FOO" 会匹配 "foo"、"Foo"、"fOo"）
+- 仅适用于 `LIKE` 操作符，不适用于其他模式匹配函数
 :::
 
 ## 快速设置
 
 ```sql
--- Create table with text content
+-- 创建包含文本内容的表
 CREATE TABLE logs(id INT, message STRING);
 
--- Create ngram index with 3-character segments
+-- 创建一个 n-gram 索引，分词长度为 3
 CREATE NGRAM INDEX logs_message_idx ON logs(message) gram_size = 3;
 
--- Insert data (automatically indexed)
+-- 插入数据（将自动索引）
 INSERT INTO logs VALUES (1, 'Application error occurred');
 
--- Search using LIKE - automatically optimized
+-- 使用 LIKE 进行搜索 - 将自动优化
 SELECT * FROM logs WHERE message LIKE '%error%';
 ```
 
 ## 完整示例
 
-创建 ngram 索引进行日志分析并验证性能优势：
+此示例演示了如何为日志分析创建 Ngram 索引（Ngram Index）并验证其性能优势：
 
 ```sql
--- Create table for application logs
+-- 为应用程序日志创建表
 CREATE TABLE t_articles (
     id INT,
     content STRING
 );
 
--- Create ngram index with 3-character segments
+-- 创建一个 n-gram 索引，分词长度为 3
 CREATE NGRAM INDEX ngram_idx_content
 ON t_articles(content)
 gram_size = 3;
 
--- Verify index creation
+-- 验证索引创建
 SHOW INDEXES;
 ```
 
@@ -115,7 +115,7 @@ SHOW INDEXES;
 ```
 
 ```sql
--- Insert test data: 995 irrelevant rows + 5 target rows
+-- 插入测试数据：995 行不相关数据 + 5 行目标数据
 INSERT INTO t_articles
 SELECT number, CONCAT('Random text number ', number)
 FROM numbers(995);
@@ -127,10 +127,10 @@ INSERT INTO t_articles VALUES
     (1004, 'A moment of silence was observed'),
     (1005, 'In silence, they understood each other');
 
--- Search with pattern matching
+-- 使用模式匹配进行搜索
 SELECT id, content FROM t_articles WHERE content LIKE '%silence%';
 
--- Verify index usage
+-- 验证索引使用情况
 EXPLAIN SELECT id, content FROM t_articles WHERE content LIKE '%silence%';
 ```
 
@@ -149,41 +149,41 @@ TableScan
 └── estimated rows: 15.62
 ```
 
-**关键指标：** `bloom pruning: 2 to 1` 表明 ngram 索引在扫描前成功过滤了 50% 数据块。
+**关键性能指标：** `bloom pruning: 2 to 1` 表明 Ngram 索引（Ngram Index）在扫描前成功过滤掉了 50% 的数据块。
 
 ## 最佳实践
 
-| 实践 | 优势 |
+| 实践 | 益处 |
 |----------|---------|
-| **选择合适的 gram_size** | `gram_size=3` 适用多数场景；更长模式用更大值 |
-| **索引高频搜索列** | 聚焦于 `LIKE '%pattern%'` 查询使用的列 |
-| **监控索引使用** | 通过 `EXPLAIN` 验证 `bloom pruning` 统计 |
-| **注意模式长度** | 确保搜索模式长度 ≥ `gram_size` |
-
-## 核心命令
-
-完整命令参考详见 [Ngram 索引](/sql/sql-commands/ddl/ngram-index/)。
-
-| 命令                                                       | 用途                   |
-|----------------------------------------------------------|----------------------|
-| `CREATE NGRAM INDEX name ON table(column) gram_size = N` | 创建含 N 字符片段的 ngram 索引 |
-| `SHOW INDEXES`                                           | 列出所有索引（含 ngram 索引）   |
-| `REFRESH NGRAM INDEX name ON table`                      | 刷新 ngram 索引          |
-| `DROP NGRAM INDEX name ON table`                         | 删除 ngram 索引          |
-
-:::tip **使用场景**
-**适用：**
-- 日志分析与监控系统
-- 代码搜索与模式匹配
+| **选择合适的 gram_size** | `gram_size=3` 适用于大多数情况；对于更长的模式使用更大的值 |
+| **为频繁搜索的列创建索引** | 专注于在 `LIKE '%pattern%'` 查询中使用的列 |
+| **监控索引使用情况** | 使用 `EXPLAIN` 验证 `bloom pruning` 统计信息 |
+| **考虑模式长度** | 确保搜索模式的长度至少为 `gram_size` 个字符 |
+
+## 基本命令
+
+有关完整的命令参考，请参见 [Ngram 索引（Ngram Index）](/sql/sql-commands/ddl/ngram-index/)。
+
+| 命令 | 目的 |
+|----------------------------------------------------------|----------------------------------------------|
+| `CREATE NGRAM INDEX name ON table(column) gram_size = N` | 创建一个 n-gram 索引，分词长度为 N |
+| `SHOW INDEXES` | 列出所有索引，包括 n-gram 索引 |
+| `REFRESH NGRAM INDEX name ON table` | 刷新 n-gram 索引 |
+| `DROP NGRAM INDEX name ON table` | 删除 n-gram 索引 |
+
+:::tip **何时使用 Ngram 索引（Ngram Index）**
+**理想场景：**
+- 日志分析和监控系统
+- 代码搜索和模式匹配
 - 产品目录搜索
-- 高频使用 `LIKE '%pattern%'` 的应用
+- 任何频繁使用 `LIKE '%pattern%'` 查询的应用
 
-**不适用：**
-- 短模式搜索（短于 `gram_size` 字符）
-- 精确字符串匹配（应使用等值比较）
-- 复杂文本搜索（应使用全文索引）
+**不推荐的场景：**
+- 短模式搜索（长度小于 `gram_size` 个字符）
+- 精确字符串匹配（应使用等号比较）
+- 复杂的文本搜索需求（应使用全文索引（Full-Text Index））
 :::
 
 ---
 
-*Ngram 索引是大型文本数据集上实现 `LIKE` 查询高速模式匹配的关键组件。*
+*对于需要在大型文本数据集上使用 `LIKE` 查询进行快速模式匹配的应用，Ngram 索引（Ngram Index）至关重要。*
diff --git a/docs/cn/sql-reference/10-sql-commands/00-ddl/07-ngram-index/index.md b/docs/cn/sql-reference/10-sql-commands/00-ddl/07-ngram-index/index.md
@@ -5,16 +5,16 @@ import EEFeature from '@site/src/components/EEFeature';
 
 <EEFeature featureName='NGRAM INDEX'/>
 
-本文全面介绍 Databend 中 Ngram 索引的功能操作，按模块分类便于查阅。
+本页面全面概述了 Databend 中的 Ngram 索引（Ngram Index）操作，并按功能进行组织，方便参考。
 
 ## Ngram 索引管理
 
-| 命令                                            | 描述                      |
-|-----------------------------------------------|-------------------------|
-| [CREATE NGRAM INDEX](create-ngram-index.md)   | 创建新的 Ngram 索引用于高效子字符串搜索 |
-| [REFRESH NGRAM INDEX](refresh-ngram-index.md) | 刷新 Ngram 索引             |
-| [DROP NGRAM INDEX](drop-ngram-index.md)       | 删除 Ngram 索引             |
+| 命令                                       | 描述                                              |
+|-----------------------------------------------|----------------------------------------------------------|
+| [CREATE NGRAM INDEX](create-ngram-index.md)   | 创建新的 Ngram 索引（Ngram Index），实现高效子字符串搜索 |
+| [REFRESH NGRAM INDEX](refresh-ngram-index.md) | 刷新 Ngram 索引（Ngram Index）                          |
+| [DROP NGRAM INDEX](drop-ngram-index.md)       | 移除 Ngram 索引（Ngram Index）                          |
 
 :::note
-Databend 的 Ngram 索引支持在文本数据中高效执行子字符串及模式匹配搜索，可显著提升 LIKE 等操作的性能。
-:::
+Databend 的 Ngram 索引（Ngram Index）支持高效执行文本数据的子字符串和模式匹配搜索，显著提升 LIKE 及类似操作的性能。
+:::
diff --git a/docs/cn/sql-reference/10-sql-commands/00-ddl/07-ngram-index/refresh-ngram-index.md b/docs/cn/sql-reference/10-sql-commands/00-ddl/07-ngram-index/refresh-ngram-index.md
@@ -5,13 +5,13 @@ sidebar_position: 2
 
 import FunctionDescription from '@site/src/components/FunctionDescription';
 
-<FunctionDescription description="Introduced or updated: v1.2.726"/>
+<FunctionDescription description="引入或更新于：v1.2.726"/>
 
 import EEFeature from '@site/src/components/EEFeature';
 
 <EEFeature featureName='NGRAM INDEX'/>
 
-从表中刷新现有的 NGRAM 索引。
+刷新表上已有的 NGRAM 索引（NGRAM INDEX）。
 
 ## 语法
 
@@ -22,7 +22,7 @@ ON [<database>.]<table_name>;
 
 ## 示例
 
-以下示例从 `amazon_reviews_ngram` 表中刷新 `idx1` 索引：
+以下示例刷新 `amazon_reviews_ngram` 表上的 `idx1` 索引：
 
 ```sql
 REFRESH NGRAM INDEX idx1 ON amazon_reviews_ngram;

Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-Translation initialization: 2025-06-23T07:12:01.410852`
	`1`	`+Translation initialization: 2025-06-23T07:16:51.071305`