Skip to content

Commit 370c3bc

Browse files
💬Generate LLM translations (#2190)
Co-authored-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com>
1 parent bd7e5bf commit 370c3bc

File tree

9 files changed

+216
-410
lines changed

9 files changed

+216
-410
lines changed

docs/cn/guides/40-load-data/04-transform/00-querying-parquet.md

Lines changed: 16 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -1,3 +1,4 @@
1+
```md
12
---
23
title: 查询 Stage 中的 Parquet 文件
34
sidebar_label: Parquet
@@ -54,4 +55,19 @@ FROM @parquet_query_stage
5455
FILE_FORMAT => 'parquet_query_format',
5556
PATTERN => '.*[.]parquet'
5657
);
58+
```
59+
### 使用元数据查询
60+
61+
直接从 Stage 查询 Parquet 文件,包括元数据列,如 `metadata$filename``metadata$file_row_number`
62+
63+
```sql
64+
SELECT
65+
metadata$filename AS file,
66+
metadata$file_row_number AS row,
67+
*
68+
FROM @parquet_query_stage
69+
(
70+
FILE_FORMAT => 'parquet_query_format',
71+
PATTERN => '.*[.]parquet'
72+
);
5773
```

docs/cn/guides/40-load-data/04-transform/01-querying-csv.md

Lines changed: 15 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -69,4 +69,19 @@ FROM @csv_query_stage
6969
FILE_FORMAT => 'csv_query_format',
7070
PATTERN => '.*[.]csv[.]gz'
7171
);
72+
```
73+
### 使用元数据查询
74+
75+
直接从 Stage 查询 CSV 文件,包括元数据列,如 `metadata$filename``metadata$file_row_number`
76+
77+
```sql
78+
SELECT
79+
metadata$filename AS file,
80+
metadata$file_row_number AS row,
81+
$1, $2, $3
82+
FROM @csv_query_stage
83+
(
84+
FILE_FORMAT => 'csv_query_format',
85+
PATTERN => '.*[.]csv'
86+
);
7287
```

docs/cn/guides/40-load-data/04-transform/02-querying-tsv.md

Lines changed: 25 additions & 11 deletions
Original file line numberDiff line numberDiff line change
@@ -6,41 +6,40 @@ sidebar_label: TSV
66
## 查询 Stage 中的 TSV 文件
77

88
语法:
9-
109
```sql
11-
SELECT [<alias>.]$<col_position> [, $<col_position> ...]
12-
FROM {@<stage_name>[/<path>] [<table_alias>] | '<uri>' [<table_alias>]}
13-
[(
10+
SELECT [<alias>.]$<col_position> [, $<col_position> ...]
11+
FROM {@<stage_name>[/<path>] [<table_alias>] | '<uri>' [<table_alias>]}
12+
[(
1413
[<connection_parameters>],
1514
[ PATTERN => '<regex_pattern>'],
1615
[ FILE_FORMAT => 'TSV| <custom_format_name>'],
1716
[ FILES => ( '<file_name>' [ , '<file_name>' ] [ , ... ] ) ]
1817
)]
1918
```
2019

20+
2121
:::info Tips
2222
TSV 没有 schema 信息,所以我们只能通过位置查询列 `$<col_position> [, $<col_position> ...]`
2323
:::
2424

2525
## 教程
2626

27-
### 步骤 1. 创建外部 Stage
28-
29-
使用您自己的 S3 bucket 和存储 TSV 文件的凭据创建一个外部 stage。
27+
### 步骤 1. 创建一个外部 Stage
3028

29+
使用您自己的 S3 bucket 和凭据创建一个外部 Stage,用于存储您的 TSV 文件。
3130
```sql
32-
CREATE STAGE tsv_query_stage
33-
URL = 's3://load/tsv/'
31+
CREATE STAGE tsv_query_stage
32+
URL = 's3://load/tsv/'
3433
CONNECTION = (
35-
ACCESS_KEY_ID = '<your-access-key-id>'
34+
ACCESS_KEY_ID = '<your-access-key-id>'
3635
SECRET_ACCESS_KEY = '<your-secret-access-key>'
3736
);
3837
```
3938

4039
### 步骤 2. 创建自定义 TSV 文件格式
4140

4241
```sql
43-
CREATE FILE FORMAT tsv_query_format
42+
CREATE FILE FORMAT tsv_query_format
4443
TYPE = TSV,
4544
RECORD_DELIMITER = '\n',
4645
FIELD_DELIMITER = ',',
@@ -70,3 +69,18 @@ FROM @tsv_query_stage
7069
PATTERN => '.*[.]tsv[.]gz'
7170
);
7271
```
72+
### 查询元数据
73+
74+
直接从 Stage 查询 TSV 文件,包括元数据列,如 `metadata$filename``metadata$file_row_number`
75+
76+
```sql
77+
SELECT
78+
metadata$filename AS file,
79+
metadata$file_row_number AS row,
80+
$1, $2, $3
81+
FROM @tsv_query_stage
82+
(
83+
FILE_FORMAT => 'tsv_query_format',
84+
PATTERN => '.*[.]tsv'
85+
);
86+
```
Lines changed: 31 additions & 17 deletions
Original file line numberDiff line numberDiff line change
@@ -1,53 +1,52 @@
11
---
2-
title: Querying NDJSON Files in Stage
2+
title: 查询 Stage 中的 NDJSON 文件
33
sidebar_label: NDJSON
44
---
55

6-
## Query NDJSON Files in Stage
6+
## 查询 Stage 中的 NDJSON 文件
77

88
语法:
9-
109
```sql
11-
SELECT [<alias>.]$1:<column> [, $1:<column> ...]
12-
FROM {@<stage_name>[/<path>] [<table_alias>] | '<uri>' [<table_alias>]}
13-
[(
10+
SELECT [<alias>.]$1:<column> [, $1:<column> ...]
11+
FROM {@<stage_name>[/<path>] [<table_alias>] | '<uri>' [<table_alias>]}
12+
[(
1413
[<connection_parameters>],
1514
[ PATTERN => '<regex_pattern>'],
1615
[ FILE_FORMAT => 'NDJSON| <custom_format_name>'],
1716
[ FILES => ( '<file_name>' [ , '<file_name>' ] [ , ... ] ) ]
1817
)]
1918
```
2019

20+
2121
:::info Tips
2222
NDJSON 是整行的变体,列是 `$1:<column> [, $1:<column> ...]`
2323
:::
2424

25-
## Tutorial
26-
27-
### Step 1. Create an External Stage
25+
## 教程
2826

29-
使用您自己的 S3 存储桶和凭据创建一个外部 Stage,用于存储您的 NDJSON 文件。
27+
### 步骤 1. 创建外部 Stage
3028

29+
使用您自己的 S3 bucket 和凭据创建一个外部 Stage,用于存储您的 NDJSON 文件。
3130
```sql
32-
CREATE STAGE ndjson_query_stage
33-
URL = 's3://load/ndjson/'
31+
CREATE STAGE ndjson_query_stage
32+
URL = 's3://load/ndjson/'
3433
CONNECTION = (
35-
ACCESS_KEY_ID = '<your-access-key-id>'
34+
ACCESS_KEY_ID = '<your-access-key-id>'
3635
SECRET_ACCESS_KEY = '<your-secret-access-key>'
3736
);
3837
```
3938

40-
### Step 2. Create Custom NDJSON File Format
39+
### 步骤 2. 创建自定义 NDJSON 文件格式
4140

4241
```sql
43-
CREATE FILE FORMAT ndjson_query_format
42+
CREATE FILE FORMAT ndjson_query_format
4443
TYPE = NDJSON,
4544
COMPRESSION = AUTO;
4645
```
4746

48-
- 更多 NDJSON 文件格式选项请参考 [NDJSON File Format Options](/sql/sql-reference/file-format-options#ndjson-options)
47+
- 更多 NDJSON 文件格式选项请参考 [NDJSON 文件格式选项](/sql/sql-reference/file-format-options#ndjson-options)
4948

50-
### Step 3. Query NDJSON Files
49+
### 步骤 3. 查询 NDJSON 文件
5150

5251
```sql
5352
SELECT $1:title, $1:author
@@ -68,3 +67,18 @@ FROM @ndjson_query_stage
6867
PATTERN => '.*[.]ndjson[.]gz'
6968
);
7069
```
70+
### 使用元数据查询
71+
72+
直接从 Stage 查询 NDJSON 文件,包括元数据列,如 `metadata$filename``metadata$file_row_number`
73+
74+
```sql
75+
SELECT
76+
metadata$filename AS file,
77+
metadata$file_row_number AS row,
78+
$1:title, $1:author
79+
FROM @ndjson_query_stage
80+
(
81+
FILE_FORMAT => 'ndjson_query_format',
82+
PATTERN => '.*[.]ndjson'
83+
);
84+
```

docs/cn/guides/40-load-data/04-transform/03-querying-orc.md

Lines changed: 30 additions & 11 deletions
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
---
2-
title: 查询 Stage 中的 Staged ORC 文件
2+
title: 查询 Stage Staged ORC 文件
33
sidebar_label: ORC
44
---
55
import StepsWrap from '@site/src/components/StepsWrap';
@@ -8,9 +8,9 @@ import StepContent from '@site/src/components/Steps/step-content';
88
## 语法
99

1010
```sql
11-
SELECT [<alias>.]<column> [, <column> ...] | [<alias>.]$<col_position> [, $<col_position> ...]
12-
FROM {@<stage_name>[/<path>] [<table_alias>] | '<uri>' [<table_alias>]}
13-
[(
11+
SELECT [<alias>.]<column> [, <column> ...] | [<alias>.]$<col_position> [, $<col_position> ...]
12+
FROM {@<stage_name>[/<path>] [<table_alias>] | '<uri>' [<table_alias>]}
13+
[(
1414
[<connection_parameters>],
1515
[ PATTERN => '<regex_pattern>'],
1616
[ FILE_FORMAT => 'ORC | <custom_format_name>'],
@@ -20,26 +20,26 @@ FROM {@<stage_name>[/<path>] [<table_alias>] | '<uri>' [<table_alias>]}
2020

2121
## 教程
2222

23-
在本教程中,我们将引导您完成以下过程:下载 ORC 格式的 Iris 数据集,将其上传到 Amazon S3 存储桶,创建外部 Stage,以及直接从 ORC 文件查询数据。
23+
在本教程中,我们将引导您完成以下过程:下载 ORC 格式的 Iris 数据集,将其上传到 Amazon S3 bucket,创建一个外部 Stage,并直接从 ORC 文件查询数据。
2424

2525
<StepsWrap>
2626
<StepContent number="1">
2727

2828
### 下载 Iris 数据集
2929

30-
https://github.com/tensorflow/io/raw/master/tests/test_orc/iris.orc 下载 iris 数据集,然后将其上传到您的 Amazon S3 存储桶
30+
https://github.com/tensorflow/io/raw/master/tests/test_orc/iris.orc 下载 iris 数据集,然后将其上传到您的 Amazon S3 bucket
3131

32-
iris 数据集包含 3 个类别,每个类别包含 50 个实例,其中每个类别都指的是一种鸢尾植物。它有 4 个属性:(1)萼片长度,(2)萼片宽度,(3)花瓣长度,(4)花瓣宽度,最后一列包含类别标签。
32+
iris 数据集包含 3 个类别,每个类别包含 50 个实例,其中每个类别都指一种鸢尾植物。它有 4 个属性:(1)萼片长度,(2)萼片宽度,(3)花瓣长度,(4)花瓣宽度,最后一列包含类别标签。
3333

3434
</StepContent>
3535
<StepContent number="2">
3636

3737
### 创建外部 Stage
3838

39-
使用存储 iris 数据集文件的 Amazon S3 存储桶创建一个外部 Stage。
39+
使用存储 iris 数据集文件的 Amazon S3 bucket 创建一个外部 Stage。
4040

4141
```sql
42-
CREATE STAGE orc_query_stage
42+
CREATE STAGE orc_query_stage
4343
URL = 's3://databend-doc'
4444
CONNECTION = (
4545
AWS_KEY_ID = '<your-key-id>',
@@ -69,7 +69,7 @@ FROM @orc_query_stage
6969
└──────────────────────────────────────────────────────────────────────────────────────────────────┘
7070
```
7171

72-
您也可以直接查询远程 ORC 文件:
72+
您还可以直接查询远程 ORC 文件:
7373

7474
```sql
7575
SELECT
@@ -79,4 +79,23 @@ FROM
7979
```
8080

8181
</StepContent>
82-
</StepsWrap>
82+
<StepContent number="4">
83+
84+
### 使用元数据查询
85+
86+
直接从 Stage 查询 ORC 文件,包括元数据列,如 `metadata$filename``metadata$file_row_number`
87+
88+
```sql
89+
SELECT
90+
metadata$filename AS file,
91+
metadata$file_row_number AS row,
92+
*
93+
FROM @orc_query_stage
94+
(
95+
FILE_FORMAT => 'orc',
96+
PATTERN => '.*[.]orc'
97+
);
98+
```
99+
100+
</StepContent>
101+
</StepsWrap>

docs/cn/guides/40-load-data/04-transform/04-querying-avro.md

Lines changed: 7 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -18,12 +18,12 @@ FROM {@<stage_name>[/<path>] [<table_alias>] | '<uri>' [<table_alias>]}
1818
```
1919

2020
:::info Tips
21-
可以使用 `$1:<column>` 直接将 Avro 文件作为 variant 查询。
21+
可以使用 `$1:<column>` 直接将 Avro 文件作为 variants 查询。
2222
:::
2323

2424
## Avro 查询功能概述
2525

26-
Databend 提供对直接从 stage 查询 Avro 文件的全面支持。这允许灵活的数据探索和转换,而无需先将数据加载到表中。
26+
Databend 提供了全面的支持,可以直接从 stages 查询 Avro 文件。这允许灵活的数据探索和转换,而无需先将数据加载到表中。
2727

2828
* **Variant 表示**: Avro 文件中的每一行都被视为一个 variant,由 `$1` 引用。这允许灵活访问 Avro 数据中的嵌套结构。
2929
* **类型映射**: 每个 Avro 类型都映射到 Databend 中相应的 variant 类型。
@@ -33,9 +33,9 @@ Databend 提供对直接从 stage 查询 Avro 文件的全面支持。这允许
3333

3434
本教程演示如何查询存储在 stage 中的 Avro 文件。
3535

36-
### 步骤 1. 准备 Avro 文件
36+
### 步骤 1. 准备一个 Avro 文件
3737

38-
考虑一个具有以下名为 `user`schema 的 Avro 文件:
38+
考虑一个具有以下 schema 的 Avro 文件,命名为 `user`
3939

4040
```json
4141
{
@@ -54,9 +54,9 @@ Databend 提供对直接从 stage 查询 Avro 文件的全面支持。这允许
5454
}
5555
```
5656

57-
### 步骤 2. 创建外部 Stage
57+
### 步骤 2. 创建一个外部 Stage
5858

59-
使用您自己的 S3 bucket 和存储 Avro 文件的凭据创建一个外部 stage
59+
使用您自己的 S3 bucket 和凭据创建一个外部 stage,用于存储您的 Avro 文件
6060

6161
```sql
6262
CREATE STAGE avro_query_stage
@@ -84,7 +84,7 @@ FROM @avro_query_stage
8484
);
8585
```
8686

87-
#### 使用元数据查询
87+
### 查询元数据
8888

8989
直接从 stage 查询 Avro 文件,包括元数据列,如 `metadata$filename``metadata$file_row_number`
9090

0 commit comments

Comments
 (0)