读取速度似乎很慢，资源似乎不能得到有效利用[Bug]: #148

limingoo · 2024-07-26T09:59:45Z

What happened?

我使用的catalog只能单线程读取ck表，在并发设置10，只有一个task 在running，其他9个显示finished。一个task的读取速度似乎不是很高（大概3w条/s）,其他物理资源得不到充分利用。请问是配置的不对吗

Affects Versions

1.16

What are you seeing the problem on?

Flink-Table-Api (SQL)

How to reproduce

No response

Relevant log output

No response

Anything else

No response

Are you willing to submit a PR?

Yes I am willing to submit a PR!

Code of Conduct

I agree to follow this project's Code of Conduct

itinycheng · 2024-07-29T11:11:11Z

Hi @limingoo,

可以并行读取；

如果是分布式表可以设置下 scan.partition.num，这个配置可以按照分片切分并行度；
如果有number类型列可以设置下 scan.partition.num, scan.partition.lower-bound, scan.partition.upper-bound，这个类似于jdbc connector的并行度切分策略；

limingoo · 2024-08-15T01:54:39Z

Hi @limingoo,

可以并行读取；

如果是分布式表可以设置下 scan.partition.num，这个配置可以按照分片切分并行度；如果有number类型列可以设置下 scan.partition.num, scan.partition.lower-bound, scan.partition.upper-bound，这个类似于jdbc connector的并行度切分策略；

这个并行度切分策略有没有其他方案，比如说使用limit实现，这样数据比较均衡一些。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

读取速度似乎很慢，资源似乎不能得到有效利用[Bug]: #148

读取速度似乎很慢，资源似乎不能得到有效利用[Bug]: #148

limingoo commented Jul 26, 2024

itinycheng commented Jul 29, 2024

limingoo commented Aug 15, 2024

读取速度似乎很慢，资源似乎不能得到有效利用[Bug]: #148

读取速度似乎很慢，资源似乎不能得到有效利用[Bug]: #148

Comments

limingoo commented Jul 26, 2024

What happened?

Affects Versions

What are you seeing the problem on?

How to reproduce

Relevant log output

Anything else

Are you willing to submit a PR?

Code of Conduct

itinycheng commented Jul 29, 2024

limingoo commented Aug 15, 2024