Skip to content

仿真中AllReduce和AllGather产生的流量完全一致 #147

@nuctrace

Description

@nuctrace

拓扑文件如下:

Spectrum-X_128g_8gps_100Gbps_A100.txt

负载文件的内容如下图所示:

Image

我希望运行负载文件中的不同的集合通信元语,以验证每种集合通信操作生成流是否符合预期
每次运行结束后我通过解析/etc/astra-sim/simulation/llama_hpn7_fct.txt文件来观察集合通信操作生成的流情况
在分别运行Allgather和Allreduce后生成的流情况如下图所示

Image

Image

可见两种集合通信操作生成的流完全一致,这令我感到困惑

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions