remove unnecessary mask of batch infer #2034

wzy3650 · 2025-02-12T04:33:43Z

attention mask可以认为已经”包含了“padding mask，所以padding mask不会影响最终计算结果

RVC-Boss · 2025-02-12T06:27:13Z

这个你测过tensor值是否一样吗

GPT-SoVITS/GPT_SoVITS/AR/models/t2s_model.py

Line 150 in c8c5d6a

就是在这一行前，是否为None2个结果作差求L1看是否为0

wzy3650 · 2025-02-12T06:52:44Z

这个你测过tensor值是否一样吗

GPT-SoVITS/GPT_SoVITS/AR/models/t2s_model.py

Line 150 in c8c5d6a

就是在这一行前，是否为None2个结果作差求L1看是否为0

从整体比较整个tensor的话是不一样的，不一样的部分对应于被padding mask给mask掉那些的position；具体来说，当前主线代码会去手动mask这些位置，但实际上没必要，因为在attention mask作用下这些位置的结果在后续的操作中是直接被忽视的、不会影响到token预测，即最终预测出的token是完全一样的
实际上这个做法是在对齐训练里面的处理方式（forward_old函数），上面删掉的这些操作对token预测是冗余的

remove unnecessary mask of batch infer

c8c5d6a

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

remove unnecessary mask of batch infer #2034

remove unnecessary mask of batch infer #2034

wzy3650 commented Feb 12, 2025

RVC-Boss commented Feb 12, 2025

wzy3650 commented Feb 12, 2025

remove unnecessary mask of batch infer #2034

Are you sure you want to change the base?

remove unnecessary mask of batch infer #2034

Conversation

wzy3650 commented Feb 12, 2025

RVC-Boss commented Feb 12, 2025

wzy3650 commented Feb 12, 2025