support dlrm eager train #382

ShawnXuan · 2022-08-29T03:52:48Z

No description provided.

guo-ran · 2022-09-02T07:50:48Z

RecommenderSystems/dlrm/dlrm_eager_train_eval.py

+        save_model("initial_checkpoint")
+
+    opt = flow.optim.SGD(dlrm_module.parameters(), lr=args.learning_rate)
+    lr_scheduler = make_lr_scheduler(args, opt)


Suggested change

lr_scheduler = make_lr_scheduler(args, opt)

lr_scheduler = make_lr_scheduler(args, opt)

opt = flow.one_embedding.Optimizer(

opt, embeddings=[dlrm_module.embedding.one_embedding]

)

guo-ran · 2022-09-02T07:51:03Z

RecommenderSystems/dlrm/eager_train.sh

+test_case=g${num_gpus}_lr${lr}_t${train_batches}_b${train_batch_size}_d${decay_batches}
+echo $test_case
+
+export ONEFLOW_ONE_EMBEDDING_EAGER=1


Suggested change

export ONEFLOW_ONE_EMBEDDING_EAGER=1

MARD1NO · 2022-10-08T08:28:45Z

RecommenderSystems/dlrm/dlrm_eager_train_eval.py

+
+    opt = flow.optim.SGD(dlrm_module.parameters(), lr=args.learning_rate)
+    lr_scheduler = make_lr_scheduler(args, opt)
+    loss_fn = flow.nn.BCEWithLogitsLoss(reduction="none").to("cuda")


这里应该reduction直接设置为mean，才有可能用那个bce fuse kernel

support dlrm eager train

3bf1787

guo-ran reviewed Sep 2, 2022

View reviewed changes

MARD1NO reviewed Oct 8, 2022

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

support dlrm eager train #382

support dlrm eager train #382

Uh oh!

ShawnXuan commented Aug 29, 2022

Uh oh!

guo-ran Sep 2, 2022

Uh oh!

guo-ran Sep 2, 2022

Uh oh!

MARD1NO Oct 8, 2022

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

support dlrm eager train #382

Are you sure you want to change the base?

support dlrm eager train #382

Uh oh!

Conversation

ShawnXuan commented Aug 29, 2022

Uh oh!

guo-ran Sep 2, 2022

Choose a reason for hiding this comment

Uh oh!

guo-ran Sep 2, 2022

Choose a reason for hiding this comment

Uh oh!

MARD1NO Oct 8, 2022

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants