Skip to content

Commit 6d6c49f

Browse files
authored
fix megatron (#3527)
1 parent 65a462d commit 6d6c49f

File tree

2 files changed

+2
-2
lines changed

2 files changed

+2
-2
lines changed

README_CN.md

+1-1
Original file line numberDiff line numberDiff line change
@@ -74,7 +74,7 @@
7474
- **模型量化**:支持AWQ、GPTQ和BNB的量化导出,导出的模型支持使用vLLM/LmDeploy推理加速,并支持继续训练。
7575

7676
## 🎉 新闻
77-
- 🎁 2025.03.16: SWIFT支持了Megatron的并行技术进行训练,请查看[Megatron-SWIFT训练文档](https://swift.readthedocs.io/zh-cn/latest/Instruction/Megatron-SWIFT训练文档.html)
77+
- 🎁 2025.03.16: SWIFT支持了Megatron的并行技术进行训练,请查看[Megatron-SWIFT训练文档](https://swift.readthedocs.io/zh-cn/latest/Instruction/Megatron-SWIFT训练.html)
7878
- 🎁 2025.03.15: SWIFT支持了gme(多模态)embedding模型的微调,请查看[训练脚本](examples/train/embedding/train_gme.sh)
7979
- 🎁 2025.03.13: 我们提供了一个仅使用4GPU(4*80G)来训练72B模型的脚本, 请查看[这里](examples/train/grpo/train_72b_4gpu.sh)
8080
- 🎁 2025.03.05: 支持GRPO的hybrid模式(rollout和actor在同一GPU上, rollout可以进行offload), 同时支持了vllm的tensor parallel, 查看[训练脚本](examples/train/grpo/multi_gpu_mp_colocate.sh)

setup.py

+1-1
Original file line numberDiff line numberDiff line change
@@ -159,7 +159,7 @@ def gen_packages_items():
159159
install_requires=install_requires,
160160
extras_require=extra_requires,
161161
entry_points={
162-
'console_scripts': ['swift=swift.cli.main:cli_main', 'megatron=swift.cli.megatron.main:cli_main']
162+
'console_scripts': ['swift=swift.cli.main:cli_main', 'megatron=swift.cli._megatron.main:cli_main']
163163
},
164164
dependency_links=deps_link,
165165
zip_safe=False)

0 commit comments

Comments
 (0)