Skip to content

run-qwen3-30B-A3B-int4.sh megatron在加载模型时超时 #1540

@191220042

Description

@191220042

因为某些限制我无法使用镜像且我没有机器的sudo权限且我的os版本较低,nvcc驱动较低无法全部按照build_conda.sh版本安装。
尽量按照build_conda.sh安装了较为新的版本,sglang和megatron的git apply应用成功。
观察在setup_model_and_optimizer时需要经历相当长的时间最后超时

Image

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions