models/Qwen/06-Qwen-7B-chat 全量微调中deepspeed使用的是什么版本呢？ #308

1259010439 · 2024-12-06T05:27:42Z

我在进行 DS_BUILD_OPS=1 pip install deepspeed 会有如下报错
ModuleNotFoundError: No module named 'dskernels'

KMnO4-zx · 2024-12-06T06:13:15Z

那就撞一下这个包呗

1259010439 · 2024-12-06T07:04:04Z

嗯嗯这个问题已经解决了现在是会有这个错误我现在想训练的模型是 Qwen2.5-Coder-7B-Instruct 是这个的原因么？
[rank1]: File "/root/miniconda3/envs/deepspeed/lib/python3.10/site-packages/transformers/models/auto/configuration_auto.py", line 761, in getitem
[rank1]: raise KeyError(key)
[rank1]: KeyError: 'qwen2'

KMnO4-zx · 2024-12-09T07:06:26Z

升级transformers版本就行了，这个报错是因为没有找到qwen2这个模型

1259010439 · 2024-12-09T11:15:31Z

还想再请教一下训练后的checkpoint 可以使用vllm的 vllm serve Qwen/Qwen2.5-Coder-7B-Instruct --dtype=half --tensor-parallel-size 4 --download-dir Qwen/v1 --enable-lora --lora-modules lora_name=checkpoint-xx 这个方式直接加入到启动的server服务中么？怎么能过验证一致这样的启动方式是否已经是加入了这些checkpoint呢

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

models/Qwen/06-Qwen-7B-chat 全量微调中deepspeed使用的是什么版本呢？ #308

models/Qwen/06-Qwen-7B-chat 全量微调中deepspeed使用的是什么版本呢？ #308

1259010439 commented Dec 6, 2024

KMnO4-zx commented Dec 6, 2024

1259010439 commented Dec 6, 2024

KMnO4-zx commented Dec 9, 2024

1259010439 commented Dec 9, 2024

models/Qwen/06-Qwen-7B-chat 全量微调 中deepspeed使用的是什么版本呢？ #308

models/Qwen/06-Qwen-7B-chat 全量微调 中deepspeed使用的是什么版本呢？ #308

Comments

1259010439 commented Dec 6, 2024

KMnO4-zx commented Dec 6, 2024

1259010439 commented Dec 6, 2024

KMnO4-zx commented Dec 9, 2024

1259010439 commented Dec 9, 2024

models/Qwen/06-Qwen-7B-chat 全量微调中deepspeed使用的是什么版本呢？ #308

models/Qwen/06-Qwen-7B-chat 全量微调中deepspeed使用的是什么版本呢？ #308