DeepSeek-V3/R1 满血版 671B 全参数微调的开源解决方案,包含从训练到推理的完整代码和脚本,以及实践中积累一些经验和结论,由中国科学院自动化研究所和中科闻歌联合推出。
https://github.com/ScienceOne-AI/DeepSeek-671B-SFT-Guide/blob/main/README_zh.md