3 小时从零完全训练一个 26M 的小参数 GPT?仅需 2G 显卡即可推理⚡️🤯🤯 提供完整复现顶尖模型的全流程和视频教程🔥
改进自 DeepSeek-V2!minimind 也太好了,让每一个人都可以自行体验完整训练一个可用的模型!🔥
开源地址👉 https://github.com/jingyaogong/minimind 视频教程 https://bilibili.com/video/BV12dHPeqE72