360智脑团队发布开源模型Light-R1-14B-DS

1年前 (2025) Ai138

74 0 0

360智脑团队成功复现Deepseek强化学习效果，推出开源推理模型Light-R1-14B-DS。该模型在14B参数规模下显著提升数学推理能力，超越多个32B级别模型。在AIME竞赛中，Light-R1-14B-DS表现突出，分别提升4.3分和10分。模型采用渐进式监督微调和强化学习训练方法。
GitHub链接🔗 https://github.com/Qihoo360/Light-R1

欢迎访问AI工具网 Ai138.com，我们致力于为AI专业人士和人工智能爱好者提供全面的AI工具和资源。在我们的平台上，您可以找到涵盖AI聊天、自然语言处理、图像与绘画处理、机器学习以及视频和音频制作等领域的顶尖工具。探索AI，深入了解AI技术如何赋能创新和效率提升，让我们一起步入AI技术的未来世界！

关于我们收录申请免责声明

360智脑团队发布开源模型Light-R1-14B-DS

男子用AI写色情小说获刑十个月

字节跳动SeedFoley音效模型上线，告别“无声视频”