lg-ad-r
  您当前的位置 : 寻医网 >> 聚焦 >>

九章云极发布新AI慢思考模型,开放性技术路径赋能复杂推理

时间:2025-03-13 17:38:30    来源:证券之星    阅读量:6585   

近日,中国人民大学STILL项目团队、北京智源研究院团队、九章云极DataCanvas联合发布了大模型慢思考推理系列研究成果:在DataCanvas Alaya NeW智算操作系统上完成初步复现类R1推理模型,并向外界完整开源了强化学习与监督微调的训练代码与训练数据。进一步,创新性提出使用代码工具来增强模型推理性能,在AIME 2024数学推理测试中超越DeepSeek-R1的模型性能。

该研究成果发布在知名技术社区GitHub后,引发了广泛关注。

自DeepSeek-R1技术报告公布后,慢思考推理模型的复现仍然面临训练细节缺失、超参数调试复杂等共性难题,九章云极DataCanvas联合团队通过AI基础设施深度融合?实现突破。研究开源了该模型在DataCanvas Alaya NeW智算操作系统上完成的强化学习与监督微调全过程完整训练日志、训练数据及容器化部署方案,为当前大多数的复杂推理大模型复现提供了从理论到实践的完整闭环支持。

值得关注的是,DeepSeek以及蒸馏模型在推理过程中无法调用外部代码工具。针对这一问题,该研究结果介绍了九章云极新的工具增强推理模型STILL-3-Tool-32B在AIME 2024基准测试上的领先表现。研究结果显示,该模型在AIME 2024基准测试中取得了81.70%准确率,超越了DeepSeek-R1满血版,以15.56%的显著优势超越其基座训练模型,与OpenAI o3-mini持平,并超越OpenAI o1。

研究结果显示,DataCanvas Alaya NeW智算操作系统在开源工具链与基座模型适配、算法与算力协同、逻辑推理与多步决策等复杂任务框架方面表现出明显优势。业界人员表示,这一成果不仅验证了九章云极在大模型慢思考推理、强化学习训练框架方面的深厚积累,也为开源模型复现提供了新的思路和方法。

在业界看来,完整复现DeepSeek-R1模型存在较高技术门槛,但也为此带来较大研究契机。此前包括HuggingFace、伯克利大学、上海交大等机构均有相关复现研究,九章云极凭借强大的技术储备和人才储备,通过长期深耕,系统掌握大模型慢思考推理技术。同时,九章云极注重技术的开源与产品化,致力于让普通开发者像拼乐高积木一样快速搭建出类R1性能的推理模型,实现了 "低成本高回报" 的技术跃迁。

据悉,该相关研究成果已形成论文《An Empirical Study on Eliciting and Improving R1-like Reasoning Models》,已在全球科研人员前沿成果预印版论文网站arXiv发表。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

精彩内容
翻来覆去难入梦 按摩6个穴位让你睡得香

翻来覆去难入梦 按摩6个穴位让你睡得香

随着生活压力的不断增加,睡眠质量的好坏会直接影响我们第二天的神经状态。如果我们夜里常常辗转反侧、难以入眠...

儿童肿瘤治疗困局待解,多部门保障儿药产研

儿童肿瘤治疗困局待解,多部门保障儿药产研

相较于成人肿瘤药市场和研发的如火如荼,儿童肿瘤药市场显得冷清。然而,儿童肿瘤治疗领域存在更为迫切的临床需...

腰酸背痛偏爱上班族!腰背痛怎么缓解?

腰酸背痛偏爱上班族!腰背痛怎么缓解?

坐着痛、站着痛、走路痛,随时随地都在痛痛痛……现在的上班族已经成为了腰酸背痛的高发群体,上完一天班下来,...

方舟云康再度冲刺港股IPO亏损扩大、药品销售贡献超半数营收

方舟云康再度冲刺港股IPO亏损扩大、药品销售贡献超半数营收

近日,方舟云康控股有限公司向港交所递交招股书。在此之前,公司曾于2022年11月21日向港交所递交招股书...

经期延长,排不干净,是气虚,血热还是血瘀,赶紧先做个自我辨证

经期延长,排不干净,是气虚,血热还是血瘀,赶紧先做个自我辨证

后台读者来信:你好,我今年27岁,结婚快8年了,有两个小孩,做过2次流产手术,上个月大姨妈,来了已经有半...

衣服穿太多或会捂出病!宝宝冬季保暖,该这样做

衣服穿太多或会捂出病!宝宝冬季保暖,该这样做

天气冷了,很多家长都担心宝宝着凉了,于是不仅门窗紧闭,还里三层外三层地把他们包得严严实实的,甚至用被子蒙...

文章排行

关于我们 | 版权声明 | 广告业务 | 联系我们 | 网站地图

Copy 2006- news.qywc.cn 寻医网 版权所有   备案号:皖ICP备2023007381号

声明:本网站所转载信息,不代表本网观点,本网不承担此类稿件侵权行为的连带责任。邮箱:hchchc0324@163.com