浏览位置:热点观察网 > 观察

九章云极发布新AI慢思考模型,开放性技术路径赋能复杂推理

发布时间:2025-03-13 17:37   文章来源:证券之星   点击量:4911   

近日,中国人民大学STILL项目团队、北京智源研究院团队、九章云极DataCanvas联合发布了大模型慢思考推理系列研究成果:在DataCanvas Alaya NeW智算操作系统上完成初步复现类R1推理模型,并向外界完整开源了强化学习与监督微调的训练代码与训练数据。进一步,创新性提出使用代码工具来增强模型推理性能,在AIME 2024数学推理测试中超越DeepSeek-R1的模型性能。

该研究成果发布在知名技术社区GitHub后,引发了广泛关注。

自DeepSeek-R1技术报告公布后,慢思考推理模型的复现仍然面临训练细节缺失、超参数调试复杂等共性难题,九章云极DataCanvas联合团队通过AI基础设施深度融合?实现突破。研究开源了该模型在DataCanvas Alaya NeW智算操作系统上完成的强化学习与监督微调全过程完整训练日志、训练数据及容器化部署方案,为当前大多数的复杂推理大模型复现提供了从理论到实践的完整闭环支持。

值得关注的是,DeepSeek以及蒸馏模型在推理过程中无法调用外部代码工具。针对这一问题,该研究结果介绍了九章云极新的工具增强推理模型STILL-3-Tool-32B在AIME 2024基准测试上的领先表现。研究结果显示,该模型在AIME 2024基准测试中取得了81.70%准确率,超越了DeepSeek-R1满血版,以15.56%的显著优势超越其基座训练模型,与OpenAI o3-mini持平,并超越OpenAI o1。

研究结果显示,DataCanvas Alaya NeW智算操作系统在开源工具链与基座模型适配、算法与算力协同、逻辑推理与多步决策等复杂任务框架方面表现出明显优势。业界人员表示,这一成果不仅验证了九章云极在大模型慢思考推理、强化学习训练框架方面的深厚积累,也为开源模型复现提供了新的思路和方法。

在业界看来,完整复现DeepSeek-R1模型存在较高技术门槛,但也为此带来较大研究契机。此前包括HuggingFace、伯克利大学、上海交大等机构均有相关复现研究,九章云极凭借强大的技术储备和人才储备,通过长期深耕,系统掌握大模型慢思考推理技术。同时,九章云极注重技术的开源与产品化,致力于让普通开发者像拼乐高积木一样快速搭建出类R1性能的推理模型,实现了 "低成本高回报" 的技术跃迁。

据悉,该相关研究成果已形成论文《An Empirical Study on Eliciting and Improving R1-like Reasoning Models》,已在全球科研人员前沿成果预印版论文网站arXiv发表。

免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。

推荐内容
  • 向“新”而行 首发经济引燃消费“热力”

    在山东曹县,定制一袭精致的马面裙,不亦乐乎;前往福建泉州,沉浸于一场绚烂的簪花体验,花香袭人;奔赴河南开封,漫步非遗市集,流连忘返……这些在悠久传统文化中生长出来的“新”创意,不仅满足了消费者多样化的消费需求,也为曹县、泉州、开封等首发地带...

  • 远道而来、应接不暇、满载而归

    “四叶草”内,一片“热带海滩”热闹非凡——在第七届中国国际进口博览会的国家综合展上,科摩罗展馆凭借独特的海岛风格,吸引了许多观众拍照“打卡”。根据联合国的最新数据,截至2023年,全球共有45个最不发达国家,其中33个在非洲。今年的进博会,...

  • 科技赋能 焕新城市“烟火气”

    “有电梯、有安全扶手,布局也比以前更实用了。”来到新家的纪阿姨来回踱步,激动赞叹道。2024年5月28日,北京市首个装配式危旧楼改造项目——西城区桦皮厂胡同8号楼迎来入住的第一批居民。和纪阿姨一样惊喜的,还有楼上楼下20户老邻居们。随着各地...

  • 百舸争流千帆竞 体旅融合点燃消费活力

    桨影翻飞,百舸争流破浪。在刚刚过去的端午假期,广东、湖南、浙江、贵州、云南等多地举办龙舟竞渡,为传统佳节增添了浓厚的运动活力和竞技氛围,也吸引了大批游客“打卡”围观。中国龙舟公开赛、2024年中国皮划艇马拉松公开赛、2024博斯腾湖赛艇大师...