口碑家电
网站地图 |加入收藏
您当前位置:口碑家电 >> 聚焦

阿里云确认:李飞飞团队s1模型基于Qwen2.5-32B-Instruc

发布时间 2025-02-08 01:51 -- 来源 科技快报网 阅读量:9882   
【导读】,阿里云今日证实,李飞飞团队开发的人工智能推理模型s1是基于阿里通义千问模型进行训练的。 该s1模型在数学和编码能力测试中表现出与OpenAIo1和DeepSeekR1等尖端推理模型相似的效果。 据回应称,在16块H100GPU上监督微...

,阿里云今日证实,李飞飞团队开发的人工智能推理模型s1是基于阿里通义千问模型进行训练的。

该s1模型在数学和编码能力测试中表现出与OpenAI o1和DeepSeek R1等尖端推理模型相似的效果。

据回应称,在16块H100 GPU上监督微调26分钟后,s1-32B取得了与o1和R1相当甚至更高27%竞赛数学问题表现的成果。

这一技术旨在通过训练一个人工智能模型来提取其“推理”能力,并采用了监督微调方法,比起DeepSeek使用大规模强化学习方法更具成本效益。s1利用了阿里巴巴旗下中国人工智能实验室Qwen提供的免费小型人工智能模型以及谷歌Gemini 2.0 Flash Thinking Experimental给出的答案背后思考过程。

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。
热门资讯
口碑家电- 关于我们- 网站地图- 联系我们 - RSS订阅

本站部分信息来源于网络,如有侵权请与我们联系。本站原创内容转载请注明出处。

Copyright @2022- All Rights Reserved 口碑家电 版权所有

邮箱:jokerdeyouxiang@sina.com

备案号:皖ICP备2023005497号