新浪科技讯 2月6日晚间音讯开yun体育网,当天,李飞飞等斯坦福大学和华盛顿大学霸术东谈主员以不到50好意思元的云研究用度历练了一个名叫s1的东谈主工智能推理模子,该模子在数学和编码才智测试中的推崇与OpenAl的o1和Depsek的R1等顶端推理模子访佛,激励正常关心。
不外很快,该s1模子被指“并非从零开动历练”,其基座模子为“阿里通义千问(Qwen)模子”。对此,新浪科技向阿里云方面求证,阿里云方面说明了这一音讯,并回复称:“他们以阿里通义千问Qwen2.5-32B-Instruct开源模子为底座,在16块H100 GPU上监督微调26分钟,历练出新模子s1-32B, 赢得了与OpenAI的o1和DeepSeek的R1等顶端推理模子数学及编码才智额外的遵循,致使在竞赛数知识题上的推崇比o1-preview越过27%。”
阿里云方面暗示,更早之前,DeepSeek官方曾泄露,将DeepSeek-R1的推理才智蒸馏6个模子开源给社区,其中4个模子来自Qwen:基于Qwen-32B蒸馏的模子,在多项才智上已毕了对标OpenAI o1-mini的遵循。一时代,在开源社区备受追捧的通义千问Qwen模子,因这一轮推理模子技巧新波澜而浮出水面:Qwen模子性能强劲,开源尺寸种种化,况兼领有寰球最大的滋生模子群,还是取代Llama成为开源社区事实上最攻击的标杆基座模子。
据了解,从2023年8月起,阿里云通义千问接踵开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模子,囊括假话语模子、多模态模子、数学模子和代码模子等数十款,数次登上HuggingFace的Open LLM Leaderboard、Chatbot Arena大模子盲测榜单、司南OpenCompass等多个国表里泰斗大模子榜单,性能寰球当先,多次斩获“寰球开源冠军”。
当今,海表里开源社区中Qwen的滋生模子数目已冲突9万,卓绝Llama系列滋生模子,通义千问Qwen成长为寰球最大的生成式话语模子族群。寰球AI模子修复者皆用Qwen,也不错更好地进行不同技巧的互异化比拟,从而进一步鼓动了Qwen的火热,让Qwen成为开源社区事实上最攻击的标杆基座模子。(文猛)
连累剪辑:王若云 开yun体育网