你的位置:开云(中国)kaiyun体育网址登录入口 > 新闻动态 > 开云(中国)kaiyun网页版登录入口也所以阿里通义千问开源模子为底座-开云(中国)kaiyun体育网址登录入口

开云(中国)kaiyun网页版登录入口也所以阿里通义千问开源模子为底座-开云(中国)kaiyun体育网址登录入口

时间:2025-08-01 13:01 点击:80 次

南皆记者关心到,2月10日各人最大AI开源社区Huggingface发布了最新的开源大模子榜单开云(中国)kaiyun网页版登录入口,其中排行前十的开源大模子,皆基于阿里通义千问(Qwen)开源模子二次磨真金不怕火的繁衍模子。

除此之外,近期阿里通义千问(Qwen)模子多次崭露头角。南皆记者了解获悉,近期爆火的DeepSeek“蒸馏”出的4个开源模子、斯坦福大学驰名缠绵机科学家李飞飞用不到50好意思元用度“打造”的s1-32B东谈主工智能推理模子,也所以阿里通义千问开源模子为底座。 

Huggingface榜单是现在各人最具巨擘性的开源大模子榜单,其测试维度涵盖阅读邻接、逻辑推理、数学缠绵、事实问答等。Huggingface2月10日官网榜单炫夸,排行前十的开源大模子一齐皆是基于阿里通义千问(Qwen)开源模子二次磨真金不怕火的繁衍模子。 

近期,李飞飞团队用不到50好意思元的用度,以阿里通义千问Qwen2.5-32B-Instruct开源模子为底座,在16块H100 GPU上监督微调26分钟,磨真金不怕火出新模子s1-32B,得回了与OpenAI的o1和DeepSeek的R1等顶端推理模子数学及编码才气荒谬的成果,以致在竞赛数学问题上的发扬比o1-preview朝上 27%。

值得一提的是,模子s1-32B的打造并非是从零启动,而是基于现成的、预磨真金不怕火的模子(阿里通义千问Qwen2.5-32B-Instruct)进行监督微调,因此老本也大幅裁汰。

此前,DeepSeek官方曾经炫夸,将DeepSeek-R1的推理才气“蒸馏”出了6个模子开源给社区,模子蒸馏的流程指的是将一个大型、复杂模子的常识滚动到一个更小、更浅易的模子中,更小的模子具有更小的体积和更高的运行着力,同期模子蒸馏亦然资源受限种植(如出动种植或镶嵌式系统)中部署机器学习模子的理思聘请。

而DeepSeek蒸馏出的6个开源模子中,有4个等于基于阿里云Qwen-32B来蒸馏,据悉这些模子在多项才气上终明晰对标OpenAI o1-mini的成果。

从2023年8月起,阿里通义千问接踵开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模子,囊括大言语模子、多模态模子、数学模子和代码模子等数十款。现在,通义千问Qwen大模子照旧成为各人最大的开源模子族群。在海表里开源社区中,Qwen的繁衍模子数目已冲破9万,超过好意思国Meta公司旗下的Llama系列开源模子,位居各人第一。在Hugging face2024年的开源模子下载中,Qwen模子系列中的Qwen2.5-1.5B-Instruct的下载量占总下载量的26.6%,是各人下载量最高的开源模子。 

采写:南皆记者 林文琪

官网:www.gaodread.com

邮箱:c098850a@outlook.com

QQ:18813730784

Powered by 开云(中国)kaiyun体育网址登录入口 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024
开云(中国)kaiyun体育网址登录入口-开云(中国)kaiyun网页版登录入口也所以阿里通义千问开源模子为底座-开云(中国)kaiyun体育网址登录入口