大模型开源闭源路线之争:百模大战阿里云扩大朋友圈
华夏时报
2023-09-28 02:04:01
0

原标题:大模型开源闭源路线之争:百模大战阿里云扩大朋友圈

大模型开源闭源路线之争:百模大战阿里云扩大朋友圈

华夏时报(www.chinatimes.net.cn)记者 卢晓 北京报道

“我们认为,今天在模型这部分应该先注重生态,然后再注重商业化,而不是说一开始就过度围绕商业化。”9月25日,阿里云CTO周靖人这样说。当天阿里云宣布开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。

自大模型站上风口,它的商业化问题就备受关注。除了当天多次提到“我们的初衷是如何让AI更普惠”外,MaaS(“Model as a Service”,“模型即服务”)这个词也是周靖人在去年11月的云栖大会上首次提出。

不过进入百模大战时代,围绕大模型的开源和闭源路线之争也一直在持续。这背后,是关乎人才、技术、资金以及商业模式的较量。

开源更大模型

这并不是阿里云第一次开源通义千问大模型。

据记者了解,阿里云在今年8月已经已开源通义千问70亿参数模型Qwen-7B,一个多月累计下载量破100万。9月25日当天阿里云也宣布,Qwen-7B全新升级,核心指标最高提升22.5%。

不过相对于百亿以内参数级别大语言模型是目前开发者进行应用开发和迭代的主流选择,新开源的Qwen-14B进一步提高了小尺寸模型的性能上限。

记者从阿里云方面了解到,Qwen-14B是一款支持多种语言的高性能开源模型,整体训练数据超过3万亿Token,具备更强大的推理、认知、规划和记忆能力,最大支持8k的上下文窗口长度。周靖人当天还表示,14B模型会比7B在某些长尾领域表现出来更强的认知能力,甚至推理能力,包括算术等方面。

对于两个开源模型的不同,周靖人在9月25日表示,之所以提供不同尺寸开源模型,是因为不同企业或者不同场景里,涉及到的数据量或者对模型的要求不一样,也跟模型服务的成本相关,“今天越大规模的模型,固然在推理、认知能力上更好,但是它的服务成本也会相应提升。”他认为,企业会根据自己实际场景问题的复杂度,包括调用的频次、包括相关资源配比的情况,来做更加符合于他们业务场景的选择。

阿里云在今年4月初对外发布了通义千问大模型,周靖人在发布当天曾表示,“所有软件都值得接入大模型升级改造”。据记者了解,除了阿里系的淘宝、钉钉、未来精灵等业务都已经接入通义千问外,此前开源的Qwen-7B大模型也已在教育、清洁机器人等场景中使用。

此外,阿里云还在积极参与开源社区,扩大自己的生态圈。

记者从阿里云方面了解,用户可从魔搭社区直接下载,也可通过阿里云灵积平台访问和调用Qwen-14B和Qwen-14B-Chat。阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。据悉,魔搭社区是阿里云于去年牵头建设的目前中国最大的AI模型开源社区。

开源还是闭源

开源是大模型快速搭建生态、扩大使用规模的办法之一。

不止阿里云,国外科技大厂Meta、AWS,以及国内的百川智能等公司都选择了这一条路。周靖人在9月25日的发言中也表示,阿里云将持续拥抱开源开放,推动中国大模型生态建设,希望让大模型技术更快触达中小企业和个人开发者。

魔搭社区的数据变化可以作为例证。记者从阿里云方面了解到,近两个月魔搭社区的模型下载量从4500万上涨到8500万,其活跃用户也超过两百万。此外,魔搭社区里的模型数量,也从一开始的三百多个增加到目前的1200多个。

但需要提及的是,并不是所有的大模型都选择了开源。就像发布ChatGPT、引燃AIGC之火的OpenAI就选择了闭源发展。

对于开源和闭源两条路线孰优孰劣,盘古智库高级研究员江瀚对《华夏时报》记者表示,开源路线可以加速大模型的研发迭代速度,因为开源社区可以提供丰富的资源和反馈,同时也可以避免一些知识产权问题。闭源路线则可以更好地保护企业的核心技术和数据资产,同时可以提供更加专业的技术支持和服务,“这对于一些需要高度定制化的大模型应用的企业来说可能更加合适。”但他同时也认为,这两种路线也都面临着不同挑战。

而对于开源和闭源两条路线的成功与否,深度科技研究院院长张孝荣告诉记者,最终还要看技术创新和性能、生态系统和社区、商业模式和市场策略以及政策环境和法律风险等决定因素。他对记者表示,“开源模型可以通过免费使用和增值服务等方式实现盈利,而闭源模型则需要通过定制化的解决方案和优质的客户服务来获取商业价值。”

不过开源和闭源都是手段,最终比拼的还是谁能更好地解决客户的实际问题。

周靖人当天表示,无论开源、闭源,都是让AI使用门槛更低,让AI能力更加普惠。“不同的场景有不一样的需求,我们希望在今天这样一个生态里面,一定不是one size fits all,一定不是只有一个模型就要服务万物,也不是说只有一种方式。”

阿里云副总裁、公众与客户沟通部总经理张启也表示,“一花独放不是春,百花齐放春满园。不管是闭源大模型还是开源大模型,自研大模型还是第三方大模型,大规模参数模型还是小规模参数模型,通用大模型还是行业、企业专属大模型,阿里云全部欢迎和支持,共同建设一个最大的大模型自由市场。我们希望所有大模型都能跑在阿里云上,跑得更快、更便宜、更安全。也因为此,阿里云率先开源7B、14B模型,并将持续开源开放,为开源社区贡献力量。”

相关内容

热门资讯

字节Seedance2.0小范... 日前,字节跳动最新视频生成模型Seedance 2.0在即梦、豆包、小云雀等产品开启内测。凭借多模态...
中金:预计未来银行扩表速度放缓... 中金研报称,本次央行货币政策报告表述的延续性很强,符合中央经济工作会议“提质增效”的取向,而非简单的...
MSCI中国指数最新调整!一文... 财联社2月11日讯(编辑 马兰)北京时间2月11日,国际指数编制公司MSCI宣布其指数季度调整结果,...
执金融之笔 为宿迁青绿上色 谁在描绘宿迁高质量发展的生态底色?一组跃动的数字给出了铿锵答案:截至2025年末,交通银行宿迁分行绿...
AI算力需求爆发蔓延,A股玻纤... 2月11日,A股玻纤概念板块集体大涨,板块平均涨跌幅达10.31%,主力资金净流入平均为6.48亿元...
IPO排队进入前六,广发证券投... 近日,深圳市拓普泰克技术股份有限公司(简称“拓普泰克”)提交注册,该公司专注于智能控制器与工业物联网...
386辆小米婚车队刷屏!雷军直... 快科技2月11日消息 2月10日晚间,小米创办人,董事长兼CEO雷军 直播小米汽车科技展厅和定制服务...
美股科技巨头利润“霸权”告终?... 随着美股第四季度财报季接近尾声,长期由少数科技巨头主导利润的局面正在发生根本性转变。 自去年12月中...
日本半导体公司Rapidus拟... 截至2月11日14点40分,上证指数涨0.14%,深证成指跌0.33%,创业板指跌1.05%。ETF...
盘整观望!2026年2月11日... 继昨日普遍回落后,今日国内金价整体进入盘整阶段,绝大多数品牌价格保持不变。市场主流价格区间稳定在15...
原创 3... 特朗普的赢学叙事再次增添了浓重的一笔。美国国务院近日宣布,在华盛顿举行的首届关键矿产部长级会议上,美...
突然爆了,飙涨137.6%!芯... 近期,全球芯片领域利好消息频出! 今日(2月11日),韩国海关公布的数据显示,2月前10天,韩国半导...
可见性与独异性:主流媒体系统性... 【摘要】数字媒体生态重构了公众注意力的组织方式。社交媒体、人工智能代理等互联网接口凭借精密的算法程序...
马斯克遭遇人才离职潮:特斯拉1... “感谢特斯拉过去给我的机会”。 “我今天从xAI离职了”。 “今天是我在xAI的最后一天”。 短短几...
新年大吉,“红”运当头!节前轮... 春节前最后一个交易周,市场整体分化波动,有色闪耀、光伏起伏、半导体与AI应用交织奔涌,算力与化工等方...
参考封面 | 欧洲应走向何方? 参考消息网2月10日报道西班牙《对外政策》双月刊1-2月号报道,2026年正值西班牙加入欧洲共同体4...
无锡桃农之子借8万创业,干出全... 「IPO全观察」栏目聚焦首次公开募股公司,报道企业家创业经历与成功故事,剖析公司商业模式和经营业绩,...
聚焦支持优质科创企业上市 地方... 新华社北京2月10日电 《中国证券报》10日刊发文章《聚焦支持优质科创企业上市 地方资本市场着力打造...
工银瑞信基金徐博文:“固收+”... 在利率下行、居民存款“搬家”背景下,“固收+”基金再度成为配置资金关注焦点。Wind数据显示,截至目...