阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果
搜狐科技
2023-11-14 18:05:08
0

原标题:阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果

出品 | 搜狐科技

作者 | 梁昌均

国内大模型再陷“套壳”争议。阿里巴巴前副总裁、知名AI框架大牛贾扬清发朋友圈,感慨做小公司不容易,希望国内企业如果就是开源的模型结构,不要做换名伪装,免得做多余的适配工作。

根据贾扬清的朋友圈,他表示有某海外客户要其公司帮他们适配某国内大厂的新模型,但后来有朋友告知,这个大厂新模型完全就是LLaMA的架构,但为了表示不一样,把代码里面的名字从LLaMA改成了他们的名字,然后换了几个变量名。此外,海外也有工程师直接指出了这一点。

“我们是小公司也不想得罪大佬们,名字我就不说了,不过各位大佬,开源社区不容易,如果你们就是开源的模型结构,求高抬贵手就叫原来的名字吧,免得我们还做一堆工作就为了适配你们改名字。”贾扬清说。

前述消息在业内传开后,国内不少基于开源的LLaMA的国产大模型纷纷躺枪。但贾扬清所说的“大厂”到底是谁并不定论,他还特别声明到不是老东家阿里。LLaMA是Meta在今年开源的系列大模型,参数包括13B、65B等。

不过,业内的怀疑对象指向刚发布首款预训练大模型Yi-34B的零一万物,其是李开复在今年7月入局AI大模型新成立的公司,由李开复牵头创办并担任CEO。

搜狐科技注意到,零一万物开源发布的Yi-34B模型目前在Hugging Face的Open LLM Leaderboard开源大语言模型排行榜排名第一。但此前有开发者在Hugging Face社区的Yi-34B项目讨论区留言称,除了两个张量被重新命名外(input_layernorm 和 post_attention_layernorm),Yi完全使用了LLaMA的架构。

“因为围绕LLaMA架构有大量的投资和工具,所以对张量使用相同的名称是有价值的。开源社区肯定会重新发布Yi,并重新命名张量,以便有一个符合LLaMA架构的版本。我们希望您能考虑在该模型获得大量采用之前,在您的官方模型中采用这一更改,以便它最终能够享受它应得的采用。”该留言称。

对于市场质疑,零一万物方面对搜狐科技回应称,GPT是一个业内公认的成熟架构,LLaMA在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时基于零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。

零一万物还表示,模型结构仅是模型训练其中一部分。Yi 开源模型在其他方面的精力,比如数据工程、训练方法、baby sitting(训练过程监测)的技巧、hyperparameter设置、评估方法以及对评估指标的本质理解深度、对模型泛化能力的原理的研究深度、行业顶尖的 AI infra 能力等,投入了大量研发和打底工作,这些工作往往比起基本结构能起到更大的作用跟价值,这些也是零一万物在大模型预训练阶段的核心技术护城河。

“在大量训练实验过程中,由于实验执行的需要对代码做了更名,我们尊重开源社区的反馈,将代码进行更新,也更好的融入Transformer生态。”零一万物称,非常感谢社区的反馈,希望和大家携手共创社区繁荣,Yi Open-source 会尽最大努力持续进步。

对于Hugging Face上提到的留言,零一万物有关负责人也对其作出了回复,称会按照留言的建议,把张量的命名从Yi改为LLaMA,保证准确度和透明度。

“这个命名问题是我们的疏忽。在大量的实验中,我们对代码进行了多次重命名,以满足试验要求,但在推出发行版前没有把名字换回来。”该回应称,零一万物将加强流程,保证这样的失误不会再次发生,并将检查所有代码,确保其它没有问题。

零一万物在11月初正式发布首款预训练大模型 Yi系列模型,包含34B和6B两个版本,其中34B模型版本开源。零一万物当时宣称,根据 Hugging Face 英文开源社区平台和C-Eval中文评测的最新榜单,Yi-34B预训练模型成为全球开源大模型“双料冠军”,这也是迄今为止唯一成功登顶 Hugging Face 全球开源模型排行榜的国产模型。

此前,国内不少大模型都陷入过“套壳”质疑,不少企业正是基于开源模型(特别是LLaMA系列)做微调,包括二次训练等,也有企业直接基于开源模型做应用层的开发,因此研发成本更低,但往往缺乏技术护城河,不被市场看好。

OpenAI CEO Sam Altman此前就表示,“套壳”OpenAI的公司活不长久,因为OpenAI已经在解决模型本身的问题,同时这些仅在成本和速度上与OpenAI一较高下的公司,竞争优势并不会长久且持续,企业必须提供真正独特的价值。

相关内容

热门资讯

新春消费亮点纷呈 市场活力加速... 央视网消息(新闻联播):春节假期,我国消费市场持续火热。新业态、新场景不断涌现,市场活力加速释放,为...
原创 特... 特朗普最引以为傲的“关税大棒”,被自己国家的最高法院一锤子敲碎了。 2026年2月20日,美国最高法...
警惕肝吸虫“入侵”警报 在我们身体的深处,有一个默默无闻却至关重要的器官——肝脏,它不仅是我们体内最大的实质性器官,更是承担...
港股智谱与MiniMax大涨能... 一、当日行情分析 1、市场观察——先别太乐观! 春节假期前后(2月16日-2月20日),海外股指多数...
华勤技术转型路 全球最大消费电... 观点网 服务三星、小米等巨头的一家ODM巨头即将赴港上市。 近期路透旗下IFR引述知情人士称,华勤技...
原创 金... 今天早上,很多人的朋友圈被一条消息刷屏了:周大福、老凤祥这些大金店的足金首饰,挂牌价直接标到了每克1...
美联储“大鸽派”沃勒感叹:美国... 财联社2月24日讯(编辑 史正丞)当地时间周一,美联储理事克里斯托弗·沃勒州长在第42届全国商业经济...
警惕!《家有好医生》式骗局:守... 近期,《家有好医生》陈涛“神药”骗局被层层揭开,无数中老年消费者的遭遇令人痛心:预付定金后退款无门,...
中国建设银行2026年度春季招... ★ 梁老师 生涯规划专家 2026年度银行春季招聘已全面启动,各大商业银行及政策性银行纷纷发布招聘公...
原创 1... 别看特朗普在国际舞台上喊得震天响,一会儿要派三角洲部队去抓马杜罗,一会儿逼着泽连斯基点头停火,转头又...
荷兰国际集团报告:美元避险属性... 来源:环球市场播报 荷兰国际集团(ING)周一在一份报告中指出,自2024年以来,美元的避险属性有...
“一句话下单”2亿次: “千问... 2月23日大年初七,千问发布数据显示,春节期间,用户在千问上“一句话下单”近2亿次,全国平均每10人...
当算法开始预测人生,我们失去了... (麻省理工科技评论) 人类的本质,从根本上说,是一种预测者。 无论是借助过往经验,还是依赖因果逻辑,...
年轻人为何选择养老院?90后院... 卷首语 “爱在守护” 栏目由中南大学湘雅护理学院社区护理学系党支部携手新湖南湘健频道共同策划,邀请了...
国开行2025年发放公路基础设... 记者从国家开发银行获悉,2025年,国开行发放公路基础设施贷款超3600亿元,同比增长10%。“十四...
“马”上来沪 |春节假期上海线... 东方网记者程琦2月23日报道:春节期间,上海持续举办“跨年迎新消费季”活动,商圈寻马、新春美食等六大...
利好来了!000988,订单排... 【导读】华工科技AI高速光模块订单排到四季度 中国基金报记者 张舟整理报道 华工科技的AI高速光模块...
【锋行链盟】科创板IPO控股股... 在科创板IPO过程中,控股股东作为企业的核心治理主体,其行为合规性、股权稳定性及对发行人的影响是监管...
马年A股如何开局? | 每周研... 春节长假期间,海外市场整体呈现小幅反弹态势。美股止跌回升,大宗商品表现强势,地缘政治扰动再起,推动原...
黄金RWA赛道群雄逐鹿,维塔金... 当各大巨头纷纷入局黄金代币化,市场竞争日趋激烈。维塔金凭借其在资产端、资本端和合规端的“三板斧”,构...