李开复旗下“零一万物”大模型疑套壳LLaMA
蓝鲸财经
2023-11-15 12:03:24
0

原标题:李开复旗下“零一万物”大模型疑套壳LLaMA

图片来源:视觉中国

知名大模型公司再次陷入套壳质疑,这次是李开复刚于一周前发布的“零一万物”(Yi)大语言模型,疑似套壳Meta公司在今年开源的大模型LLaMA。

阿里前技术副总裁、大模型行业创业者贾扬清近日在朋友圈中表示,做小公司不容易,在做适配某国内大厂的新模型的业务时,发现此大厂新模型完全照搬LLaMA的架构,“今天有朋友告诉我,这个大厂新模型exactly就是LLaMA的架构,但是为了表示不一样,把代码里面的名字从LLaMA改成了他们的名字,然后换了几个变量名。”

贾扬清表示希望不要换名伪装,以免做多余的适配工作,“各位大佬,开源社区不容易,如果你们就是开源的模型结构,求高抬贵手就叫原来的名字吧,免得我们还做一堆工作就为了适配你们改名字。”

贾扬清没有指明具体的大模型名字。但业内怀疑的对象指向李开复旗下的零一万物(Yi)。

在全球三大开源社区平台之一Hugging Face上,零一万物的社区中,开发者ehartford指出,“据我们了解,除了两个张量(tensor)被重命名之外,Yi 完全使用了 LLaMA 的架构。”

据《机器之心》报道,有研究者在加速器创业网站Y Combinator上发帖指出,Yi-34B 模型基本上采用了 LLaMA 的架构,只是重命名了两个张量。

张量(Tensor)指多维向量,Yi相当于只更改了部分参数的名字,架构与LLaMA相同,但却完全没有提到LLaMA的来源。

在Hugging Face上零一万物社区讨论中,有用户指出套壳对于Yi许可证的风险,“如果他们使用完全相同的 Meta LLaMA 结构、代码库和所有相关资源,也必须遵守 LLaMA 规定的许可协议。以 LLaMA 格式正式发布 Yi 模型是有问题的,会破坏 Yi 许可条款的可执行性。”

Yi是李开复成立的AI公司“零一万物”上周刚刚发布的首款开源大模型。据36氪报道,零一万物已完成新一轮融资,由阿里云领投。李开复称,在完成融资前,为了覆盖算力等训练成本,零一万物已经负债几千万美元。而现在,零一万物估值已超10亿美元,跻身独角兽行列。目前零一万物开源发布的Yi-34B模型在Hugging Face上Open LLM Leaderboard开源大语言模型排行榜上排名第一。

针对Yi套壳LLaMA一事,零一万物回应《机器之心》表示,Yi确实借鉴了GPT的成熟结构,但零一万物团队自己也做了大量工作:“GPT 是一个业内公认的成熟架构,LLaMA 在 GPT 上做了总结。零一万物研发大模型的结构设计基于 GPT 成熟结构,借鉴了行业顶尖水平的公开成果,同时基于零一万物团队对模型和训练的理解做了大量工作…… Yi 开源模型在其他方面的精力,比如数据工程、训练方法、baby sitting(训练过程监测)的技巧、hyperparameter 设置、评估方法以及对评估指标的本质理解深度、对模型泛化能力的原理的研究深度、行业顶尖的 AI Infra 能力等,投入了大量研发和打底工作……”

而在Hugging Face原帖下,零一万物的团队成员Richar Lin回应承认了更改张量名称一事,“这个命名问题是我们的疏忽。在大量的训练实验中,我们对代码进行了多次重命名,以满足实验要求。但是,我们有点掉以轻心,没有在发布之前将它们改回来。” 他表示,会将张量改回原LLaMA的命名。

国产大模型的套壳开源大模型的争议早已有之。不少企业正是基于开源模型做微调,包括二次训练等,也有企业直接基于开源模型做应用层的开发,因此研发成本更低。

OpenAI公司对于 GPT-2 之后的模型就不再开源,而Meta公司推出的开源模型LLaMA,其训练使用的公开数据集均超过万亿词元,展现出与非开源大模型相近水平的任务处理能力。LLaMA便成了经费并不充裕的学术界或公司参与AI浪潮的高性价比之选。

相关内容

热门资讯

新春消费亮点纷呈 市场活力加速... 央视网消息(新闻联播):春节假期,我国消费市场持续火热。新业态、新场景不断涌现,市场活力加速释放,为...
原创 特... 特朗普最引以为傲的“关税大棒”,被自己国家的最高法院一锤子敲碎了。 2026年2月20日,美国最高法...
警惕肝吸虫“入侵”警报 在我们身体的深处,有一个默默无闻却至关重要的器官——肝脏,它不仅是我们体内最大的实质性器官,更是承担...
港股智谱与MiniMax大涨能... 一、当日行情分析 1、市场观察——先别太乐观! 春节假期前后(2月16日-2月20日),海外股指多数...
华勤技术转型路 全球最大消费电... 观点网 服务三星、小米等巨头的一家ODM巨头即将赴港上市。 近期路透旗下IFR引述知情人士称,华勤技...
原创 金... 今天早上,很多人的朋友圈被一条消息刷屏了:周大福、老凤祥这些大金店的足金首饰,挂牌价直接标到了每克1...
美联储“大鸽派”沃勒感叹:美国... 财联社2月24日讯(编辑 史正丞)当地时间周一,美联储理事克里斯托弗·沃勒州长在第42届全国商业经济...
警惕!《家有好医生》式骗局:守... 近期,《家有好医生》陈涛“神药”骗局被层层揭开,无数中老年消费者的遭遇令人痛心:预付定金后退款无门,...
中国建设银行2026年度春季招... ★ 梁老师 生涯规划专家 2026年度银行春季招聘已全面启动,各大商业银行及政策性银行纷纷发布招聘公...
原创 1... 别看特朗普在国际舞台上喊得震天响,一会儿要派三角洲部队去抓马杜罗,一会儿逼着泽连斯基点头停火,转头又...
荷兰国际集团报告:美元避险属性... 来源:环球市场播报 荷兰国际集团(ING)周一在一份报告中指出,自2024年以来,美元的避险属性有...
“一句话下单”2亿次: “千问... 2月23日大年初七,千问发布数据显示,春节期间,用户在千问上“一句话下单”近2亿次,全国平均每10人...
当算法开始预测人生,我们失去了... (麻省理工科技评论) 人类的本质,从根本上说,是一种预测者。 无论是借助过往经验,还是依赖因果逻辑,...
年轻人为何选择养老院?90后院... 卷首语 “爱在守护” 栏目由中南大学湘雅护理学院社区护理学系党支部携手新湖南湘健频道共同策划,邀请了...
国开行2025年发放公路基础设... 记者从国家开发银行获悉,2025年,国开行发放公路基础设施贷款超3600亿元,同比增长10%。“十四...
“马”上来沪 |春节假期上海线... 东方网记者程琦2月23日报道:春节期间,上海持续举办“跨年迎新消费季”活动,商圈寻马、新春美食等六大...
利好来了!000988,订单排... 【导读】华工科技AI高速光模块订单排到四季度 中国基金报记者 张舟整理报道 华工科技的AI高速光模块...
【锋行链盟】科创板IPO控股股... 在科创板IPO过程中,控股股东作为企业的核心治理主体,其行为合规性、股权稳定性及对发行人的影响是监管...
马年A股如何开局? | 每周研... 春节长假期间,海外市场整体呈现小幅反弹态势。美股止跌回升,大宗商品表现强势,地缘政治扰动再起,推动原...
黄金RWA赛道群雄逐鹿,维塔金... 当各大巨头纷纷入局黄金代币化,市场竞争日趋激烈。维塔金凭借其在资产端、资本端和合规端的“三板斧”,构...