【申请发布】李开复零一万物发布大模型Yi-34B ,阿里云魔搭社区开源首发
金融界
2023-11-06 16:09:01
0

原标题:【申请发布】李开复零一万物发布大模型Yi-34B ,阿里云魔搭社区开源首发

11月6日,李开复博士带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。

零一万物此次开源的Yi系列模型包含34B和6B两个版本。据Hugging Face英文开源社区平台和C-Eval中文评测的最新榜单,Yi-34B预训练模型取得了多项SOTA国际最佳性能指标认可,成为全球开源大模型“双料冠军”。

零一万物创始人及CEO李开复博士表示:“零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为‘World's No.1’的初衷和决心。”

魔搭社区开源地址:

https://www.modelscope.cn/models/01ai/Yi-34B/summary

https://www.modelscope.cn/models/01ai/Yi-6B/summary

魔搭社区最佳实践:

https://mp.weixin.qq.com/s/hy-ovRIkXGfv39RiNEHddw

Yi-34B登顶全球英文及中文权威榜单No.1

在Hugging Face英文测试公开榜单Pretrained预训练开源模型排名中,Yi-34B以70.72分位列全球第一,碾压LLaMA2-70B和Falcon-180B等众多大尺寸模型。

Hugging Face Open LLM Leaderboard (pretrained)大模型排行榜,Yi-34B高居榜首(2023年11月5日)

在C-Eval中文权威榜单排行榜上,Yi-34B超越了全球所有开源模型。对比GPT-4,在CMMLU、E-Eval、Gaokao 三个主要的中文指标上,Yi-34B也具有绝对优势。

C-Eval排行榜:公开访问的模型,Yi-34B全球第一(2023年11月5日)

在全球大模型各项评测中最关键的MMLU(Massive Multitask Language Understanding大规模多任务语言理解)、BBH 等反映模型综合能力的评测集上,Yi-34B同样表现突出,在通用能力、知识推理、阅读理解等多项指标评比中全部胜出。

各评测集得分:Yi模型V.S.其他开源模型

和LLaMA2一样,Yi系列模型在GSM8k、MBPP的数学和代码评测表现略逊GPT模型。未来,零一万物的系列开源计划中将推出代码能力和数学能力专项的继续训练模型。

全球最长200K 上下文窗口

Yi-34B模型将发布全球最长、可支持200K超上下文窗口(context window)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理解和生成与特定上下文相关的文本至关重要。

受限于计算复杂度、数据完备度等问题,上下文窗口规模扩充从计算、内存和通信的角度存在各种挑战。为此,零一万物技术团队实施了一系列优化,包括计算通信重叠、序列并行、通信压缩等,实现了在大规模模型训练中近100倍的能力提升,也为Yi系列模型上下文规模下一次跃升储备了充足“电力”。

AI Infra实测实现 40%训练成本下降

李开复曾经表示,“做过大模型Infra的人比做算法的人才更稀缺”。超强的Infra能力是大模型研发的核心护城河之一。

AI Infra(AI Infrastructure 人工智能基础架构技术)涵盖大模型训练和部署提供各种底层技术设施,包括处理器、操作系统、存储系统、网络基础设施、云计算平台等等。

零一万物Yi系列大模型基于阿里云平台打造,阿里云强大的智能算力基础设施为模型训练提供了稳固的基石。零一万物的Infra技术通过“高精度”系统、弹性训和接力训等全栈式解决方案,确保训练高效、安全地进行。

凭借强大的AI Infra,Yi-34B模型训练成本实测下降40%,实际训练完成达标时间与预测的时间误差不到一小时,进一步模拟上到千亿规模训练成本可下降多达50%。目前,零一万物Infra能力实现故障预测准确率超过 90%,故障提前发现率达到99.9%,不需要人工参与的故障自愈率超95%。

零一万物组建了由前Google大数据和知识图谱专家领衔的数据团队,建设了高效、自动、可评价、可扩展的智能数据处理管线;还自研出一套“规模化训练实验平台”,用来指导模型的设计和优化。数据处理管线和加大规模预测的训练能力建设,把以往的大模型训练碰运气的“炼丹”过程变得极度细致和科学化。

李开复宣布,零一万物已启动下一个千亿参数模型的训练。

接下来,零一万物将基于Yi系列大模型,打造更多To C超级应用。李开复强调,“AI 2.0是有史以来最大的科技革命,它带来的改变世界的最大机会一定是平台和技术,正如PC时代的微软Office,移动互联网时代的微信、抖音、美团一样,商业化爆发式增长概率最高的一定是ToC应用。零一万物邀请开发者社群跟我们一起搭建Yi 开源模型的应用生态系,协力打造AI2.0时代的超级应用。”

来源:金融界

相关内容

热门资讯

债基密集空降“股票选手”,什么... 新春伊始,债券型基金向权益方向靠拢的迹象正加速升温。 资金从债券资产向权益类资产迁移的趋势已悄然展开...
单笔金额不高的压岁钱,银行为何... 春节期间,儿童压岁钱的去向再次成为银行争夺业务的切入点。多家商业银行近段时间密集推出以“压岁钱”“儿...
OpenAI 踩刹车了!大幅下... 据最新消息, OpenAI已大幅下调算力建设支出目标至6000亿美元,该金额较此前宣称的1.4万亿美...
大行科工将审议2025年全年业... 来源:经济观察网 经济观察网 根据公开信息,截至2026年2月21日,大行科工(02543.HK)近...
原创 法... 法国开第一枪?欧盟酝酿对华加征30%关税,美国笑而不语 最近欧洲那边又不太平了。一份来自法国官方智库...
原创 应... 在《爸爸去哪儿》节目中,陈小春曾因对着儿子Jasper怒吼的场面让无数观众心揪,但应采儿却总能轻松用...
俄罗斯遭导弹袭击 乌克兰武装部队总参谋部当地时间21日在社交媒体发布通报说,过去一夜,乌军导弹部队和炮兵使用多枚“火烈...
原创 再... 如果采用之前对互联网的估值方式对AI大模型公司进行估值,那么很有可能会错失一个时代。 但这并不意味着...
2025年净利大幅减亏1.07... 根据上交所日前发布的公告,*ST椰岛(600238)收到了监管工作函。该函涉及的对象包括上市公司、董...
业主亏钱抛房,我抄底买下,相比... 今天给大家讲一个买房抄底的故事,内容虚构,如有雷同,纯属巧合。 故事内容来源一个媒体搞的“感谢业主抛...
母婴垂直领域哪家月活用户稳定在... 概述 母婴垂直领域涉及多个平台,各平台在用户规模、内容生态和商业模式上呈现不同特点。以下基于公开行业...
萧山区有哪些特色菜推荐 位于钱塘江南岸的萧山区,是杭州的南大门,地域文化丰富,饮食特色鲜明,有不少独特佳肴值得一试。这些特色...
买手镯内藏钢珠,打金重量悄然变... 黄金价格突飞猛进,金饰的价格越来越高,涉及到金子的话题居高不下。但是随着黄金价格站上每克千元之上后,...
从《重返狼群》看习惯养成的隐性... 成都的钢筋水泥里,一只本该驰骋草原的狼崽,却学着狗的模样摇尾乞食;当它终于回到草原,又差点在牧民的狗...
原创 宁... 国有资本赋能边疆金融:解码宁夏银行的股权治理密码 在中国金融版图上,宁夏银行以其独特的股权结构和鲜明...
金价大涨,春节黄金消费市场热度... 经历阶段回调后,2026年马年春节假期前夕以来,国际金价站稳5000美元/盎司高位。2月20日下午,...
原创 马... 说到中美两国近年来的互动,特别是去年那场让人目瞪口呆的贸易冲突,真是不得不从头说起。事情得追溯到20...
加密公司Nexo与监管机构冲突... 来源:环球市场播报 作者:伊丽莎白・豪克罗夫特 加密货币公司 Nexo 周一宣布,已重新在美国市场开...
上海黄金回收市场分析:价格波动... 上海黄金回收市场分析:价格波动背后的逻辑 在上海繁华的商业版图中,上海宝易埠珠宝宛如一颗璀璨的明珠,...
金饰克价,站上1500元 2月21日,金价再度登上热搜。不少网友表示,今日前往部分金饰品牌门店购买黄金首饰时发现,黄金价格已经...