小冰CEO李笛:数字人的未来是混合模型
猎云网
2023-07-05 14:52:25
0

原标题:小冰CEO李笛:数字人的未来是混合模型

来源:猎云精选,文/盛佳莹

今年以来,大模型掀起热潮,沉寂许久的人工智能再一次令所有人兴奋起来。尤其是ChatGPT的出圈,为人工智能这把火添了新柴。

《人类简史》中提到,智人之所以能够成为这个星球唯一霸主,一个重要的原因是他们发展出了“虚拟”的语言。

数字人要想逼真,在语言能力上势必要下功夫,而ChatGPT的语义理解能力相比过往的人工智能有着显著的提升,不少人认为有大模型驱动,数字人将有变革性的发展。

而就在大模型浩浩荡荡而来,所有人都在加速狂奔时,小冰CEO李笛早在几个月前提出了自己的判断,在他看来,大模型只是揭示了一场变革的开始,但它远远不是变革本身。

掌舵小冰公司,相比于追求技术的酷,李笛更关注技术的实用性和稳健性。

“大模型是驱动数字人的其中一个技术来源”

不可否认,大模型固然是好。

“在数字人领域,大模型确实可以解决过去一些没有解决的问题。”李笛告诉猎云网,一方面,大模型涌现的能力之一是思维链,在一定程度上,比过去的知识图谱做得更好,“过去,大多通过脚本让人工智能一个步骤一个步骤地去完成一件事情,但到了大模型,它自己一定程度上有逻辑思维能力,会思考自己下一步应该做什么,这有机会让数字人去控制更多的线上线下的场合。”

另一方面,大模型在回答问题方面,比过去的检索模型、生成模型在质量上有巨大的提升,但尽管如此,大模型依然没有突破到意识层面。

对于数字人而言,其交互场景往往多样复杂,无法判断用户具体交互何种内容,这要求数字人需要拥有一定的通用泛化能力,而此前行业内使用的检索模型,往往无法覆盖长尾问题。

除此之外,李笛提到在与数字人交互时,用户对内容的需求偏向也不同,“有时候用户可能只是想和数字人聊天,寻求陪伴,这个时候更偏向于数字人输出有趣的内容,而有时候用户和数字人交互是纯知识交流,这个时候需要数字人提供有用的内容。”

李笛坦言,过去“有趣”和“有用”往往无法两全其美,只能偏重其中一方,但大模型的出现有机会让两者并重。

“大模型可以大量压缩信息,在预训练过程中,远大于其他检索模型所能压缩的知识,可以做很好的预测。”

或许因为大模型的“大力出奇迹”,让不少人对大模型产生了极大的期待,认为其将变革数字人行业。

但在李笛看来,这并不代表一个大模型可以驱动数字人的一切,他对大模型在数字人领域的应用视为是驱动数字人的其中一个技术来源。

“大模型技术很酷,但并不稳”

事实上,李笛比国内平均早一年接触到ChatGPT,在国内数字人厂商狂热追逐大模型之时,李笛已经看到了大模型的问题所在。

李笛谈到:“大模型的本质仍是回答问题,但是人与人之间是互相激发,也并不一定要回答问题,要想让数字人像人,一定不能只是一个答疑者。”

此外,李笛还谈到,人在交互过程中是多模态交互。“虽然大模型也向多模态方向发展,但是这种多模态和数字人的多模态存在差别。大模型的多模态往往是同时处理多种模态,并把多种模态视为一个模态。而数字人的多模态是指,表情、声音、动作、语义彼此之间达成高度协调统一。”

大模型的交互速度也是数字人厂商不可忽视的维度。

在不同场景下,人对交互速度有着不同的标准,而数字人不论是直播还是对话,都偏向交流性场景,在数字人行业里有一句话,数字人的一大美德是“秒回”。

但目前大模型的交互速度仍需要几秒钟,还不能达到“秒回”的美德。如果通过堆分布式服务器提升交互速度,其成本又将进一步提高。

抛开大模型在数字人场景下的局限性不谈,就大模型技术本身而言,李笛认为大模型像学日语,“入门简单,但越往后越难。”

“大模型拉低了准入门槛,只要参数规模提高,效果会很明显,但是这个效果是粗暴的,很难有潜能。”原因在于目前,大模型涌现能力机制尚不明朗,难以预判训练效果,也难以做调优工作。

在李笛看来,至少到明年一季度之前,大模型技术仍处在新技术剧烈震荡阶段,在探明技术机制之前,李笛不敢贸然应用在产品上。

对此,李笛用了一个任天堂的类比,“作为游戏机主机商,索尼和微软追求机能,往往应用最先进的机能,而任天堂则选择榨干成熟技术,在其他公司将画质推进到4K时,任天堂在1080P、720P这些成熟的分辨率上思考如何把已有硬件性能推进到极致。”

在“酷”和“稳健”的选择中,李笛选择了“任天堂”式的稳健。

在别人追求庞大参数规模的大模型,展现出何种力量时,李笛更关心,在大量的并发使用过程中,大模型技术能稳定在什么状态,以及他需要尽可能地了解和可控这个新技术。

“数字人的未来是混合模型”

李笛坦言,当下大参数模型确实通用能力更强,但一味追求大参数模型,没有未来,尤其是参数规模越大,同质化越严重。

去年年底,李笛就提出了小冰认为的未来是混合模型的观点。但彼时,一味追求大模型的声音仍然居多,到现在,混合模型逐渐被更多人认可。

OpenAI 原董事霍夫曼也认为“其实GPT 1/ 20 规模的参数模型效果反而是最好的。”

事实上,从2019年开始,小冰就已经在做不同规模的模型训练和调优,有的模型只负责思考,有的模型只负责生成。目前,小冰框架内有近1000个大中小模型有机组合在一起共同支撑数字人运转。

相比于用一个大模型驱动数字人而言,混合模型在成本上有着极大的优势。而成本是商业化落地重要的考量。

“首先,模型参数规模降低,其基本运算也随之降低,其次,小冰在技术上做了调优,将其成本降低至一轮交互0.5厘,接近检索模型0.3厘的成本,而大模型一轮交互至少需要几毛钱。”

此外,混合模型可以运行于最廉价的T4 GPU,而无需A100等高端芯片,甚至神经网络渲染部分,可以不用运行于GPU,而是运行于CPU,“这个对应到的成本差距,大概从每分钟几块钱,或者说每小时几十块钱,到每天几毛钱的区别,可以说成本几乎为0。”

与此同时,李笛告诉猎云网,混合模型在交互速度可以做到几十到几百毫秒,远快于目前大模型几秒钟的交互速度。

更为重要的是,混合模型在经过小冰团队长期验证后,已确保技术安全边界已知。5月小冰公司发布的"GPT克隆人计划"运用的就是这套混合模型方案。

但不可否认的是,以大模型为标志,世界开始进入到更快的技术迭代周期,正如李笛所说:“大模型揭示了一场新的变革。”

相关内容

热门资讯

TrendForce集邦咨询:... 智通财经APP获悉,根据TrendForce集邦咨询最新发布的存储现货价格趋势报告,DRAM方面,D...
财经聚焦|跨年消费,场景焕新,...   新年将至,跨年消费热度持续攀升。邮轮港畔的跨年烟花秀、科技感十足的冰雪秘境、暖意融融的竹海温泉之...
有消息称月之暗面将“借壳上市”... 来源:市场资讯 (来源:虎嗅APP) 出品|虎嗅科技组 作者|宋思杭 编辑|苗正卿 头图|视觉中国...
恒丰银行被罚180万元 【大河财立方消息】12月31日消息,泉州金融监管分局行政处罚信息公示表显示,恒丰银行股份有限公司泉州...
“毙”了177个!一批CRO在... 寒冬骤临,浪潮退去。曾经站在仿制药一致性评价与MAH制度风口上的“卖水人”,正面临一场前所未有的生存...
董明珠:你一年电费5000元 ... 快科技12月31日消息,近日空调行业“铝代铜”话题非常的热,而董明珠更是旗帜鲜明的表示,格力坚决不用...
雷军:实在抱歉,感冒有点严重,... 12月31日,小米创办人、董事长兼CEO雷军发文: 实在抱歉,我感冒有点严重,原定跨年的直播只能推迟...
港股评级汇总:中信证券维持中芯... 财联社12月31日讯(编辑 冯轶)以下为各家机构对港股的最新评级和目标价: 中信证券:维持中芯国际买...
元旦节预测票房2.33亿 据猫眼专业版预测票房数据显示,2026年1月1日元旦节预测票房已出,预测元旦节票房2.33亿,《疯狂...
数据与智能共舞:中国能源变革的... 当台风“竹节草”裹挟狂风暴雨侵袭浙江沿海时,国网嘉兴供电公司的调控员在人工智能虚拟总指揮长“启航”的...
中国人民银行发布《非银行支付机... 本文转自【新华社】; 中国人民银行12月31日对外发布《非银行支付机构分类评级管理办法》,进一步加强...
凭认知壁垒应对行业周期波动 中... 来源:新尧网综合 在中国资产管理行业迈向精细化、专业化发展的进程中,深度专注于某一核心赛道或投资哲学...
派瑞股份天眼风险信息187条,... 雷达财经雷助吧出品 文|林宜采 编|深海 12月31日,雷达财经通过查询天眼查发现派瑞股份有天眼风险...
原创 黄... 西方电力捉襟见肘 现在人工智能发展得飞快,可这也带来大麻烦,尤其是电力供应跟不上。英伟达的黄仁勋今...
巴奴创始人杜中兵一边分红给自己... 来源:运营商财经网 运营商财经网 周颖/文 近日,巴奴二次向港交所提交了招股说明书,再度发起上市冲击...
宇树科技全球首店落地京东MAL... 近日,京东与全球领先的消费级机器人品牌宇树科技达成合作,宇树科技全球首店落地京东MALL北京双井店,...
以媒:英伟达拟最高斥资30亿美... (央视财经《天下财经》)据以色列媒体30日报道,美国芯片巨头英伟达正就收购以色列AI初创公司AI21...
开会时、地铁上,任大为医生:突... 近日,中国民族卫生协会北京融科医院任大为副主任医师的荧幕身影,为大众健康科普注入一股专业暖流。她受邀...
英矽智能港交所挂牌上市,AI制... 作为全球生物医药创新最活跃的核心区域之一,浦东张江科学城正加速汇聚具有全球影响力的创新药企与AI技术...
两天两家企业上市,宝安境内外上... 深圳商报·读创客户端记者 李丹 资本市场年末收官战,宝安上演“加速度”。 继12月30日卧安机器人登...