丁道师数字人第一版,大家说这个数字人像我吗?
创始人
2024-10-26 16:05:23
0

1

我把一段数字人制作的视频,发给了几百位见过我的朋友,大部分朋友表示无法分辨是真人还是由数字人技术合成。

由此引发了一个问题:现在的人工智能数字人技术到底发展到了哪一步?

这个问题背后还潜藏着一个更为实际的考量——数字人技术是否能够让普通大众也消费得起?因为,能以假乱真的所谓数字人技术并非近年才出现的新鲜事物。早在十年前,好莱坞的诸多大片,如《钢铁侠》《王牌特工》等,就已经广泛运用了这种技术。然而,当时要实现这样的效果,往往需要投入巨额的资金,需要后期团队精心制作,成本可能高达数万甚至数十万美元。

但时至今日,应用了AI大模型技术后,这种产品的门槛已经大幅降低。像我这样的普通个体也能轻松负担,这才是真正令人瞩目的变化,它可能预示着我们将开启一个全新的历史篇章。

 2

那么,大家可能会好奇,打造一个如此逼真的数字人究竟需要多少成本?

那天,我去大望路那边的今时兄弟公司,这家公司负责人帮我完成了这个数字人的制作,我起名为“丁道师数字人第一版”。他还给我生成几个视频demo,让我审核是否过关。

我直接把demo发到了视频号,就是文章开头的视频,没想到骗过了大多数人。

从这家公司离开前,我才知道制作这种级别的数字人,真的已经到白菜价了。不需要9999元,也不需要3999元,只需要几百元。

是的,仅需几百块钱,这一前沿科技就能为普通大众所享用。

这个价格以及它能获取到的产品表现力,惊到了我。我想,在这个科技飞速发展的时代,曾经遥不可及的高科技产品正在逐渐走进千家万户,成为普通人也能轻松享受的日常,这不仅仅是一个技术的突破,更是一个时代的进步。

一个让每个人都有机会拥抱科技、展现自我的全新时代,想想都让人激动。

3

还没有从科技平权的震撼中缓过劲来,这两天科大讯飞又放大招,让业界再一次震撼。

2024年10月24日,是一个特殊的节日,科大讯飞首次发布了超拟人数字人技术。只需上传一张照片,便能迅速生成一个生动的数字人形象,而且非常逼真,能够根据语义进行表情和动作的同步。

我在屏幕前看到讯飞的现场演示,倒抽一口冷气:现在的技术,已经强大到这种地步了?

当天,也有好几位朋友把讯飞的这段演示发给我,表达了类似的震惊之感。

我反复看了现场演示视频,讯飞的超拟人数字人与传统数字人相比,有两个最显著的特征。

第一:门槛大幅度降低,有一张图片就可以生成。

俗话说巧妇难为无米之炊,传统数字人往往基于拍摄的视频资源进行训练&生成,我前几天制作的“丁道师数字人第一版”也是基于我的真人影像。

讯飞的创新在于,仅需一张照片就可以生产数字人,其超拟人数字人就可以与用户进行面对面的实时对话,口唇、表情、动作均由大模型自动生成,并能够充分匹配文本的意图。

第二:更拟人、更自然。

其实,让一张图片动起来,早在10年前的GIF时代就可以实现了,只不过当年的这种“图片转视频”的技术,一看就很假,只能娱乐之用。

讯飞的不同之处在于,依托于多模扩散生成大模型,不需要先验信息,不再受限于预先录制的模板动作。通过深入解析语音中的情感以及文本中的语义信息,数字人的动作能够自然匹配仪态,展现出更加协调自然的动作,从而大幅提升了与人对话时的交互体验。也就是,这项服务未来随着算法、技术的迭代,完全可以做到以假乱真。

4

特别值得一提的是,科大讯飞这个产品的出现,意味着我们不仅仅解决了廉价数字人“从无到有”的刚需,还有望解决“从有到好”的难题。

PS:当然,咱们这里的假设前提是科大讯飞的演示视频没有进行人为美化,是100%真实演示。

“从有到好”的意思是说,以前视频生成模型的效率很低,生成时需要一定的等待时间,也就意味着数字人和观众无法实现实时互动。讯飞这次为了攻克高计算成本与交互时延的瓶颈,采用了中间表征压缩技术,大大降低了延时,实现了实时互动、一问一答的流畅体验。

这种互动能力的提升,将来如果用于直播带货领域,价值可就太大了。举个例子,辛巴和李佳琦这个级别的主播,一个小时的带货金额在千万以上,每天带货几个小时就得休息。如果应用了这种数字人技术,理论上可以实现7*24小时不间断直播,带货金额将会提升到哪一步?这将给我们的经济增长带来多大贡献?让人无限期待。

稍微遗憾的是,在当天的活动上,科大讯飞没有公布这个数字人的价格。不过,按照科大讯飞过往的定价策略来看,这种服务有可能是按照订阅付费的模式收费,最终价格也会是一个白菜价。

5

未来,随着技术的发展和迭代,AI数字人技术已经不是说像不像人的问题了,而是在很多个方面已经超越人了。

那么,数字人带给我们的到底是什么?硅基介质承载的数字人和碳基物理人该如何相处?

到底什么是真实?什么是存在?在这个数字与现实交织的时代,我们还能不能像以前那样,清晰地分辨出真实与虚拟的界限?数字人的加速普及,不仅让我们看到了技术的力量,更让我们开始反思,人类之所以为人类的本质到底是什么?

同时,随着数字人技术的不断发展,我们也不得不重新审视自己的价值和追求。在这个技术日新月异的时代,我们该如何定位自己?如何在保持人性独特的同时,与技术和谐共生?我们如何在享受技术带来的便利时,不失去对自由与尊严的坚守?

当然,不管从哪个方面看,每一次技术的跃进,都伴随着伦理的考量和抉择,汽车发明时也引发马车夫是否失业的讨论呢。数字人技术的崛起,既是技术的胜利,也是对人类智慧的挑战。我们该如何确保技术的发展不会成为束缚我们的枷锁,而是成为推动人类进步的强大力量?这需要我们不断地思考、探索和实践。

相关内容

热门资讯

从“要素开放”到“场景开放”丨... 一场900多人的跨国商务年会,12国人员齐聚,从下飞机到入住酒店仅用了25分钟——在上海东方枢纽国际...
闪迪Q2净利润同比暴增673%... IT之家 1 月 30 日消息,当地时间 1 月 29 日,闪迪公司公布了 2026 财年第二季度(...
光大银行[601818]日常公... 本版导读 2026-01-30 2026-01-30 2026-01-30 2026...
铜博科技IPO:曾两次筹备创业... 瑞财经 王敏 1月28日,据港交所官网,江西铜博科技股份有限公司(以下简称“铜博科技”)正式向港交所...
报喜!002985,净利预增超... 今日看点 ▼聚焦一:北摩高科(002985):2025年净利润同比预增1076.16%—1261.8...
史上最大IPO来临:马斯克开始... 史上最大IPO来临,马斯克开始准备殖民火星了。 全球首富马斯克旗下的太空探索技术公司SpaceX正在...
兴业基金徐成城:布局恒生科技,... 来源:中国证券报-中证网 作为银行系公募基金的代表机构,近年来兴业基金在巩固固收投资优势的基础上,以...
搜狐医药 | 印度暴发尼帕疫情... 出品 | 搜狐健康 作者 | 吴施楠 编辑 | 袁月 据《环球时报》、《人民日报》等消息,近日...
原创 “... 斑马消费 徐霁 中国的咖啡用户,对主流咖啡品牌,都有着明确的认知:星巴克是品质的代表,第三空间的不二...
福州达华智能科技股份有限公司2... 本公司及董事会全体成员保证信息披露的内容真实、准确、完整,没有虚假记载、误导性陈述或重大遗漏。 一、...
马斯克或重组商业版图:Spac... 【CNMO科技消息】1月30日,彭博社、路透社等权威媒体披露,马斯克旗下SpaceX正在评估与特斯拉...
原创 持... 手里的股票,连续一两个月在窄幅区间震荡。 涨一点就跌回来,跌一点又拉上去,账户资金来回波动却没实质收...
美“超级航母”最大软肋竟是厕所... 曾在加勒比海参与了针对委内瑞拉总统马杜罗行动的美国海军“超级航母”杰拉尔德·R·福特号航空母舰,因为...
广东世荣兆业股份有限公司 20... 来源:证券日报 证券代码:002016 证券简称:世荣兆业 公告编号:2026-001 本公司及董...
合盛硅业:补充确认110亿元高... 合盛硅业公告称,公司及其子公司阿尔法半导体与杭州市萧山区人民政府及萧山经济技术开发区管理委员会共同推...
如何购买烟花爆竹?长治市市场监... 春节临近 烟花爆竹产品进入消费旺季 为保障广大人民群众生命财产安全 引导大家理性消费 度过一个平安、...
乳腺结节饮食避坑,这些食物少吃... 太原龙城中医医院科普:乳腺结节的形成与内分泌平衡密切相关,而饮食作为影响内分泌的重要因素,对结节的发...
资本市场迎来活跃周期:大金融总... 文|豹《投资者网》吕子禾 2025年,中国经济在结构转型中稳步前行,全年GDP同比增长5%,消费与...
国际金价为何持续上涨? 不到一个月时间,以人民币计价的黄金报价从每克975元附近迅速逼近每克1250元,主要金店的足金饰品报...
郑大一附院培训住培教学秘书 近日,郑州大学第一附属医院(以下简称郑大一附院)举办住院医师规范化培训(简称住培)教学秘书培训班,以...