丁道师数字人第一版,大家说这个数字人像我吗?
创始人
2024-10-26 16:05:23
0

1

我把一段数字人制作的视频,发给了几百位见过我的朋友,大部分朋友表示无法分辨是真人还是由数字人技术合成。

由此引发了一个问题:现在的人工智能数字人技术到底发展到了哪一步?

这个问题背后还潜藏着一个更为实际的考量——数字人技术是否能够让普通大众也消费得起?因为,能以假乱真的所谓数字人技术并非近年才出现的新鲜事物。早在十年前,好莱坞的诸多大片,如《钢铁侠》《王牌特工》等,就已经广泛运用了这种技术。然而,当时要实现这样的效果,往往需要投入巨额的资金,需要后期团队精心制作,成本可能高达数万甚至数十万美元。

但时至今日,应用了AI大模型技术后,这种产品的门槛已经大幅降低。像我这样的普通个体也能轻松负担,这才是真正令人瞩目的变化,它可能预示着我们将开启一个全新的历史篇章。

 2

那么,大家可能会好奇,打造一个如此逼真的数字人究竟需要多少成本?

那天,我去大望路那边的今时兄弟公司,这家公司负责人帮我完成了这个数字人的制作,我起名为“丁道师数字人第一版”。他还给我生成几个视频demo,让我审核是否过关。

我直接把demo发到了视频号,就是文章开头的视频,没想到骗过了大多数人。

从这家公司离开前,我才知道制作这种级别的数字人,真的已经到白菜价了。不需要9999元,也不需要3999元,只需要几百元。

是的,仅需几百块钱,这一前沿科技就能为普通大众所享用。

这个价格以及它能获取到的产品表现力,惊到了我。我想,在这个科技飞速发展的时代,曾经遥不可及的高科技产品正在逐渐走进千家万户,成为普通人也能轻松享受的日常,这不仅仅是一个技术的突破,更是一个时代的进步。

一个让每个人都有机会拥抱科技、展现自我的全新时代,想想都让人激动。

3

还没有从科技平权的震撼中缓过劲来,这两天科大讯飞又放大招,让业界再一次震撼。

2024年10月24日,是一个特殊的节日,科大讯飞首次发布了超拟人数字人技术。只需上传一张照片,便能迅速生成一个生动的数字人形象,而且非常逼真,能够根据语义进行表情和动作的同步。

我在屏幕前看到讯飞的现场演示,倒抽一口冷气:现在的技术,已经强大到这种地步了?

当天,也有好几位朋友把讯飞的这段演示发给我,表达了类似的震惊之感。

我反复看了现场演示视频,讯飞的超拟人数字人与传统数字人相比,有两个最显著的特征。

第一:门槛大幅度降低,有一张图片就可以生成。

俗话说巧妇难为无米之炊,传统数字人往往基于拍摄的视频资源进行训练&生成,我前几天制作的“丁道师数字人第一版”也是基于我的真人影像。

讯飞的创新在于,仅需一张照片就可以生产数字人,其超拟人数字人就可以与用户进行面对面的实时对话,口唇、表情、动作均由大模型自动生成,并能够充分匹配文本的意图。

第二:更拟人、更自然。

其实,让一张图片动起来,早在10年前的GIF时代就可以实现了,只不过当年的这种“图片转视频”的技术,一看就很假,只能娱乐之用。

讯飞的不同之处在于,依托于多模扩散生成大模型,不需要先验信息,不再受限于预先录制的模板动作。通过深入解析语音中的情感以及文本中的语义信息,数字人的动作能够自然匹配仪态,展现出更加协调自然的动作,从而大幅提升了与人对话时的交互体验。也就是,这项服务未来随着算法、技术的迭代,完全可以做到以假乱真。

4

特别值得一提的是,科大讯飞这个产品的出现,意味着我们不仅仅解决了廉价数字人“从无到有”的刚需,还有望解决“从有到好”的难题。

PS:当然,咱们这里的假设前提是科大讯飞的演示视频没有进行人为美化,是100%真实演示。

“从有到好”的意思是说,以前视频生成模型的效率很低,生成时需要一定的等待时间,也就意味着数字人和观众无法实现实时互动。讯飞这次为了攻克高计算成本与交互时延的瓶颈,采用了中间表征压缩技术,大大降低了延时,实现了实时互动、一问一答的流畅体验。

这种互动能力的提升,将来如果用于直播带货领域,价值可就太大了。举个例子,辛巴和李佳琦这个级别的主播,一个小时的带货金额在千万以上,每天带货几个小时就得休息。如果应用了这种数字人技术,理论上可以实现7*24小时不间断直播,带货金额将会提升到哪一步?这将给我们的经济增长带来多大贡献?让人无限期待。

稍微遗憾的是,在当天的活动上,科大讯飞没有公布这个数字人的价格。不过,按照科大讯飞过往的定价策略来看,这种服务有可能是按照订阅付费的模式收费,最终价格也会是一个白菜价。

5

未来,随着技术的发展和迭代,AI数字人技术已经不是说像不像人的问题了,而是在很多个方面已经超越人了。

那么,数字人带给我们的到底是什么?硅基介质承载的数字人和碳基物理人该如何相处?

到底什么是真实?什么是存在?在这个数字与现实交织的时代,我们还能不能像以前那样,清晰地分辨出真实与虚拟的界限?数字人的加速普及,不仅让我们看到了技术的力量,更让我们开始反思,人类之所以为人类的本质到底是什么?

同时,随着数字人技术的不断发展,我们也不得不重新审视自己的价值和追求。在这个技术日新月异的时代,我们该如何定位自己?如何在保持人性独特的同时,与技术和谐共生?我们如何在享受技术带来的便利时,不失去对自由与尊严的坚守?

当然,不管从哪个方面看,每一次技术的跃进,都伴随着伦理的考量和抉择,汽车发明时也引发马车夫是否失业的讨论呢。数字人技术的崛起,既是技术的胜利,也是对人类智慧的挑战。我们该如何确保技术的发展不会成为束缚我们的枷锁,而是成为推动人类进步的强大力量?这需要我们不断地思考、探索和实践。

相关内容

热门资讯

云南锗业大宗交易折价成交12.... 云南锗业04月03日大宗交易平台共发生1笔成交,合计成交量12.00万股,成交金额540.00万元。...
贾国龙新品牌“天边砂锅焖面”连... 近日,贾国龙的新创业项目“天边砂锅焖面”受到关注,全国首店在北京798艺术区开业,人均消费40元至5...
买黄金的主力央行,开始卖黄金了... 经济观察网4月6日报道,美以伊战争爆发后,黄金价格震荡下行,令华尔街对冲基金经理张刚感到困惑。3月,...
原创 快... 2026年2月这个月,离岸人民币兑美元直接杀破了6.84,创下近三年新高。我们回头想想,2025年初...
油价走低!美伊将停火,霍尔木兹... 4月6日,国际油价持续走低。截至发稿,WTI原油跌幅为1.9%,此前一度涨超3%。 消息面上,美伊...
地缘冲突反复拉锯,市场在等待什... 清明假期期间,中东地区冲突相关消息密集发酵。地缘局势频繁反复下,“买预期、卖现实”的“TACO交易”...
养肝不用费力气,学会这几个简单... 提起养肝,很多人下意识觉得要花时间、费精力,要么刻意进补,要么制定复杂的养护计划,最后往往难以坚持。...
海峡危机再度拉响!黄金基础学习... 1. 拒绝消息面反射:带你开启黄金基础学习第一课 4月初特朗普再向伊朗放狠话,要求打开霍尔木兹海峡...
上市银行年报季为何风波频现? 制图:李芷琪(豆包AI生成) 银行年报季进入“中场休息”时间。从3月21日平安银行和中信银行首批公...
原创 连... 编辑:财叨叨/ 说话有温度,观点有态度 一家芯片公司,连续3年亏到没眼看,股价却翻了10倍,市值直...
超百家机构扎堆调研5只脑机接口... 来源:e公司 在多重因素叠加推动下,脑机接口技术有望进入大规模商业化落地“黄金窗口期”,2026年成...
原创 西... 2025年上半年,美元指数对一篮子主要货币暴跌了大约11%。这是自1973年以来最惨烈的半年跌幅。华...
从“手打”到“1桶半”,“心机... 近日,今麦郎手打挂面因“手打”二字为注册商标,引发公众关注。有媒体发现,今麦郎网店中已无带有“手打”...
科创可转债的推出如何影响可转债... 今天分享的是:科创可转债的推出如何影响可转债市场 报告共计:11页 2025年10月上交所受理首批科...
马斯克最新对话:AI 毁灭人类... 在此前结束的 2026 Abundance Summit 上,X奖基金会创始人彼得·戴曼迪斯(Pet...
原创 放... 4月5号,一则关于泰国总理的座驾从百万英镑的劳斯莱斯,换成了一辆售价约20万人民币的中国电动车的新闻...
泡泡玛特遇冷、铜师傅破发,TO... 来源:界面新闻 文 | 娱乐资本论 Jolene 去年9月,名创优品宣布将旗下潮玩品牌TOP ...
做跨境电商在广州,供应商不给票... 跨境电商税务合规指南:广州供应商无票困局破解与代账机构优选策略 一、政策背景与核心问题解析 1...
原创 最... 一直以来,储蓄国债是国内居民最喜欢的投资品种,它不仅是安全性高,而且利率也要比定期存款高。最近,财政...
当商标玩起“文字游戏”,消费者... 近日,有消费者反映今麦郎品牌一款“手打挂面”产品,吃的时候并没有手工面的口感。对此商家回应称:“手打...