10月27日,由中国科协主办的2025年世界科技与发展论坛在北京开幕。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜出席开幕式并做主题演讲,分享了深度学习技术如何赋能AI+产业数智化转型。吴甜表示,深度学习是人工智能关键核心技术,在过去一段时间驱动AI实现了飞跃式进步,为大模型的爆发提供了基础。深度学习平台一方面支持大模型的研发,另外一方面和大模型协同优化,支撑产业智能化转型。
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜
吴甜讲到,深度学习平台下接芯片,上承大模型和应用,AI的开发、训练、推理部署以及产业落地,都离不开深度学习平台的支撑。以百度飞桨为例,作为百度自研的产业级深度学习开源开放平台,飞桨从核心框架、基础模型库,到端到端开发套件、工具与组件,以及星河社区等,全方位支持了文心大模型的演进过程。目前,飞桨已适配 60多款系列芯片,创建超过110万个模型。
文心大模型的能力拓展和效率提升,得益于飞桨和文心的联合优化,包括框架模型的联合优化,也包括框架算力的联合优化。通过训练和推理的技术创新,ERNIE-4.5-300B-A47B模型上实现预训练MFU达47%, ERNIE-4.5-300B-A47B模型在TPOT 50ms时延条件下,实现了输入57K tokens/秒、输出29K tokens/秒的高吞吐性能。
公开资料显示,2018年底,百度就开展了大模型技术研发,2019年3月正式发布文心大模型1.0,今年4月发布了多模态大模型文心4.5 Turbo和深度思考模型文心X1 Turbo,9月X1 Turbo升级为文心X1.1。在中文多模态视觉语言模型测评基准SuperCLUE-VLM上,文心4.5 Turbo总分并列国内第一;在中文精确指令遵循测评基准SuperCLUE-CPIF,文心X1.1在任务类型、指令数量两类划分中均为国内第一。此外,文心4.5的衍生模型PaddleOCR-VL、文心开源思考模型ERNIE-4.5-21B-A3B-Thinking等模型也多次登上Hugging Face全球模型总趋势榜第一。
如何让大模型在产业应用中发挥更大的作用,让千行百业得到更大的受益,吴甜认为能够提供一系列丰富的产业级开发套件和工具的深度学习平台至关重要。百度基于文心与飞桨打造的人工智能基础技术底座,正在助力千行百业提效降本、增强企业经营、决策等能力。
例如,在智能制造领域,中车集团基于飞桨建立人工智能仿真平台,支撑高铁外形仿真设计周期由“天级”缩短至“秒级”;在智慧医疗领域,AI已经能在病情收集、病历整理、AI预审核和医生复核等环节发挥作用,优化患者就医体验、提升医生接诊效率;在智慧能源领域,基于文心和飞桨及百度系列技术平台打造的电网断面调控智能体“大瓦特 - 天璇 - 阿度”,在广西电网调度台上线后,实现对600+厂站、90+断面的监控,实现“故障告警-断面监视-风险预测-高效预控”全流程智能决策。
吴甜还现场分享了基于文心大模型的最佳实践——数字人。这套百度自研的多模协同的数字人技术包含剧本驱动的数字人多模协同、融合多模规划与深度思考的剧本生成、动态决策的实时交互、文本自控的语音合成、高一致性超拟真数字人长视频生成五项创新技术,实现了数字人“神、形、音、容、话”的高度统一。最终呈现出一个具备高表现力,内容吸引人,人-物-场可自由交互的超拟真数字人。
目前,百度数字人已在电商等多个领域展现出显著的商业价值。百度已经助力打造超过10万数字人主播,直播转化率提升31%,开播成本下降80%。公开资料显示,在百度慧播星的应用实践中,数字人直播的线上表现超过了真人。此前,罗永浩数字人直播首秀GMV突破行业新纪录,部分核心品类带货量超过真人直播。
吴甜最后表示,技术持续革新不断驱动应用创新,应用创新进而转化为实际商业价值,最终推动产业向更高级形态转型升级。目前飞桨文心开发者数量已超过2333万,服务超过76万家企业。