8月9日,CCF TF第69期活动“工业制造中的大数据分析和预测”吸引了近1300人在线观看并参与互动,探讨技术理论知识及实战经验。来自知名高校、大数据行业及电子高科技企业的资深专家围绕主题从不同层面分享了研究成果和行业最佳实践,同时与参会者进行热烈的学术交流。期待大家参与智能制造SIG今年接下来的两场活动,具体举办时间见文末。
智能制造时代的到来,也意味着工业大数据时代的到来。工业大数据是实现智能制造的核心动力,制造业向智能化转型的过程中,将催生工业大数据的广泛应用,工业大数据无疑将成为未来提升制造业生产力、竞争力、创新能力的关键要素,也是目前全球工业数字化转型必须面对的重要课题。在本次活动中,来自卡耐基梅隆大学语言技术研究所博士刘鹏飞、大数据行业北京海致星图科技有限公司资深专家孙刚及联宝科技体系管理与数字化转型部高级经理关杰通过报告分享了对工业大数据相关技术理论及应用的见解。来自高校、科研院所及各行各业的嘉宾在线参会并围绕主题展开了深入探讨。
CCF TF智能制造SIG主席袁康致辞
CCF TF智能制造SIG主席、联宝(合肥)电子科技有限公司研发中心总经理袁康首先作开场致辞。袁康在计算机系统结构、产品创新设计、智能制造中的数字孪生、工业大数据分析与应用、人工智能及视觉识别等领域都有着丰富的经验,简洁的开场介绍就将参会嘉宾带入了思考,当前社会已进入大数据时代,随着物联网、云计算、人工智能等新兴技术不断向工业领域渗透,以数字化驱动的工业大数据推进了制造业发展向智能化新模式的转变。如何运用人工智能技术改变工业大数据的存储、检索、标注方式?如何实现工业大数据多源数据融合及复杂数据关系的挖掘,建立数据之间的联系?如何把工业大数据贯穿于工业的设计、工艺、生产、管理、服务等各个环节,使工业系统具备描述、诊断、预测、决策、控制等智能化功能的模式和结果,提升业务的智能分析与决策能力?由此引出了嘉宾对工业大数据相关的深入分享。
《大规模预训练模型给工业制造大数据分析带来的影响》
刘鹏飞首先从概念、常见架构、应用实例几个方便面深入浅出的介绍了什么是预训练语言模型(PLM),然后从数据的存储、检索以及标注三个维度阐述了PLM如何改变人和数据的交互方式,最后结合工业大数据技术架构论述了PLM在工业制造中数据的采集、处理、建模及分析和决策等环节的机会点以及可能产生的潜在影响。比如,数据采集环节是PLM最可能的入场环节,它对于外部应用的平台数据可以进行快速的重要信息抽取,可实现不同模态不同结构数据的理解;对于知识类型的数据比如设计图纸、仿真结果等用PLM可以很好的实现结构化;此外,PLM还可以对用户的时序数据进行建模并预测下一步需求。数据建模环节,PLM同样适配于工业制造过程可用序列建模的场景,实现未来发生事件的预测。数据分析方面PLM可以帮助快速了解技术发展趋势,加速技术创新,优化生产过程,提高服务响应速度等。期待未来PLM在工业制造领域有更多的发挥空间,产生更多精彩应用。
刘鹏飞分享内容
《认知智能与图分析技术在企业级大数据领域的应用》
孙刚详细阐述了认知智能与图分析的相关技术。NLP和知识图谱是认知智能的重要组成部分,认知智能的实现很大程度上取决于知识图谱的赋能,知识图谱以结构化的方式描述客观世界中实体、概念、事件以及之间的关系,它提供了从关系的角度去分析问题和发现问题的能力。图分析使用基于图的方法来分析连接数据,它由图数据库提供支持,图数据库用点和边的集合存储实体和关系信息,基于点边进行遍历和计算进行查询,可以实现深层的关联搜索甚至知识推理,图分析的主要应用领域包含路径、社群、中心性、相似性、预测、连通性六个方面。接下来,孙刚通过一个工业制造中的智能检修及故障分析场景介绍了知识图谱的应用和图分析的实现过程并简单总结了知识图谱的实施路径:图构建,数据接入,图计算,图分析,图发布。案例通过图谱的形式去构建故障维修知识库,然后基于此去做智能检修知识的推荐或者智能检修方案推荐,结合故障维修知识图谱和故障树进行智能检修知识分析。
孙刚分享内容
《基于大规模连续型贴片生产的数字化统计过程控制(Digital SPC)实践》
关杰从探索产品生产制造过程中质量数字化最佳实践的角度讲述了如何将精益质量管理方法论和数字化相结合,实现前置化的精益质量管理模式,并分享了SMT的工艺流程以及在连续型贴片生产过程中如何引入数字化思维,借助数字化技术透视现场大数据,实现精准的质量控制和预防的数字化SPC系统方案的实际案例,从而使得SMT过程质量管理由传统的日班式的直通率指标管理过渡到小时频度的批量问题管理,分钟频度的不良次数管理以及实时变异管理,实现质量的闭环管理,具备防患未来的制程质量管理能力。最后,关杰指出联宝科技的下一步智能化探索方向,一是设备端实现基于大数据驱动的SMT设备关键质量参数自控制,二是工程师端实现基于知识图谱的设备异常或故障的智能故障处理方案推荐。
关杰分享内容
在提问互动环节,线上嘉宾积极参与,提出了很多实际且深刻的问题,例如:工业场景存在大量多源异构的数据,这些多模态数据是不是可以使用多模态大规模预训练模型实现数据语义层面的打通和使用?如何将来自不同数据源的相同实体聚类?工业制造中涉及的大量设备数据、过程数据和质量数据有哪些大数据分析手段?......
讲者回答参会者提问
三位嘉宾在回答提问时表达了更多观点。刘鹏飞分享了不同模态打通的当前的行业研究进展,把不同模态比如文本、语音、图片等统一到一个预训练空间是当前各大科技公司的研究热点,目前已取得一些进展,未来也会产生更多创新性的应用前景。孙刚指出多模态实体之间不可避免地存在着异构性,如何消除多模态数据之间的异构性是知识图谱构建过程一项关键挑战,在工业领域一般会利用知识图谱的一些分支技术去做实体对齐,保证构建知识图谱的质量。关杰分享了实践中的实际感受:要把物联网、云计算、人工智能等新兴技术与大数据相关技术相融合,比如利用图谱技术,对工业知识进行解构,构建领域知识图谱,结合各类生产数据,就可以实现多种工业领域的智能化场景应用。
本期活动内容丰富,2个小时的线上分享,从理论到实践再到实际工程应用,层层递进分享了专家眼中的工业制造领域相关的大数据技术及其应用和未来发展,线上交流气氛热烈。TF第69期活动《工业制造中的大数据分析和预测》圆满结束。本期精彩报告及回顾视频可在CCF数字图书馆观看,欢迎持续关注TF更多精彩活动!
更多互动内容及问题解答
智能制造SIG后续活动安排
TF812022.11.8工业制造中的数据治理TF922023.2.7工业机器人柔性控制