本文整理自“AI同行 创享未来”——虎博证券行业思享会嘉宾分享:《证券行业数据中台建设实践》。
嘉宾介绍
王施,海通证券资讯中心项目负责人。
主要内容
如何利用数据中台建立坚实的竞争壁垒,如何解决资讯数据规范不统一、数据共享能力差、数据调用关系错综复杂、数据质量无法保证等问题?王施从数据中台建设、数据价值挖掘、数据服务升级等方面,带来了他的观点。
01 海通证券数字化转型三大动能
云化、中台化、智能化
在混合金融云的支持下,海通证券以大数据战略为核心,打造数据中台和业务中台,同时打造海通证券的智慧大脑,让AI融入到我们每一个实际的业务场景当中,为业务全面的赋能。
在大中台和小前台的架构支撑下,我们前面的系统可以快速开展个性化的业务,同时向外部应用设备,通过智能的渠道互联快速的接入。
中台化的三个核心问题,我们归纳为能力复用、敏捷响应、自主可控,系统的监测当中通常会有以下4个阶段:
阶段1:离散化——系统独立建设,独立运营
阶段2:集中化——数据、基础资源集中管理
阶段3:平台化——共性能力拆分建模,共性服务改造建设
阶段4:中台化——构建企业级能力复用的各领域中台
02 数据中台建设的基本原则
客户为中心,以数据为基础
1、数据资产化——资源整合,全链路业务数据实现汇聚打通
2、数据标准化——数据清晰加工,统一标准
3、数据服务化——统一接口规范的数据服务,总线和多种服务方式
4、数据可视化——各类业务、非业务数据可视化,并形成联动,降低对人的依赖
5、数据业务化——通过数据中台的分析挖掘能力,实现数据价值的最大化
03 数据中台应用以投研为例资讯类的数据包括股票、债券基金,期货、现货、理财、指数等各类数据,由于海通证券采购的是来自各个供应商的数据,所以所有数据会通过数据的计算模块,深入到海通证券的内部,通过一套数据清洗、转化模块,对数据进行抽取、格式转换、内容转换和远程计算。
同时,利用分布式调度模块,会采用定时、固定时点的调度策略,对任务进行调度。
此外,利用数据校验模块提供各个维度的数据校验方式,保证数据的准确性和一致性。
我们建立了海通证券的资讯技术标准和数据模型,数据按照统一的标准进入中心库存储。我们也建立了一套数据监控的平台,能监控整个数据全生命周期的扭转情况,同时对数据制定统一备份的策略。
04 海通证券“一站式”智能标签服务平台
海通证券与虎博科技共同合作了智能标签服务平台,实现了不同来源资讯的智能化聚合,大幅提升了资讯管理的智能化程度,实现“一站式”管理。
在平台诞生之前,需要通过技术人员手工更新数据库里面的数据,一方面存在信息安全风险,另一方面没有可视化的界面,使用体验较差。
虎博科技主要从四个部分入手,为海通证券打造了这个平台:
1、标签体系服务——涵盖股票、债券、基金、行业、概念、板块、理财、大宗商品等维度。
2、通用NLP服务模块——包括主题识别、情感分析、句法分析等,可以通过通用的服务对外输出。
3、非结构化解析模块——能够进行非结构化文档解析,图片、表格的自动抽取,并进行存储。
4、资讯NLP管理模块——提供了资讯管权管理、算法人工干预、资讯在线编辑、内容审核在线发布等功能,业务员可以在线对资讯进行操作和管理。
05 资讯标签体系建设
重在深层次价值挖掘
资讯标签是基于原始资讯数据更深层次的价值挖掘工作,标准体系分为三个部分:
1、主体标签体系,包括公司实体、股票、债券、基金、商品、创投项目等
2、认知标签体系,包括分类标签、指标标签等
3、事件标签体系,包括关键词、风险因子等
资讯包含的要素有标题、摘要、时间、来源和链接,这些信息通过进一步挖掘可以提炼出公司、人物、行业、产品这些维度的标签,公司、人物标签结合我们的企业图谱进行进一步的关联,行业、产品标签可以结合产业图谱进一步的穿透。基础的资讯经过分析的模型,可以对文章中提及的公司、人物打造对应的情感标签,在舆情预警等领域进行应用。
06 金融资讯数据服务未来重点发力方向
1、推进服务通用化,剥离通用数据服务,减少定制化开发的占比。
2、持续改善数据使用者体验,将数据治理贯穿数据使用的全流程,完善数据全生命周期监控和异常自动化处理。
3、进一步探索NLP技术在舆情风险传导、智能搜索、智能客服、数字化运营、智能推荐等场景的应用。
4、推进智能服务建设,结合用户需求,构建千人千面的服务模式。
下一篇:史光起:餐饮店如何运营私域流量?