数据中台建立券商数智化转型竞争壁垒
admin
2023-07-28 09:20:22
0

本文整理自“AI同行 创享未来”——虎博证券行业思享会嘉宾分享:《证券行业数据中台建设实践》

嘉宾介绍

王施海通证券资讯中心项目负责人

主要内容

如何利用数据中台建立坚实的竞争壁垒,如何解决资讯数据规范不统一、数据共享能力差、数据调用关系错综复杂、数据质量无法保证等问题?王施从数据中台建设、数据价值挖掘、数据服务升级等方面,带来了他的观点。

01 海通证券数字化转型三大动能

云化、中台化、智能化

在混合金融云的支持下,海通证券以大数据战略为核心,打造数据中台和业务中台,同时打造海通证券的智慧大脑,让AI融入到我们每一个实际的业务场景当中,为业务全面的赋能。

在大中台和小前台的架构支撑下,我们前面的系统可以快速开展个性化的业务,同时向外部应用设备,通过智能的渠道互联快速的接入。

中台化的三个核心问题,我们归纳为能力复用、敏捷响应、自主可控,系统的监测当中通常会有以下4个阶段:

阶段1:离散化——系统独立建设,独立运营

阶段2:集中化——数据、基础资源集中管理

阶段3:平台化——共性能力拆分建模,共性服务改造建设

阶段4:中台化——构建企业级能力复用的各领域中台

02 数据中台建设的基本原则

客户为中心,以数据为基础

1、数据资产化——资源整合,全链路业务数据实现汇聚打通

2、数据标准化——数据清晰加工,统一标准

3、数据服务化——统一接口规范的数据服务,总线和多种服务方式

4、数据可视化——各类业务、非业务数据可视化,并形成联动,降低对人的依赖

5、数据业务化——通过数据中台的分析挖掘能力,实现数据价值的最大化

03 数据中台应用以投研为例资讯类的数据包括股票、债券基金,期货、现货、理财、指数等各类数据,由于海通证券采购的是来自各个供应商的数据,所以所有数据会通过数据的计算模块,深入到海通证券的内部,通过一套数据清洗、转化模块,对数据进行抽取、格式转换、内容转换和远程计算。

同时,利用分布式调度模块,会采用定时、固定时点的调度策略,对任务进行调度。

此外,利用数据校验模块提供各个维度的数据校验方式,保证数据的准确性和一致性。

我们建立了海通证券的资讯技术标准和数据模型,数据按照统一的标准进入中心库存储。我们也建立了一套数据监控的平台,能监控整个数据全生命周期的扭转情况,同时对数据制定统一备份的策略。

04 海通证券“一站式”智能标签服务平台

海通证券与虎博科技共同合作了智能标签服务平台,实现了不同来源资讯的智能化聚合,大幅提升了资讯管理的智能化程度,实现“一站式”管理

在平台诞生之前,需要通过技术人员手工更新数据库里面的数据,一方面存在信息安全风险,另一方面没有可视化的界面,使用体验较差。

虎博科技主要从四个部分入手,为海通证券打造了这个平台:

1、标签体系服务——涵盖股票、债券、基金、行业、概念、板块、理财、大宗商品等维度。

2、通用NLP服务模块——包括主题识别、情感分析、句法分析等,可以通过通用的服务对外输出。

3、非结构化解析模块——能够进行非结构化文档解析,图片、表格的自动抽取,并进行存储。

4、资讯NLP管理模块——提供了资讯管权管理、算法人工干预、资讯在线编辑、内容审核在线发布等功能,业务员可以在线对资讯进行操作和管理。




05 资讯标签体系建设

重在深层次价值挖掘

资讯标签是基于原始资讯数据更深层次的价值挖掘工作,标准体系分为三个部分:

1、主体标签体系,包括公司实体、股票、债券、基金、商品、创投项目等

2、认知标签体系,包括分类标签、指标标签等

3、事件标签体系,包括关键词、风险因子等

资讯包含的要素有标题、摘要、时间、来源和链接,这些信息通过进一步挖掘可以提炼出公司、人物、行业、产品这些维度的标签,公司、人物标签结合我们的企业图谱进行进一步的关联,行业、产品标签可以结合产业图谱进一步的穿透。基础的资讯经过分析的模型,可以对文章中提及的公司、人物打造对应的情感标签,在舆情预警等领域进行应用。




06 金融资讯数据服务未来重点发力方向

1、推进服务通用化,剥离通用数据服务,减少定制化开发的占比。

2、持续改善数据使用者体验,将数据治理贯穿数据使用的全流程,完善数据全生命周期监控和异常自动化处理。

3、进一步探索NLP技术在舆情风险传导、智能搜索、智能客服、数字化运营、智能推荐等场景的应用。

4、推进智能服务建设,结合用户需求,构建千人千面的服务模式。

相关内容