前面两篇我们讲解了关于人工智能技术的两个重要分支,即文字识别OCR技术、自然语言处理NLP技术,在财务方面的应用场景。今天我们来讨论一下大数据对财务工作能带来哪些好处。
在众多技术新名词之中,大数据一词是我们财务最感亲切的一个了,因为我们每天就是和数字打交道。但数据前面加个“大”字,我们反而就看不懂了,到底啥是大数据,和我们工作有什么相关吗?大数据又成了让我们最迷惑的一个词了。
可以说大数据一词是让我们耳朵都磨出茧子的技术术语了,但具体看相关资料和文章,又往往大而化之和不知所云,或充斥着大量类似Hadoop、Spark、MapReduce、Hive等等让我们更加迷惑的术语,对其更充满了神秘感。今天我们就来好好揭开大数据的神秘面纱。
大数据是源于互联网行业兴起后,才被提出和广为重视的。由于互联网公司面向大量网民和最终消费者,在经营过程中,产生了远超传统行业的数据量。这些数据的保存和使用分析,就成了大问题。
传统以Oracle、MySQL为代表的关系型数据库,适用于存储记录条数在10亿条以下的数据(单表),存储容量上限在10T至100T(家用2T硬盘,装5块至50块左右)左右,并发访问用户数在1万人次/秒以下的情况。
而大型互联网企业的数据量则远远超过了上述边界,往往一天产生的用户数据(点击率、访问记录、系统日志等等)就上千万条,数据存储量是以PB级数据为基础单位(1000T=1PB,是传统数据库技术的100倍以上),并发访问用户往往是几十万人次甚至几百万人次/秒(例如2019年双十一时期,交易笔数峰值为54.4万笔/秒)。
可以看出,在数量、容量、并发量三个方面,大数据超出了传统数据范围的一到两个数量级以上,原有的技术方法就不能适用了,需要新的技术来处理,这就有了前面Hadoop、Spark等新技术的出现。
另外还有一点就是,原有我们财务习惯的数据是表格类的结构化数据,而大数据还包括了视频、音频、图片、日志记录、实时流数据等我们不太关注和了解的数据内容。这些数据往往是以非结构化数据方式存储和体现的。
从前面的分析,可以看出大数据是一个技术名词,和业务无关。只有你的数据大到足够的体量后(10亿条记录、100T数据、1万人并发使用以上),才有需要用到大数据的技术来处理。
按照这个标准来衡量,其实绝大多数公司的绝大部分财务涉及的绝大部分数据,都不满足上述技术标准,根本不需要杀鸡用牛刀,用到所谓的大数据技术来处理。
那对于我们财务而言,更为有意义的是财务大数据,其表现出来的特点有几个方面:
在智能财务时代之前,虽然我们有信息技术在帮助我们来处理财务数据,但受限于相关技术能力,我们很难做到上述的财务大数据的统一规划和建立。通过人工智能等相关技术的应用(前期我们讲到过),我们可以将更加细致的数据由机器自动逐笔处理,而不是我们人工录入;我们可以从经济业务中提取到更加多维的数据,而不是只有简单辅助核算项的数据;我们可以整合更加多元的数据,包括公司内部(合同、供应商、客户、订单、存货、研发、产品、营销、销售数据等等)和外部的数据(行业数据、同行比较数据、宏观经济数据、重要行情指标数据等等)。
对于我们财务而言,为了更好的进行数据分析,在掌握专业财务知识以外,我们还需要重点补充有关技能。主要包括数据建模能力、统计分析有关知识,统计分析软件(SPSS等软件)的使用、交互式BI分析工具的掌握(PowerBI等工具),这些我们在后续系列中会逐步展开讲解。
因此,对于我们财务而言,更应该关注的是财务大数据,而不是技术大数据。通过建立财务大数据,我们才能将大量的基础数据,变成有价值的信息,提炼出能帮助企业战略决策的情报,成为真正有价值的企业数字资产。
在第三届智能财务大会上,中国铁塔财务部副总经理的李苏萍女士,给我们分享了中国铁塔的财务智能化应用,其中有关对全国210万座铁塔的独立核算,令人印象深刻,充分体现了我们今天所说的的财务大数据的价值。
中国铁塔拥有210万座铁塔,要求做到单塔核算,核算颗粒度细,对财务提出了很高的要求。
210万座铁塔,对其数据进行精细化管理,包括经纬度、地址、资产编码进行精细管理,其中涉及的2500万的设备更是采用一物一码的资产管理。
中国铁塔财务大数据成果:
基础核算:
资金结算:
编制报表:
资产管理:
海量财务大数据的积累,最终通过可视化运营数据展示系统进行展示,方便公司领导和各级人员了解财务数据,发现运营中的问题。
在智能财务时代,通过建立财务自身的“大数据”,可以帮助我们将财务数据工作管得细、管的全,管得好,让数据的价值体现出来,让大家看得到、看得懂、用得着,这样才能真正体现我们财务工作的价值。
下期我们将讨论一下如何建立财务大数据,包括数据建模、统计分析、可视化展示等话题,让我们财务的武器装备从小米加步枪升级到飞机大炮,敬请期待。
上一篇:大数据就业前景和就业方向分析