中原银行在过去几年做了一些技术驱动的改进。比如,面向全行的集中交付能力优化,包括固定报表和移动报表,自助查询模型等,特别是在过去几年银行业的自助查询比较流行,没有做的银行未来也一定要做,这是一个必经的阶段。数据分析需求理解:五种模式支持全行应用我认为银行业的数据分析需求可能有五种场景的数据交互模式(如上图)。
中原银行目前做了一个数据实验室,其实是一套数据湖的系统,就是把以前的仓库、集市这些平台迁到了一个新的计算架构上面,它的主要作用是为了做数据建模和探索性的分析,该平台完全独立于原来的 P2P 平台,且不像以前那样只做报表,也能做一些自助分析、数据建模,以便将来能支持更多建模师的使用。我们希望这种项目出来成果之后,能做成不同类的业务场景应用。
不过,有些旧有模式,比如即席查询在中国视角下会一直存在,因为很难从别的应用场景完全替代它。数据分析平台体系建设中原银行目前规划了一套数据平台体系,但目前这个体系还在演进。在过去几年,中原银行大概做了将近 1000 张报表、20 多个主题的自助分析以及数据实验室的平台。这些平台面向的人员有所不同,报表主要面向数据使用人员;自助分析主要面向条线,比如给领导编制报表和往下发布数据的人;数据实验室主要面向一些有科技背景的人员,比如建模师。
除了上述三大平台,中原银行还建立了一个社区平台,我们把这些统称为一站式分析平台。数据驱动创新社区的建立是为了引领行业数据驱动的发展,目前,科技部正在主导这个社区的建设。我们会在该社区大量地发布一些数据驱动的内容,比如,数据分析报告,文章等。个人认为,像数据驱动这种工作的推动,将来一定是业务牵头的,因为即使技术人员有思路也很难达到盈利,所以需要站到业务角度上去实践,现在,我们会把自己的技术人派遣到业务部门,学习在业务场景下进行分析。
前面提到的这几种数据分析平台还是比较偏技术方向,不过我始终认为,未来一定是场景化的方向才有发展。因为场景化的成本更低,比如,更低的使用成本,场景化让业务人员使用更方便;更低的人才成本,场景化的应用不需要招很多技术人员。面向大数据的综合分析平台架构这是中原银行目前面向大数据的综合分析平台架构,在这方面各行差异不大。
不过,中原银行集市做的很薄,只有一个贴源的 ODS,以及 4-5 块集市,比如管会、内部运营、营销等,与其他银行相比,中原银行是一个非常轻的架构,从贴源可以直接到集市,有的集市甚至没有指标加工,就直接整合明细,再到自助分析、报表,有的也往实验室里面供。个人认为,像自助分析和场景化分析、数据湖这样的思路早晚会替代我们之前做的大量报表,T 0 会替代 T 1,这只是时间问题,所以,我们整个架构现在也在往这边迁移。
分析平台建设实践—性能优化在前几年中原银行对分析平台做了一些性能调优。一般刚开始从报表转到 BI,肯定会面临性能问题,因为 BI 本身是一种以空间换取灵活性的方式。我们采用大数据技术支撑计算,用了 30 个物理计算节点,大概有二三十个面向大数据反范式设计的主题模型,也就是宽表模型,因为宽表模型牺牲了很多空间的代价,在这个大数据的平台上一般会跑得比较顺,冗余度高一点,性能会提高。
不过,大数据平台的一个主要特点是成本较低,扩容方面也可以接受,所以我们现在更多选用这种方式。分析平台建设实践—质量提升数据质量提升,是中原银行今年的重点,我们准备启动一个新的数据治理项目。下面简单介绍下:我们建设了一个在线口径管理的渠道。举个例子,现在业务在看报表发现数据问题的时候,会有一个线上的渠道直接在上面反馈问题,之后会有专门的技术人员跟进,除此之外,我们还有一个类似知识库的渠道,该渠道有利于口径的沉淀,但是,对数据的治理,比如主数据、标准管理,我们还需要进一步完善。
分析平台建设实践-灵活性提升这个是中原银行的 BI 平台,总体来说使用还不错。我认为银行到一个阶段必须做 BI,如果没有 BI 很难把数据驱动的思路真正地让业务落地,因为业务人员无法直接接触数据,很难了解数据在未来的作用。只有他们把 BI 用熟了之后,你才能告诉他以后可以做场景化分析和预测类分析,现在中原银行就是沿着这样的轨迹发展。