互联网金融生态系统2020系列报告之大数据篇——回归“价值”本源:金融机构如何驾驭大数据 下载本文

回归“价值”本源:金融机构如何驾驭大数据?14虽然已有诸多举措,但金融行业的大数据发展往往被形容为“雷声大、雨点小”,意指金融机构虽然投入不菲,但市场可感知的效果却十分有限。究竟是什么原因导致这一局面的产生?我们在与众多金融机构的接触过程中观察到三个阻碍数据转变为价值的现象:? 国内金融机构虽然同样坐拥海量数据,但其数据的存在状态反映了整

个组织的现状,即“部门分制”。数据在组织内部处于割裂状态—业务条线、职能部门、渠道部门、风险部门等各个分支机构往往是数据的真正拥有者,而这些拥有者之间却常常缺乏顺畅的共享机制。然而,成就大数据的是数据的“全量”,这就要求金融机构内部能够实现高度的数据共享与整合。这样的矛盾导致金融机构中的海量数据往往处于分散和“睡眠”的状态。虽然金融机构拥有的数据量“富可敌国”,但到真正利用时却“捉襟见肘”。

 ? 面对自己拥有的海量数据,金融机构真正敢“碰”的却很少。许多金融

机构担心触犯监管或法律底线,或者担心擅自使用数据会侵犯客户的隐私权,又或是担心数据处理不当可能会给机构带来声誉风险和业务风险。因此,这些机构虽然积累了大量数据,并对应用模式进行了思考,但最终仍处于隔河观望的状态,难以付诸行动。

海外金融机构也曾经面临同样的问题。在与海外金融机构的合作中,我们给出的建议十分简单:与数据拥有者坦诚沟通并征询他们的许可。BCG的大量项目经验表明,许多客户对于自己的数据被使用的接受度远比金融机构想象得要高。? 技术部门不作为!”“业务说不清到底要什么!”—这样的相互指

责在很多金融机构的业务部门与技术部门之间都曾出现。许多大数据项目就是在这种不顺畅的沟通中“夭折”,而不成功的经验只会加深双方的矛盾,导致新的合作更加艰难。这样的恶性循环在很多机构重复上演。我们发现,复合型人才的匮乏、合作机制的缺失以及工作方法的不当往往是造成这一局面的主要原因。

金融行业的数据强度在一定程度上决定了金融机构的技术强度。以银行业为例,在海外成熟市场,银行平均将营业收入的8%左右投入IT系统建设;而这一比例在国内稍低,但也可达到3%左右。如此重金打造的技术基础设施在大数据时代却面临着全面优化升级的挑战,这是因为数据的采集、存储和处理在大数据环境下发生了质的变化:日益开放的数据采集冲击着传统的结构化数据基础,常规的数据清洗在大数据面前失去了意义,海量数据的存储需要低成本的基础设施,实时性的分析要求新的数据处理技术......然而,挑战背后必有机遇。大数据同时为传统金融机构打造差异化竞争优势带来了宝贵的契机。那么,金融机构如何才能在技术层面上驾驭大数据时代?BCG认为,金融机构需要理解大数据分析的四个层次,关注13项核心技术,并做好两个决策。

数据经过层层晋级成为可以指导行动的智慧,而技术在这一过程中贯穿始终。(参阅图11)

波士顿咨询公司2015年2月

回归“价值”本源:金融机构如何驾驭大数据?15

? 这一层是基础所在。数据从各个渠道以各种形态涌入,其中包括结构化

数据(如交易信息)、半结构化数据(如日志信息)、非结构化数据(如社交信息、多媒体、地理位置等信息)等。在这个层面上,数据被实时和非实时地清理、加工,并被归档存储为有效信息以供后续的分析处理。

o 即便是在大数据时代,结构化数据依然举足轻重。结构化数据的集成

仍然是大数据技术体系中的重要组成部分,这样的技术目前已经非常成熟。

为了满足不同业务场景的数据调用和分析需求,在大数据体系中需要融入能够应对数据的多样性与多时效性特点的集成技术。

与常见的集中式存储技术不同,分布式存储技术并不是将数据存储在某个或多个特定的节点上,而是通过网络调用企业中每台机器上的磁盘空间,并将这些分散的存储资源构成一个虚拟的存储设备,为大规模的数据存储需求提供了低成本的手段。由于业务发展不断提速,业务流程也日渐复杂,我们的注意力日益集中在“数据流”而非“数据集”上。决策者需要的架构应能处理随时发生的数据流,而当前的数据库o o o

波士顿咨询公司2015年2月

回归“价值”本源:金融机构如何驾驭大数据?16

技术并不适合数据流处理。

o 并行计算能够充分利用各种计算和存储资源,把计算分布到多个计算节点上,

再在指定节点上将计算结果汇总输出,轻松实现针对TB、PB级数据分析的秒级响应。

如果在分布式的数据环境中工作并希望在很短的时间内处理数据,这就需要分布式处理。在分布式处理领域广为人知的一个例子就是Hadoop。

一般而言,内存访问速度要比磁盘访问速度快几百倍甚至上千倍。内存计算同时利用多个节点的计算能力和内存容量,CPU直接从内存而非磁盘上读取数据并对数据进行计算。内存计算是对传统数据处理方式的一种加速,是实现大数据分析的关键应用技术。o o ? 这一层是将数据转换为信息的关键。在这个层面上需要对数据进行去噪和增强

处理,完成关系型信息和非关系型信息在一定程度上的整合。

o 关系型数据库发展已经相对成熟,具有良好的可扩展能力和较高的处

理能力。

传统关系型数据库已无法满足需求,非结构化数据库不仅需要可以处理结构化数据,而且应当更适合处理非结构化数据(如文本、多媒体等信息)。o

? 人工智能和数据挖掘技术在这一层面上大显身手,对在上一个层面整合好的信

息进行分解、提炼,从中找出对目标对象有价值的信息点,完成从信息到知识的转化。

o 按需收集各种实验数据,建立业务实验模型,是大数据架构下用于探索业务

数据的一个分析平台。

在不影响用户体验的情况下,从一组备选方案中选择一个合适的业务决策。

这是大数据非常重要的能力,从信息反馈中获取新的知识或技能,重新组织已有的知识结构,并使之不断改善自身性能。o o

? 作为行动指导的洞察就诞生于这一层面。借助数据可视化工具,将经验、判断与

知识相融合,使数据蜕变为智慧,开始为商业价值的创造提供指导。

o 借助数据可视化工具可以从知识中发现智慧,借助叙事可视化工具可以以独

特的方式探索数据,而借助探索性可视化描述工具可以帮助决策者和分析师挖掘不同数据之间的联系—这是一种可视化的洞察力。

为了将大数据技术融入到自己现有的技术生态中,传统金融机构特别需要在基础设施和IT架构两大问题上进行权衡。(参阅图12)

波士顿咨询公司2015年2月

回归“价值”本源:金融机构如何驾驭大数据?17

? 是否“在云端”以及如何“在云端”是众多传统金融机构在大数据时代需要做出的

一个核心技术决策。从理论上来说,金融机构可以选择云端、本地或混合模式。如果选择云端,金融机构还需要在公共云和私有云之间进行选择。而在实践中,这样的决策并不容易, 因为这不仅仅涉及到技术问题。对数据的掌控是金融机构安身立命的根本,而如何平衡风险控制与成本效率是这个决策的关键点。

波士顿咨询公司2015年2月