2019大数据产业峰会|光大集团刘巍:集团企业数据治理实践经验分享
我们仓库里有很多这样的数据,我按照业务的条线,在上面有一个框架,在下面逐步梳理,做这样的盘点,同时也要考虑到如何验证这些实体是不是可信的。验证方法是通过业务流程来串联实体,定义出实体以后,用业务流程来去串,如果能串通的话,这个实际提出就是对的,如果串不通的可能就有缺有少,按照这样的方法来做。同时我们还有一些后继管理机制保证这些实体能够持续维护下去,这个模型的内容能够持续维护下去,这是我们企业模型的构建方法,之前在银监会一等奖的材料里都有很详尽的描述。 前面谈了光大银行的数据治理历程,包括对于数据资产管理比较重要的模型方法。但是我个人理解这些还不叫数据资产,一定是可定价、可计量、可变现的资产才能叫资产,现在这还是属于用的阶段。我们的目标是转向数据资产运营,只有那样才有可能变成数据资产,全链路、全生命周期的管理也是我们终极的目标。 我们要解决什么样的问题呢,第一就是数据都在哪儿?在这个大数据时代,整个数据分布在不同的地方,用不同的存储。原来我们行的数据都在仓库里面,现在可能还有一些影像、一些非银行数据存在其他的数据库平台上,我们如何构建一个框架,能够找到这些数据,并且能够实现这些数据的互通互联,是要考虑的。 第二就是在整个数据资产里面运营要有哪些产品。如果把数据运营和价值变现当作数据工厂来看的话,它是有产品的,有产品自然就会有分类、有框架。数据本身也是有分类的,我们要规范化地管理它,给它标上各种属性,给它管理元数据,这些都是要有分类和框架的,这个分类和框架就是元数据的模型。指标本身就是一个元数据模型,刚才提到有指标管理,我们在2017年的时候发布了一个行业标准,就是商业银行的指标数据源规范,这本身就是元数据的规范。目前我们的数据分成了基础类的数据、代码类的数据、指标类的数据,应用领域还有标签类的数据,将来的数据模型作为资产的一部分,可能也会有一些属性的描述,也会是一类分类。 第三,整个数据资产的全生命周期如何管理。有很多数据资产管理的工具,给我们生产线奠定了一个很好的基础,但是生产线里跑什么,怎么把生产线持续运转起来,都是要一点点往里填的,这个工作也是很繁重的。 第四个就是这些数据资产、这些产品怎么卖,这其实跟数据资产运营模式有关系。之前大部分的情况,在银行里都是业务部门提需求,我们去用,是一个定制化的方式。但是现在大家都在提生态、提开放,我们面向的可能就是我们最终的用户如何去应用,如何提供一些标准化的或者是有市场价值的产品推向市场。换句话说我们必须得去当销售,得去经营推销我们的产品。最后就是这些产品通过市场的检验,如何去定价变现,这涉及两部分,一部分是定价,一部分是成本。如果没有之前整个的标准化和规范化的生产过程的话,很难做到数据的计量。标准化和规范化是我们做数据资产定价的一个基础,因为它是成本计量的基础。 在整个全链路数据工厂、数据资产运营和价值变现的过程当中,我认为核心就是标准化和规范化并且逐步走向智能化的过程。这个智能化有两个含义,一个是面临的数据产品逐步走向数据分析挖掘应用,人工智能技术,它是一个智能化。数据资产运营这种管理的业务也可以智能化,我之前已经看到有些公司通过知识图谱,或者通过自动建模,或者做一些标准的比对,自动地来协助数据的管理工作。因为大家也提到数据管理工作涉及面特别广,纷纷杂杂,各种人工的比对、数据质量的核查和分析,巨大的工作量,如果有一个标准化的工作流程,这些元数据能够积累下来,可以借助智能化的方法去提升整体的运营效率和管理效率。这是我对整个数据资产运营的一点理解, 二、集团企业的数据治理经验分享 (编辑:西安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |