面向业务的数据资产建设方法论:标签类目体系
Posted 果汁华
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了面向业务的数据资产建设方法论:标签类目体系相关的知识,希望对你有一定的参考价值。
摘要: 标签类目体系方法论是一种将数据资产按照树状结构组织的方法, 根目录为对象, 枝干分支为类目, 叶/花末端为标签。资产结果分为资产清单和资产实体两 大部分, 它们可以通过服务管理工具快速配置成可供业务使用的数据服务结果, 以实现数据资产价值。
引言:在数据中台概念中, 数据资产位于核心位置。广义上, 企业拥有所有权的数据资源都是其数据资产。但是这个广义定义过于宽泛, 因此需要更多关注其精准定义——企业所拥有的能够带来经济价值的数据资源. 数据 资产一般都有较好的组织形式来保障完成“看-选-用-治-评”的经济价值链路, 对数据资产的最佳“组织形式“研究成为数据中台建设的重中之重。
数据资产之所以称为资产, 必须从价值出发, 整理、管理、优化对业务真正有帮助、能给企业带来
效益的数据资源。 把数据资源封装成业务人员能理解的形态, 是后续资产价值化的必要前提. 因此迫切需要一种新的思路来研究面向业务侧的数据资产建设方法。
一、基础结构
标签类目体系方法论是一种面向业务的数据资产建设方法: 用“标签”来作为数据资产的最小单
元组织载体, 用“标签类目体系”作为数据资产目录的整体组织结构载体。
1.1 根目录
标签类目体系的基础结构就像一棵树, 如 图 所示 , 树的根决定了这是一颗什么树。1.2 枝干分支
树的枝干部分对应于标签类目体系中的类目分层, 因此类目是一种分形结构 , 可以不断地分化下 去, 也可以根据需要截取任意一个子系统出来作为独立的标签体系 ( 小系统范围 ) 使用。1.3 叶/花末端
树的叶/ 花部分 , 对应的就是对象的各种属性 , 即标签 , 物理存储中映射为字段粒度 , 是通过大量 经验验证后最合适的数据资产最小单元粒度 . 叶和花都属于枝干延伸的末端组织分化 , 相互之间存在 联系 . 标签也可以分为动态标签和静态标签 , 动静区分点在于某个个体在这个标签下的标签取值是否 具有经常发生变化的可能 .二、 连接赋能
标签类目体系是基于“对象”的标签分类刻画, “对象”是类目体系的奇点。2.1 实体树间通过关系树连接
例如, 消费者 ( 实体 ) 与商品 ( 实体 ) 之间会通过某些浏览、交易、评价等行为 ( 关系 ) 产生连接 , 通 过这种连接, 消费者 ( 实体 ) 与商品 ( 实体 ) 除了静态标签之外 , 还衍生出了许多动态标签 , 实体对象 360 度的全面刻画变得更为丰富和完整 ,2.2 关系树是一种能量赋予
实体对象身上的标签, 会随着关系对象的增多而相应地增多 . 每新增一种动作、行为、连接 , 即关 系树, 就会在实体树上映射出一片新类型的叶子2.3 业务使用是养分供给
标签如果在业务中被广泛使用则生长非常牢固, 得到了业务的重视而获得更多资源倾斜 . 而某些 标签如果只被使用一次即搁置, 则会因为营养不足而凋零下架 .三、生长优化
标签类目树就像生命进化树一样, 类目分支受到能量环境影响形成丰富的标签簇, 标签会经历优胜劣汰的自然选择. 整个标签类目树需要自己生长出来, 而非人为控制得到最终形态。
因此当一家企业需要构建其自身的标签类目体系时, 可以基于一个已沉淀好的××行业某对象标
签类目体系模板, 进行快速的规划设计和修正优化. 根据建设数据资产的目的节奏不同, 有以下两种
模式可以参考借鉴。
3.1 完整规划, 由浅入深
当企业构建资产的目的是形成数据资产的完整规划, 指导数据收集、整理、加工、挖掘等各阶段 工作 , 并愿意花费较长时间来实施数据资产的整体规划时可以选用下述模式。 从根部最基础树干到分支再到细支, 体现了一种整体规划的完 整思路. 这种模式的好处是全面规划、面向未来, 可以指导企业在数据端的全面布局 ; 缺点是建设周期长 , 见效慢, 因此遇到的阻力也会很大 , 必须是一把手工程才能完成全面的数据资产从规划到落地实施。3.2 纵深打穿, 从局部直接截取
当企业构建资产的目的是完成对业务场景的支撑, 特别是多个业务场景间能快速复用标签资产 , 希望可以快速见到数据对业务产生的商业价值时可以选用下述模式。 直接从经典的完整对象标签类目树上截取所需的部分分支即可. 因为标签类目体系是一种分形 结构 , 整体和局部有同构性 , 任何一个局部分支都可以剪切出来作为独立的标签类目树 . 例如 , 当前某 业务部门只需要研究用户的基础特征, 就可以直接从经典类目树上截取左上角的基础特征分支作为 独立的类目树, 如 图 中圈选部分所示 . 此时该用户的一级类目就是基础特征 , 直接跳过“静态特征” 和“动态特征”这两个更基础的类目。这种模式的优点是: 标签直接作用于业务, 可以快速得到业务滋养并得到数据价值的认可, 阻力 较小. 但缺点是: 当业务、标签不断生长变化时, 整个类目结构可能会有较大的变动, 甚至是重构, 带 来的影响较大。
四、资产结果
通过标签类目方法论所形成的企业数据资产库包括资产清单和资产实体两部分。
4.1 资产清单
资产清单类似资产门户, 可以在门户集市中 , 清晰明了地看到企业中一共构建了哪些对象的标签 类目体系, 并在选中某种树后 , 可以看到这种树的具体枝干轮廓 : 一级类目、二级类目、三级类目…… 选中某级标签类目后, 可以看到其下所涵盖的标签列表 每个标签就像每一片不同的叶子一样, 拥有自己的 ID 、名称、逻辑、类型、值字典等元标签信息 , 元标签就是对标签的属性描述。4.2 资产实体
资产实体是指在设计好的标签类目体系规范下的每个具体个体实例。五、落地实用
数据资产构建完成后, 需要把资产合理高效地使用起来 . 这里列举最常见的 3 种数据服务方式 : 查询、分析、圈选 , 来解释经标签类目体系梳理后的数据资产是如何快速实现这 3 种数据服务过程的。5.1 查询服务
查询服务经常会运用在业务系统中的联机事务处理 (On-Line Transaction Processing, OLTP)事务型数据操作中, 如在海量数据中快速查找某辆汽车的违章信息, 或在营销活动中实时判断某位消
费者是否达到准入门槛或完成活动任务。
5.2 分析服务
分析服务经常会运用在业务系统中的联机分析处理 (On-Line Analytical Processing, OLAP) 分 析型数据操作中, 如对消费者群体进行客户透视画像 , 或对企业经营状况进行财务分析 等。 分析服务有几个配置项可以选择: 待分析的维度 (标签) 及分析类型 (求和、求平均、最大值、最小值、取值分布等). 例如, 我们可以选择【性别】这一维度并设置“取值分布”这一分析类型。
5.3 圈选服务
圈选服务经常会运用在对特定目标对象的操作中, 如广告系统中的精准营销, 或 LBS 服务中的地理围栏, 或数据化运营中的定向投放等。
六、结论
通过标签类目体系方法构建的数据资产, 可以将难以理解的数据信息转化为业务人员“看-选-用-治-评”的资产操作对象, 降低了数据资产使用门槛, 加快了试错和使用频率, 能够切实有效地保障数据资产价值真正在业务端得到实现, 并保持长久运营的生命力.
以上是关于面向业务的数据资产建设方法论:标签类目体系的主要内容,如果未能解决你的问题,请参考以下文章
个推TechDay治数训练营直播回顾 | 企业级标签体系建设实践