数据资产价值评估模型的理论研究与技术实现探讨


作为一项公司资产,数据的重要性正日益凸显。伴随着数据量和数据种类的不断增加,数据产生价值的机会也随之增多。未来数据将成为一个重要的财富创造来源,并且越来越多地被视为一项值得重视的企业资产。数据资产的评估问题,也将成为企业估值的核心问题之一。

数据资产作为一种新型的无形资产,在这方面的研究还十分欠缺,目前还没有一种完整的数据资产评估体系。笔者基于对数据资产特点的分析,引入层次分析法(AHP)构建指标评价体系,采用专家打分法(Delphi)予以权重和得分的赋值,力求构建一个完整的数据资产评估模型,并实现评估结果的量化分析。
 

一、数据资产的特点
 

数据资产具有无形资产的属性,从这个角度出发,我们可以发现数据资产主要有以下特性:无消耗性、增值性、依附性、价值易变性。

无消耗性:数据资产的每次使用只需要花费很低的成本,不会因为使用频率的增加而磨损、消耗,与其他传统无形资产有相似性。

增值性:企业通过稳定发展,会促使数据资产在原有的基础上,数据规模和数据维度的不断积累,整体价值进一步提升。

依附性:与其他无形资产类似,数据资产不能独立发挥作用,其发挥作用和效应往往依附于相应的软件、硬件。

价值易变性:数据资产时刻受到数据容量、数据时效程度、应用场景等因素的影响,与其他无形资产相比,其价值更易发生变化。


二、数据资产价值的构成
 

数据资产受控于企业主体,依附于有形资产。数据资产的价值受到众多变量因素的影响,例如数据的质量、数据在不同场景下的应用价值。
 

1 数据质量价值

数据只有应用在具体的场景中,才会体现其价值。因此伴随着不同的场景,同样的数据会表现不同的价值。数据价值是恒定的,但是又是需要不断被挖掘的,随着我们对不同行业的逐渐认知,数据的价值不断丰富。我们可能难以穷尽数据在所有行业的整体价值,但我们可以就数据在某一具体行业、在当前阶段的价值的相对高低予以评估。数据的价值受两个主要因素的影响:数据质量和数据应用。
 

2 数据应用价值

数据价格围绕数据价值,是市场环境的影响,进行上下波动。数据价格的评估可以基于两个主要因素:数据成本和数据收益。数据成本主要是从数据拥有方予以考虑,是数据拥有方制定数据价格的主要出发点。处于财务的考虑,数据的价格应该高于数据的成本。数据收益主要是从数据需求方予以考虑,是数据需求方购买数据时愿意付出的最高价格。出于盈利的考虑,数据的价格应该低于数据的收益。
 

三、数据资产价值评估的理论方法
 

1 层次分析法(AHP)

层次分析法是美国在 20 世纪 70 年代提出的一种将定性和定量分析相结合的多准则决策方法。层次分析模型是把复杂的问题分成若干个组成因素,并按照支配关系分组形成层次结构。然后通过两两比较的方式,综合专家的判断,确定分析的结果。具体步骤如下:

  1. 分析各因素的关系,建立递阶层次结构;
  2. 对同一层次的多个元素,关于上一层次中某一准则的重要性进行两两判断,构建比较判断矩阵;
  3. 由判断矩阵计算比较元素对于该准则的相对权重;
  4. 计算合成权重;


2 专家打分法(德尔菲法)

德尔菲法由兰德公司首次用这种方法用来进行预测,后来该方法被迅速广泛采用。这是一种将所需解决的问题单独发送到各个专家手中,征询意见,然后回收汇总全部专家的意见,并整理出综合意见。随后将该综合意见和预测问题再分别反馈给专家,再次征询意见,各专家依据综合意见修改自己原有的意见,然后再汇总。这样多次反复,逐步取得比较一致的预测结果的决策方法。

  1. 组成专家小组。按照课题所需要的知识范围,确定专家;
  2. 向所有专家提出所要预测的问题及有关要求,由专家做书面答复;
  3. 各个专家根据他们所收到的材料,提出自己的预测意见;
  4. 将各位专家第一次判断意见汇总,列成图表,进行对比,再分发给各位专家,让专家比较自己同他人的不同意见,修改自己的意见和判断;
  5. 将所有专家的修改意见收集起来,汇总,再次分发给各位专家,以便做第二次修改。这一过程重复进行,直到每一个专家不再改变自己的意见为止;
  6. 对专家的意见进行综合处理;


四、数据资产价值评估的指标体系
 

1 数据资产评估的指标层次

1)数据质量价值评估

数据质量是保证数据应用的基础,是数据资产价值得以实现的前提。随着企业拥有数据量的急剧扩大,数据质量问题变得日益突出,数据的质量,将严重影响企业数据资产的价值,是决定数据价值高低的重要因素。

数据质量评估的维度包括数据的完整性、正确性、一致性、重复性。数据质量评估能够对整体或其中部分数据的质量状况给出一个合理的评估,帮助数据用户了解数据的质量水平,进而对数据应用水平予以预测,评估企业数据资产的真实价值。


2)数据应用价值评估

数据的价值只有在应用时才得以体现,应用价值是数据资产的核心价值。数据应用价值评估的维度包括场景经济性、稀缺性、时效性、多维性。数据的应用价值在不同的行业、不同的应用场景下价值的大小不同。在市场环境下,数据的垄断也是决定数据价值高低的重要因素。在不同应用场景下,对数据的时效性要求也不同,有些场景需要实时性数据,而有些场景需要较长时间周期的历史性数据。交叉性的多维数据带来更深刻的洞察,因而价值也更高。

数据质量价值评估_大数据_数据分析_数据质量_数据应用价值


2 数据质量价值

数据质量的评估指标包括完整性、正确性、一致性、重复性。

数据质量价值_数据分析_大数据

1)完整性(Q1)

指标解读:描述数据是否存在缺失记录或缺失字段。数据缺失的情况可能是整个数据记录缺失,也可能是数据中某个字段信息的记录缺失。

指标评分方法:完整性 =(数据集中所有满足条件的数据量 / 数据记录总数)*100%

完整性示例_数据分析_完整性_数据分析


2)正确性(Q2)

指标解读:描述数据是否与其对应的客观实体的特征相一致。任何字段的数据都应该符合特定的数据格式与值域范围。例如:表示身份证号码的数据应该为 15 位或 18 位;移动电话号码应该 11 位;人的年龄应该在 0-120 岁之间等。

指标评分方法:正确性 =(数据集中所有正确的数据量 / 数据记录总数)*100%

正确性示例_数据质量_数据分析_大数据
 

3) 一致性(Q3)

指标解读:描述同一实体的同一属性的值在不同数据集中是否一致。在各个独立的业务系统内部,数据不一致的现象大量存在。例如,“客户”和 “用户” 的意义相同,在相关的多个数据表中,这两个术语同时存在。

指标评分方法:一致性 =(数据集中所有不一致的数据量 / 数据记录总数)*100%

一致性示例_数据分析_大数据_数据质量
 

4)重复性(Q4)

指标解读:描述数据是否存在重复记录。现实世界中的同一个主体,在不同的数据源中常常有多个表达,在语法上相同或相似的不同记录可能会代表现实世界中的同一主体,因而会对同一主体造成重复性记录。

指标评分方法:重复性 =(数据集中所有重复的数据量 / 数据记录总数)*100%

重复性示例_大数据_数据分析_数据质量


3 数据应用价值

数据应用价值包括稀缺性、时效性、多维性、场景价值。

由于数据应用价值的各个维度缺乏具体的数据,也缺乏衡量的标准,更多利用行业专家的经验,采用专家打分的方法。我们采用本维度的经验估值与相对应的最大估值的比较,得到相对数值。该数值最大值为 10。

更为重要的是,数据的应用价值伴随的应用场景的不同,数据体现不同的应用价值。同样的数据集,在 A 场景的应用价值为 10,可能在 B 场景的应用价值为 5. 因此,数据应用价值,必须在具体的应用场景下进行评估,并不具备跨行业、多场景通用的应用价值评估标准。
数据应用价值_数据分析_大数据_数据质量
数据应用价值_数据价值_数据分析_大数据
 

1)稀缺性

指标解读:描述数据的供给数量及供给方数量的多寡。在数据源的市场上,当数据供给方局限在很少的数量,或者市场上该类型的数据量稀少,那么相应的数据价值就会较高。

指标评分方法:供给方数量或数据供给丰富程度,与最大供给方数量或数据供给丰富程度相比较。利用行业内的大数据专家经验,采用专家打分法。

数据应用价值_数据分析_数据质量
 

2)时效性

指标解读:描述数据的时间特性对应用的满足程度。不同类型的应用对数据的时间特性有不同的要求。通常实时性应用中的数据时效性较短,而预测性应用则允许数据有较长的时间。

指标评分方法:该数据集的有效时间与应用所需要的期望有效时间相对比,利用行业内的大数据专家经验,采用专家打分法。

时效性示例_数据应用价值_数据质量_数据分析_大数据
 

3)多维性

指标解读:描述数据集的维度多寡程度。伴随着企业业务的丰富和数据收集数量的增加,会促使数据资产在原有的基础上,数据维度不断增加。数据维度与数据资产的价值呈正相关 ,更为复杂的多维度数据蕴含着更大的价值。

指标评分方法:该数据集的维度数量与应用所需要的期望数据维度相对比,利用行业内的大数据专家经验,采用专家打分法。
多维性示例_数据应用价值_数据质量_数据分析_大数据
 

4)场景经济性

指标解读:描述在具体场景下数据集的经济价值。由于不同行业的规模、数据应用程度等具有差异性,因而不同的场景下的数据集,其价值会相差很大。

指标评分方法:该数据集在某场景下的经济价值与所有场景中的最大经济价值相比较,利用行业内的大数据专家经验,采用专家打分法。
场景经济性示例_数据分析_大数据_数据质量
 

五、数据资产价值评估指标的权重


1 构建指标层次结构模型

一级、二级指标
指标层次结构模型_数据资产价值_数据分析_大数据


2 计算判断矩阵及各级权重结果

1)确定判断定量化标度及含义

对于各个指标的权重,采取两两因素比较的专家打分法。在两个因素相互比较时,需要有定量的标度。我们采用如下的标度方法,其含义如下表所示。
确定判断定量化标度及含义_数据应用价值_数据分析_大数据
 

2)数据质量判断矩阵及权重

①构造比较判断矩阵

根据公司数据专家意见,按照重要程度两两比较,构造数据质量的比较判断矩阵,如下表所示。

构造比较判断矩阵_数据质量_数据分析_大数据

②计算权重

完成判断矩阵一致性检验,然后计算数据质量评估指标的权重如下表所示。
计算数据质量评估指标_数据质量_数据分析_大数据


3)数据应用价值判断矩阵及权重

①构造比较判断矩阵

根据公司数据专家意见,按照重要程度两两比较,构造数据应用价值的比较判断矩阵,如下表所示。
比较判断矩阵_数据应用价值_数据分析_大数据
 

②计算权重

完成判断矩阵一致性检验,然后计算数据应用价值评估指标的权重如下表所示。
计算数据应用价值评估_数据分析_数据质量_大数据

六、数据资产价值评估指标的评分


1 数据质量得分计算

1)构建数据质量二级指标的评分标准

构架数据质量二级指标的评分标准_数据质量_数据资产价值_大数据


2)二级指标得分

以某数据集为例,假设其数据质量的二级指标得分如下。

数据质量的二级指标得分_数据分析_数据质量_大数据
 

3)一级指标得分

通过加权计算公式得到数据质量得分:

Sq =(W1*S1+W2*S2+W3*S3+W4*S4)

=(0.32*94.5+0.32*92.05+0.21*92.66+0.15*88.9)

= 92.49


2 数据应用价值计算得分

假设以某一具体的应用场景为例。示例:个人位置数据应用于旅游。

1)构建数据应用价值二级指标的评分标准
数据应用价值二级指标的评分标准_数据应用价值_数据分析_大数据


2)二级指标得分

某移动运营商个人位置数据集,应用于旅游景区商家营销应用的二级指标得分如下。
应用于旅游景区商家营销应用的二级指标_数据分析_数据应用价值_大数据

3)一级指标得分

通过加权计算公式得到数据质量得分(满分 100 分):

Sa =(W1*S1+W2*S2+W3*S3+W4*S4)

=(0.11*80+0.14*20+0.31*50+0.44*50)

=49.1


3 数据资产价值评估得分

数据资产价值(S)由数据质量价值(Sq)和数据应用价值(Sa)共同决定,数据资产价值评估得分由二者相乘得到。

S =(Sq * Sa)/100

在上面示例中,数据资产价值评估得分为(百分制):

S =(92.49*49.1)/100= 45.41


总结

笔者提出的数据资产的数据价值评估体系,更多是抽象出数据资产评估的普遍特征和规律,构建一套数据资产评估模型和指标体系。

数据资产作为一种无形资产,本身就存在难以评估的难题。而数据价值评估到目前为止也存在难以量化的瓶颈,因此本数据资产评估的模型与指标体系是在一定约束条件下构建的。
来源:数据工匠俱乐部
45期CPDA课程