Operations Research and Fuzziology
Vol. 13  No. 03 ( 2023 ), Article ID: 68045 , 10 pages
10.12677/ORF.2023.133252

基于CiteSpace的国内外数据资产研究可视化图谱分析

王诗语,曹玲

南京信息工程大学管理工程学院,江苏 南京

收稿日期:2023年5月18日;录用日期:2023年6月24日;发布日期:2023年6月30日

摘要

数字经济时代,伴随着数字化技术的提升,以数据要素为基础的数据资产日益成为数字经济发展的重要驱动力。由于目前国内外有关数据资产管理的研究仍处于发展阶段,难以统一对数据资产的管理活动做出准确具体的定义和解释。本文在梳理国内外以数据资产相关研究为主题文献的基础上,通过文献可视化分析软件CiteSpace对当前国内外数据资产研究热点和研究前沿进行分析,总结国内外数据资产各自的发展特征;并进一步结合归纳分类法和对比分析法,根据国内外数据资产研究侧重点的不同,总结国内外数据资产研究的差异性;最后,结合本国数据资产发展实际,讨论我国数据资产未来研究方向并进行展望,旨在推动数据资产创新研究的进一步发展。

关键词

数据资产,文献研究,CiteSpace,可视化分析

Visual Graph Analysis of Domestic and Foreign Data Asset Research Based on CiteSpace

Shiyu Wang, Ling Cao

School of Management Engineering, Nanjing University of Information Science & Technology, Nanjing Jiangsu

Received: May 18th, 2023; accepted: Jun. 24th, 2023; published: Jun. 30th, 2023

ABSTRACT

In the era of digital economy, with the advancement of digital technology, data assets based on data elements are increasingly becoming an important driving force for the development of the digital economy. On the basis of reviewing domestic and foreign literature on data asset related research, through the literature visualization analysis software CiteSpace, the current research hotspots and frontiers of data assets at home and abroad are analyzed, and the development characteristics of data assets at home and abroad are summarized; And further combining inductive classification and comparative analysis methods, summarize the differences in data asset research between domestic and foreign countries based on their different research focuses; Finally, based on the actual development of data assets in our country, we will discuss the future research directions and prospects for data assets in China, with the aim of promoting further development of innovative research on data assets.

Keywords:Data Assets, Literature Research, CiteSpace, Visual Analysis

Copyright © 2023 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

随着大数据和区块链等数字化技术的不断发展,极大地丰富了数据要素的构成。2019年党的十九届四中全会中首次明确了数据的生产要素地位,并强调其对完善再分配机制的重要性;2022年中共中央、国务院发布的《关于构建数据基础制度更好发挥数据要素作用的意见》,进一步在加快数据基础制度建设的基础上,充分激活数据要素潜能,以数据要素活力赋能实体经济,促进全社会共享数字经济发展红利。在此数据建设的背景下,数据的资产化已成为必然趋势。

然而,目前国内外数据资产化的相关发展仍处于发展阶段,对数据资产的概念及管理等研究问题尚未形成共识。因此,本文结合现有国内外的文献研究,利用可视化文献计量软件,探究国内外数据资产的研究热点问题和前沿发展方向,并对现有的国内外数据资产研究结果进行比较分析,意在为未来数据资产的相关发展提供理论依据和方法支撑,以此推动未来国内外数据资产实践工作的开展。

2. 数据资产内涵与特征

关于“数据”概念的初步认识,最早是来自信息领域。随着时代的发展,在“数据”概念的框架上逐渐加入数据的资产属性,进行数据资产的概念探索。“数据资产”的概念是来源于“数据”的概念演变,正式的概念由Richard Peterson于1974年首次提出;随后在演变发展的过程中结合信息资源和数据资源,将数据作为生产要素参与社会生产分配和价值测度,因此数据资产的概念逐渐丰富。

3. 研究方法与研究创新

3.1. 数据来源与研究方法

本文通过对相关文献的梳理和筛选,总结了现有数据资产的研究进展。具体研究方法遵循以下几个步骤。首先,本文以2006~2023近15年间的文献数据作为研究所用的参考文献,对中国知网(CNKI)中的CSSCI、北京大学中文核心期刊和Web of Science数据库中发表的文章分别以“数据资产”、“数据资产价值评估”、“数据资源定价”、“数据资产管理”、“数据治理”、“数据安全”、“大数据”、“数字经济”及对应英文“data asset”“data asset value evaluation”“data asset pricing”“data asset management”“data governance”“data security”“big data”和“digital economy”为主要关键词对国内外的文献进行主题检索;其次,对不符合研究主题的文献进行手动筛选和剔除,并对遗漏的文章进行补充,因此本文共获得2006~2023年近15年间的有效中文文献389份,外文文献613份,作为本文的研究分析对象,再利用CiteSpace可视化软件对与本文主题强相关的文献进行图谱分析,总结对比国内外数据资产研究特征差异。

3.2. 研究创新

本文的研究创新点主要在于:在研究主题上,数据资产相对于传统资产更加新颖,具有一定的研究意义;在研究内容上,以国内外近15年的相关核心文献作为文本分析对象,肯定了研究内容与研究主题的关联性,拓展了数据资产的研究范围;在研究方法上,以文献综述法和对比分析法进行主题研究,以发展特征为对比视角,剖析国内外数据资产发展的差异,并针对存在差异提出未来研究展望。

4. 国内外数据资产研究可视化图谱分析

4.1. 国外文献研究

4.1.1. 关键词共现分析

本文运用CiteSpace可视化软件对上述已检索到的613份有效英文文献进行梳理和统计分析,总结了现有国外文献中对数据资产相关理论及方法的研究进展,以关键词作为文本检索对象。在此选择了出现频率最高的十个关键词,以出现年份和中心性进行关联分析,有关国外文献的高频关键词分布见表1。根据表中的关键词统计结果显示,共有578个关键词节点,945条节点连线,中心性都较为显著。其中“data management”出现频次最多,次数为432,中心性为0.73,位列高频关键词分布之首,结果表明2020年是国外数据资产相关研究产出的高峰年份,研究大多聚集于数据资产管理。在十个关键词的时间分布中,2016年和2021年的时间节点均出现两次。其中2016年的研究主题聚焦于大数据的运用,以深度学习的机器语言方式应用于数据资产的管理研究;2021年更加注重对数据资产的价值测度,将数据置于数据市场中,以定价的方式体现数据资产的应用价值。

Table 1. Foreign high-frequency keyword distribution

表1. 国外高频关键词分布

4.1.2. 关键词聚类分析

关键词聚类是对主要关键词的聚集分类,可将多个紧密相关的词划分为几个聚类主题,用图谱的形式显示各聚类间的关联程度,从此更深层次地挖掘数据资产的研究热点。聚类中包含的关键词越少,该聚类序号的数字越大。反之,聚类数字越小。根据聚类主题,CiteSpace可视化软件根据社会网络中关键词出现的频率及中心性,提供了模块值Q值和平均轮廓值S值,其中此研究的Q值为0.4908,S值为0.7614,表示聚类结果显著。通过对相关有效英文文献的聚类分析,共得出8个聚类主题,各关键词聚类的结果见图1。结合聚类情况,将国外文献研究主要分为三个层次,主要从宏观、中观和微观三个层次进行国外文献的分类研究。

从宏观层面来看,将数据纳入生产要素中,成为区别于传统资产的新型资产,需发挥这一新型生产要素在社会经济发展中的作用。该层面包含的聚类有#6 data elements。数据要素是蕴含重要资产信息的关键要素,内涵包括数据要素的具体价值体现。Gold Finger (1997)是最早将图片音像等信息数据作为无形资产进行研究的学者 [1] ,后来Chirs (2010)将信息作为被资产价值化的资产,以无形资产的概念定义对其进行研究 [2] 。

从中观层面来看,主要强调借助先进的数字化互联网技术和模型进行数据资产的相关研究。该层面包含的聚类有#0 internet of things、#2 machine learning和#3 ecosystem services。通过工业互联网的概念,利用物联网实现数据的共享状态,最终实现数据资产的协作。Younan Mina等人(2021)利用物联网进行数据挖掘 [3] ,Attar-Khorasani Sima和Chalmeta Ricardo (2022)利用物联网进行数据的可视化分析 [4] ,可见物联网在数据资产前期的数据挖掘和后期的数据分析都有广泛的应用。

从微观层面来看,数据资产的研究采用具体方法和模型对其进行管理相关的研究,主要体现在对其价值实现。包含聚类有#1 asset pricing、#4 capital asset pricing model、#5 data model和#7 data management。主要集中于构建具体模型,对相应数据资产的进行定价和计量。

Figure 1. Cluster graph of foreign literature keywords

图1. 国外文献关键词聚类图谱

4.2. 国内文献研究

4.2.1. 关键词共现分析

本文运用CiteSpace软件对上述已检索到的389份有效中文文献进行主要关键词的共现分析,共得到276个关键词节点,637条节点连线,以“数据资产”为中心的连线密集且复杂,与其他节点交织连接,说明数据资产的相关研究以“数据资产”为研究核心,聚焦于数据的运用,应用场景广泛。以关键词图谱总结出国内高频关键词分布表,详情见表2。结合频次和中心性可以初步判断,在2022年是国内数据资产相关研究的产出高峰年份,“数据资产”是该研究领域中的核心,频次出现为183次,中心性为0.68,说明以“数据资产”为中心的相关数据要素发展连接密切,国内需求理论和应用场景发展逐渐繁荣。根据国内数据资产的高频关键词和共现分析结果,可将国内数据资产的研究视角分为三个方面:第一,以数据资产的理论探究为研究视角;第二,以数据资产的产生为研究视角;第三,以数据资产的应用为研究视角。通过国内高频词的指引,以共现分析中不同的研究视角为基础,为聚类分析的主题分类提供了参考。

Table 2. Domestic high-frequency keyword distribution

表2. 国内高频关键词分布

4.2.2. 关键词聚类分析

数据资产热点内容一直被国内相关数据研究学者广泛讨论,且国内数据资产正处于发展阶段,资产类型分类众多。因此,如何进行数据资产的主题分类研究对相关数据资产的发展具有重要作用。借助关键词聚类分析图谱,详情见图2。其中此研究的Q值为0.6164,S值为0.8808,聚类结果显著。根据分类的8个聚类主题,将整体聚类主题分为两大研究主题,即数据资产构成和数据资产管理。

数据资产构成该主题中包含的聚类有#0数据资产、#2数据要素、#3大数据和#7数据资源。数据资产构成要素众多,根据现有参考文献进行分类,大致可分成三种类型的数据资产,即个人数据资产、社会数据资产、经济数据资产和企业数据资产。由于数字科技的不断发展,个人作为社会发展中的独立个体,以个人或群体活动为中心的活动与社会生产密不可分,所以相关个人数据资产的挖掘和应用逐渐成为新的热点话题。许宪春等人结合互联网平台的个人数据资产评估实例,对个人数据资产价值链进行整体剖析,重点发挥个人数据资产作为关键生产要素对经济社会发展的作用 [5] 。社会经济数据资产涵盖种类众多,涉及社会生活的方方面面,在此主要研究政府数据。在充分挖掘政府数据资产价值的基础上,夏义堃和管茜对政府数据资产的内涵进行深入探究,构建以“四位一体”的具体要素框架 [6] 。金融数据资产是经济数据资产的重要体现。随着国内数字经济与实体经济的深度融合,金融数据资产的应用逐渐广泛,有效提升金融数据资产的治理能力也成为经济持续健康发展的核心议题 [7] 。企业是数据资产的承载主体,在大数据发展的影响下,传统企业数据资产进行数字化转型升级,如林杰、刘志杰借助大数据,探索出版业新的价值与运营途径 [8] ;王柯元等人创新传统的电力数据交易系统,以区块链技术实现电力系统的交易设计和数据资产化 [9] 。各类数据要素丰富了数据资产的构成,在充分挖掘数据要素潜力的前提下,发挥数据资产的价值建设属性。

Figure 2. Cluster graph of domestic literature keywords

图2. 国内文献关键词聚类图谱

数据资产管理该主题中包含的聚类有#1数据治理、#4价值评估和#6数据管理。数据资产具有潜在价值已经成为普遍共识,而如何进行数据资产的测度已成为众多学者关注的问题。通过总结近几年各学者的研究成果,从已筛选的国内文献中选择具有代表性的文献,按照属性和方法,大致将数据资产的管理形式分为以下几个方面。多属性数据资产管理的形式见表3,主要分类依据是根据数据资产从概念范围确定到价值实现的整体流程,表明国内各学者对数据资产的不同研究方向。从理论基础层面来看,确权理论构成了数据资产管理的研究理论基础,为进一步进行数据资产的价值探索提供了统计与核算依据;从内容方法层面来看,多以传统的评估方法和综合评价方法来拓展数据资产管理的实施路径。

Table 3. Multiple attribute data assets management

表3. 多属性数据资产管理

4.2.3. 时间线图谱分析

通过CiteSpace的时间线图谱可以更加直观的了解研究文献的高频词分布情况,其中图中圆圈的大小代表关键词的发文量和影响力,弧线代表关键词的研究时间跨度。可以将圆圈和弧线作为预测变化趋势的参照点之一,比如在现阶段数据资产及有关数据资产管理相关的概念是学界研究的重点;从时间段中关键词出现的种类和密度,也可以看出相关数据资产的不同研究阶段。

图3的时间线图谱中,可将国内数据资产相关研究的时间跨度分为“兴起期”(2006~2012)、“探索期”(2013~2015)和“发展期”(2016~2023)三个阶段。“兴起期”关于数据资产相关的发文量较少,主要集中于“数据资产”和“数据安全”的理论研究,在此阶段学者们逐渐关注到数据资产的发展潜力;在“探索期”有关数据资产的相关发文量大幅增大,研究主题也愈加丰富,“大数据”和“数据治理”成为该阶段学者研究的重点;“发展期”关于数据资产的研究相对集中,“数据交易”等数据资产的价值实现成为研究重点,目前国内数据资产研究正处于蓬勃发展的阶段。随着数字化技术的提升,数据资产的相关内涵提升及价值实现将会成为未来发展的重点。

Figure 3. Domestic literature keyword clustering timeline graph

图3. 国内文献关键词聚类时间线图谱

5. 国内外数据资产研究前沿方向对比分析

5.1. 研究热点问题对比分析

本文通过对上述国内外数据资产的关键词共现和聚类分析结果进行梳理,可以直观地看出:数据资产管理是国内外学者关注的热点话题,数据治理和数据价值实现是研究的核心主题,近期大数据、机器学习、定价估值等研究热点得到学者们的广泛关注。国内外研究的不同之处在于:国外学者们更注重借助模型和算法对数据资产的价值进行计量研究,而国内学者更侧重于数据管理和治理,特别是数据安全的相关研究;并且对于相同的研究主题,国外学者们开始关注的时间都比国内学者早。这些热点研究发现都为国内外未来数据资产的研究和实践提供了新思路。

5.2. 研究前沿方向对比分析

一个新兴热点的出现可能预示未来的主题发展方向。突现词分析可以识别出主题在时间上的变化趋势,从而把握好研究领域的前沿性问题进行预判分析。在关键词共现分析的基础上,通过运用Citation Burst功能对国内外文献研究的突现词进行分析。在CNKI数据库和Web of Science中各得出15个研究前沿方向,从中筛选出突现强度排名前五的突现词,得到的结果如表4所示。其中国内文献中突现强度排名前五的突现词是“数据要素”、“数据治理”、“数字经济”、“大数据”和“数据开放”,表明通过丰富数据资产的要素构成,以数字经济背景下大数据发展的支持,推动数据治理和数据开放共享是国内研究的前沿方向。国外文献中突现强度排名前五的突现词是“data management”“data valuation”“machine learning”“pricing model”和“big data”,表明处于数据资产管理的情境下,借助大数据和机器学习等互联网技术,对于数据资产的价值评估和定价是国外研究的前沿方向。

综合上述研究对比来看,国内外研究前沿性的侧重点不同。表明国内外的数据资产虽都处于发展阶段,但由于国内数据资产相关研究对比国外发展相对较晚,在明确数据资产相应概念范围的基础上,顺应数字经济时代大数据发展带来的数据红利,以开放共享的数据形态进行数据治理领域的探索研究,并由数据治理为基础进行数据资产的其他计量研究;而对于相同的研究主题,国外的数据资产研究更成熟,且更加注重发挥机器学习等先进互联网技术在数据资产研究中的作用,以此促成了前沿性问题的话题的时间差。因此,由国内外突现词分析的前沿性分析对比,可以总结国内外研究前沿差距,并借鉴其研究前沿性话题,结合国内实际数据资产发展现状,加快国内数据资产的相关研究进程。

Table 4. Analysis and comparison of burst words at home and abroad

表4. 国内外突现词分析对比表

6. 主要结论

本文利用CiteSpace软件,全面整理2006~2023年国内外相关数据资产研究成果,进行可视化分析,得出的主要研究结论如下:

首先数据资产的相关研究一直是国内外学者研究的热点话题,但是针对数据资产研究的侧重点不同。根据国内外文献的关键词结果分析可知,国外关于数据资产的研究主要集中于数据资产管理,借助物联网等互联网技术手段进行数据资产的相关领域探索,并且发展具有一定的层次性;国内的数据资产研究主要从数据资产的理论本身出发,借助一系列计量方法进行数据资产应用场景的拓展研究。

其次数据资产研究热点处于不断演变的过程,可以通过时间变化趋势抓取数据资产话题的前沿研究方向。根据现有文献的突现词分析可知,在阶段内国内外的数据资产研究方向具有一定差异。“大数据”是国内外数据资产研究的重要背景,在未来数据资产发展阶段,国内的前沿性研究更注重数据要素特征范围界定和数据的开放共享,而国外的前沿性研究更注重数据资产的管理,并对数据资产的价值评估和测定进行深入探究。

最后有关数据资产的研究都逐步推动国内外形成各具特色的数据资产发展体系,在不同区域和行业之间充分协同联动数据资产资源,积极推动数据资产相关研究发展。

7. 建议与展望

结合本文的上述研究,为促进未来数据资产的相关研究和实践,提出几点建议。第一,需充分借鉴国外先进的研究成果,结合我国数据资产研究实际,进行相应的数据资产研究创新;第二,注重数据资产的多重应用场景探究,丰富数据资产的实现方式,充分挖掘出数据资产的内在价值;第三,善于运用大数据、物联网等先进数字技术的支持作用,顺应时代的发展要求,充分进行数据资产相关管理的探索。

目前来看,数据资产作为新兴资产,具有挖掘和探索的价值。在这个机遇与挑战并存的数字经济时代,需充分发挥数据资产创新驱动的主观能动性,充分将我国海量的数据资产应用于丰富的应用场景,激活数据资产要素的发展潜能,积极加快数据资产的相关产业部署和发展,从而以数据资产推动我国数字经济的新动能发展,构筑国家新的数据资产竞争新优势。

基金项目

内蒙古师范大学基本科研业务费专项资金(2022JBTD016);内蒙古社会科学基金项目(2022FY04)“国家文化数字化战略背景下内蒙古非物质文化遗产创新性发展研究”;江苏省社会科学基金项目(22TQB007)“数字人文视域下地方历史文献知识服务体系构建研究”。

文章引用

王诗语,曹 玲. 基于CiteSpace的国内外数据资产研究可视化图谱分析
Visual Graph Analysis of Domestic and Foreign Data Asset Research Based on CiteSpace[J]. 运筹与模糊学, 2023, 13(03): 2511-2520. https://doi.org/10.12677/ORF.2023.133252

参考文献

  1. 1. Goldfinger, C. (1997) Intangible Economy and Its Implications for Statistics and Statisticians. International Statis-tical Review, 65, 191-220. https://doi.org/10.2307/1403343

  2. 2. Chris, H. and Dave, W. (2010) Valuing In-formation as an Asset. Journal of SAS, 1, 13-17.

  3. 3. Younan, M., Elhoseny, M., Ali, A.E.M.A. and Houssein, E.H. (2021) Data Reduction Model for Balancing Indexing and Securing Resources in the Internet-of-Things Applications. IEEE Internet of Things Journal, 8, 5953-5972. https://doi.org/10.1109/JIOT.2020.3035248

  4. 4. Attar-Khorasani, S. and Chalmeta, R. (2022) Internet of Things Data Visualization for Business Intelligence. BIG DATA. https://doi.org/10.1089/big.2021.0200

  5. 5. 许宪春, 唐雅, 张钟文. 个人数据的统计与核算问题研究[J]. 统计研究, 2022, 39(2): 18-32.

  6. 6. 夏义堃, 管茜. 政府数据资产管理的内涵、要素框架与运行模式[J]. 电子政务, 2022(1): 2-13.

  7. 7. 张凯. 金融数据治理的突出困境与创新策略[J]. 西南金融, 2021(9): 15-27.

  8. 8. 林杰. 出版产业大数据的价值与运营途径探索[J]. 现代出版, 2017(3): 24-27.

  9. 9. 王柯元, 于雷, 颜拥, 孙毅. 基于区块链的电力数据资产化及交易系统设计[J]. 东北大学学报(自然科学版), 2021, 42(2): 166-173.

  10. 10. 蔡昌, 赵艳艳, 李梦娟. 区块链赋能数据资产确权与税收治理[J]. 税务研究, 2021(7): 90-97.

  11. 11. 许宪春, 张钟文, 胡亚茹. 数据资产统计与核算问题研究[J]. 管理世界, 2022, 38(2): 16-30.

  12. 12. 朱晓琴, 王宣童. 数字经济背景下数据资产评估研究述评与展望[J]. 财会月刊, 2023, 44(6): 78-84.

  13. 13. 陈芳, 余谦. 数据资产价值评估模型构建——基于多期超额收益法[J]. 财会月刊, 2021(23): 21-27.

  14. 14. 侯彦英. 数据资产会计确认与要素市场化配置[J]. 会计之友, 2021(17): 2-8.

  15. 15. 欧阳日辉, 杜青青. 数据估值定价的方法与评估指标[J]. 数字图书馆论坛, 2022(10): 21-27.

  16. 16. 王敏, 袁娇. 数字资产税收治理难点与治理路径创新[J]. 税务研究, 2022(11): 17-22.

  17. 17. 陈华, 李庆川, 翟晨喆. 数据要素的定价流通交易及其安全治理[J]. 学术交流, 2022(4): 107-124.

期刊菜单