数据生产理论——数据资源权利配置的基础理论

一、文章结构

二、文章要点

【本文旨在】为数据时代的数据权利配置提供理论支撑。通过分析数据时代人类知识或智慧生产新方式中数据本身生产利用的新特征,明确数据不是天然处于公共领域的,而是被生产出来的,据此提出数据生产理论。

数据时代(数据文明、数据经济)的标志是数据成为社会基础资源、经济活动的要素,成为比土地、资本、劳动力等更为核心的要素,它被比作“石油”。

若想使公共数据具有利用价值,实现数据的社会化利用,就需要给数据控制者一定的激励,从而驱使数据控制者完成数据的社会化利用。由此产生了一个难题:数据赋权。

(一) 数据的产生:原始数据的生产

1、数据化:数据的生产

数据生产将数据与所描述对象的分离过程(即数据化过程)。本文所称的“数据生产”是指借助计算机系统、网络系统、传感设备等来记录、感知、抓取活动对象或描述对象的行为或变化,再将将特定的对象(描述对象)转化为数字化的信息(数据)的过程。

 

2、数据来源与数据生产的区分

在数据时代,任何数据有且必须有源头,否则就丧失了作为大数据分析的价值,数据有源头,才可用来分析其描述对象、揭示其规律、预测其行为,才可体现出其价值。另外,数据也有时效性。数据会因为时间推移而丧失对特定对象的分析价值,尤其对于时间敏感的数据。当数据不具有分析特定对象的价值时,便会进入公共领域成为任何主体都可以自由利用的数据。但是这样的数据仍然有利用价值,处于公共领域的数据有再次开发与利用的空间。

对特定对象的数字化记录不是天然存在的,因此应当承认数据生产。否者数据加工处理、数据的流通利用秩序就没有起点,整个数据社会化利用的秩序就无从构建。由此,应当区分数据来源者和数据生产者。数据源或数据来源者数据描述的对象(主题)。数据生产者对数据生产做出实质贡献的主体。

在用数据描述自然界、机器设备的情形下,记录存在两种情形:一是对设备之外的物体结构、运行等的记录,此时记录对象和记录设备不同;另一种情形是,数据来源于机器记录本身,是对机器自身运行的记录,此时记录的对象和记录设备本身是一体的。

在传统法律框架下,很难对组织产生的数据进行法律上的保护,除非关于组织的数据落入商业秘密范畴。

3、个人数据的生产:机器(系统)与人的作用

关于个人的数据可以分为两类:第一类,个人的创作。个人可以通过录制、拍摄等创制、创作形成各种数据(不论是否构成作品),均可成为大数据分析的原材料。第二类,特定人因使用计算机和网络的行为过程被网络服务器记录下来而形成的行为轨迹或过程数据。在关于人的数据资源中,大多数数据属于第二类。

(三)数据的加工处理:数据价值的“生产”

数据处理的过程可以分为两类:第一类,汇集性数据处理,即将原始的数据加工处理成为数据分析的材料。第二类,数据挖掘,即分析性处理,经过数据演算分析,为人们提供新知识、新判断,支撑人们的决定。

1、数据汇集处理:数据的生产

数据集的生产是对已形成数据的加工处理活动。数据集是按照特定目的,收集汇聚、清洗整理、分类归集,形成可用的数据资源,使原生态的数据加工成为具有使用价值的产品性数据。

数据集的生产核心目的是从他人处获取关于相同对象或相同主题且足够多的数据。为了达到此目的,需要在承认数据生产者对数据的使用控制权前提下,通过各种共享、交换、许可使用等方式来获取数据。

【从实现价值的角度】数据从“原材料”的变现到“粗加工”后的变现有两种方式,即API接口的调用和数据文件集的生产。以API接口的方式将原始数据变现,拥有巨大用户群体和良好数据采集和归集架构的网络服务商或平台可以采用此种方式。而数据集或数据文件集的生产则是原始数据变现等更普遍的方式。

【从价值产生的角度】数据的收集、汇集、整理等加工处理活动也属于数据的生产活动,它改变的是数据存在形态,这种原材料生产者也需要投入大量物力和财力,其劳动成果也需要得到保护。而这种保护只能通过赋予数据集的生产者对数据集一定的控制能力来实现。

【数据生产(者)与数据集生产(者)】

 

另外,需要指出的是原始数据与加工数据并没有严格的界限,而主要取决于数据的目的或用途及其人工干预的程度。原始数据和产品数据也是相对的,产品数据可以因时间、用途或环境的改变而成为其他数据产品加工的原材料(成为原始数据)。如此,原始数据和产品数据的区分也仅仅具有规范价值。

2、数据分析处理:数据挖掘

在数据经济时代,逐渐形成数据生产者、数据集的生产者(数据汇集处理)和数据分析者的社会分工,而促成这种分工的关键就是数据的流通(为数据集生产提供原料)和数据集流通(为数据分析提供原料)。

(四)数据生产理论

1、数据生产理论的内涵

A.数据生产与数据分析区分理论

【数据分析】指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息并形成结论,从而对数据加以详细研究和概括总结的过程。

【数据生产】为数据分析提供原料,它包括生成描述对象的原始数据和汇集更多有关该对象的数据。

数据分析不是在生产数据,而是对数据进行运算分析,对数据描述对象作精准的判断或预测。

B.原始数据生产和数据集生产区分理论

 

C.数据来源和数据生产区分理论

源数据数据描述的特定对象。数据生产对某对象数字化记录的过程(与描述对象的分离)。

来源于人的数据可分为,人创制和提供的数据和被记录生成的数据。事实上,被记录生成的才是如今大数据(分析)概念中的主体部分。

2、数据生产理论的价值:数据权利配置的基础理论

 

 


责任编辑:马小涵