寻找适合数据特征的数据产权

在具体的数据流通法律关系中,数据提供者是否可以合法处分提供的数据、该数据是否满足特定使用目的(数据质量)、数据流通利用是否安全合规等需要清晰规则2020年初,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》率先在世界上提出:数据是生产要素,这是数据驱动经济运行的中国式表达。近两年之后,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(下称“二十条”)又进一步提出,“构建适应数据特征、符合数字经济发展规律、保障国家数据安全、彰显创新引领的数据基础制度”的指导思想,并提出创新的数据产权解决方案——数据持有权。

“二十条”的发布为产业界带来了希望,在一定程度上,企业数据流通有了法律层面上的预期,但同时也引发不少质疑或不同解读。

在一次会议上,一位计算机教授断言,如果数据按照“二十条”都赋予产权的话,中国永远不会有ChatGPT。如果把数据产权理解为传统产权,这位教授的观点无疑是正确的。问题在于,“二十条”试图超越传统产权思维,寻找适合数据特征的数据产权。因此,正确理解“二十条”中的产权设计,关键在于突破传统产权的固有思维。

一、传统产权原理不适当性

数据确权源于数据社会化利用的需要,但问题是确什么样的权。数据特征决定了,传统产权规则不适用于数据资源。物权规则建立了单一主体对特定客体(资源)的排他支配权,以实现该资源最有效的配置和利用。一方面,单一主体决定和维护资源,能够有效实现资源价值最大化;另一方面,单一主体对客体的支配关系最易判断或公示,建立清晰的产权交易规则,促进资源市场化配置,提升资源利用效率。

但是,这一规则以可占有的有形物为基础,且以排他使用的资源为客体。数据无法以占有方式公示其权利,且属于可同时为多主体使用的资源,不具有适用物权规则的前提。即使数字技术可支撑数据控制,也不宜建立基于先采或加工劳动而取得的数据排他支配权的制度。这是因为,数据是每个社会主体都需要利用的社会性资源,如果给某个在先获得数据的主体以排他性权利,则会妨碍在后的其他主体获取和使用数据。让每个需求者便捷地获得数据,让更多主体使用数据才能实现数据资源社会价值最大化,因而,即使数据可以占有(控制),也不允许建立排他支配规则。

同样,知识产权赋权规则也不适用于数据资源,因为知识产权本质上是保护基于公共信息和知识资源的创新成果,且仅保护创新成果的商业化实施权(或称为专有权)。知识产权既不保护事实,也不允许专有权人控制知识本身(知识产权是以知识公开换取权利),这一原理并不因为数字化而改变。无论作为数字化事实的数据,还是数字化的知识,均不宜纳入现行知识产权保护体系。

“知识就是力量”正逐渐被“数据就是力量”所取代,因为数据可以产生智能和新知,赋能社会经济发展。《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“《数据二十条》”)提出“建立公共数据、企业数据、个人数据的分类分级确权授权制度”,再次引发人们对数据确权的探讨,甚至深圳率先制定办法,探索通过数据登记实现确权的路径。[1]从字面理解,确权是确认权利的归属,即确认某项财产权利归属于某个特定主体。不过,确权需要通过具体的法律机制来实现,最终要落实为具体的法律制度。因而,我们应当在具体的法律制度中理解其含义。确权可以通过诉讼程序实现,最典型的为确权之诉。显然,它是在两个主体对同一财产的权利归属发生争议时,法院依据争议主体所提交的事实(证据)和法律规则来审核和裁判权归谁享有。这样的确权是确认权利归属,而不是《数据二十条》中“确立某类主体对特定数据享有什么权利”意义上的确权。这样的数据确权应理解为数据权利的初始配置。至于授权,只是在法律明确初始权利后,数据权利人的权利处分或行使问题。法律需要做的是如何规范权利行使,防范数据权利人滥用权利。因此,初始权利配置才是法律上的数据确权。

在初始权利配置方面,《数据二十条》的核心思想是:“根据数据来源和数据生成特征,分别界定数据生产、流通、使用过程中各参与方享有的合法权利,建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制。”这一思想也被概括为淡化所有权、强调使用权,聚焦数据使用权流通的“三权分置”的数据产权制度框架。[2]笔者将这一框架总结为“数据资源持有权+数据使用权流通交易”模式。这是适应数据特征的制度创新,是对传统权利制度框架的突破。问题的核心在于如何将这一框架纳入现行法律以构建数据资源持有权体系,尤其是如何理解数据产权的结构性产权分置。

在物仅能为单一主体使用的物权体制下存在保留原权、创设出某种物权性权利的制度安排。典型的如,所有权人可以放弃物之占有使用而为他人创设使用权或经营权,来源于农地制度改革,解决以身份为基础的家庭承包经营带来的规模化经营的特殊问题的“三权分置”并非传统产权的普遍范式。[3]数据可复制或可分享的特征决定了不需要援用传统产权分置理论实现同一数据的多重或多主体利用。最为重要的是,数据与一般物权客体不同,其具有非排他性和非竞争性,而现有产权的制度安排恰恰是以单一主体对特定客体(财产)排他控制和使用为基础的,因而赋予单一主体排他支配权被认为是最有效的资源配置和利用方式。有效配置数据资源的关键是如何理解和设计数据持有权,以体现数据产权结构性分置的目标和理念,形成有利于数据价值最大化实现的数据基础制度。

本文认为,《数据二十条》所提出的数据持有权是契合数据要素特征的一种新产权范式,[4]而所谓的结构性分置是对数据持有权体系化的设想,我们需要从数据初始权利配置的角度,设计体现分置思想的数据持有权体系。数据持有者应当覆盖数据价值实现过程中的不同数据形态,不同主体基于其加工处理而享有权利。为了分析需要,本文将数据划分为原始形态的数据资源(或称“数据要素”)和数据加工使用的产出物——数据产品。数据产品本质上是数据价值的最终实现,严格地讲,数据产品将不再属于数据范畴,而是可直接应用于社会经济中的智能工具或辅助决策的知识或信息。数据要素市场建设的核心逻辑是:通过数据资源的流通利用促进数据产品的生产,通过数据产品的交易带动数据要素化或产品化的利用。在治理范式下,数据产权不是单一主体对特定数据的支配权,而是服务于数据社会价值实现的权益安排,它需要适当的产权运行机制来实现,更需要对数据社会化利用行为加以规范。

二、数据产权的目的:构建数据重用秩序

产权本质上旨在解决资源利用秩序。在过去个体采集数据、分析数据认知客观世界规律的人类智能时代,事实数据的生产、流通也未成为一种独立的经济活动,因此,法律也没调整的必要。在这种小数据时代,任何人可自由采集或获取数据,持有和使用数据,一旦公开就被视为可自由利用的公共物品。但是,在人类进入机器智能时代(大数据时代),数据生产和供给(获取)演进为规模化、有组织的经济活动。如今,主体活动可记录,客观世界可感知,有意或无意生成的数字数据可以被组织汇集起来以揭示数据背后的客观世界的变化规律,预测观察对象的行为,而且,机器需要学习大量数据,才能输出知识或生产出智能产品。由于数字化过程中形成的数据并非天然可用于机器学习,来源多样或在某场景下产生的数据也不一定能够相互匹配或关联,于是,就出现以改进数据可用性、可重用、可互操作性为目的的数据治理。数据治理本质上是数据增值的生产活动,因为每个主体所掌握的数据总是有限的,自我生产和治理并不能形成足够“大”的数据,所以,为训练算法,开展机器学习,就需要获取他人生产和控制的数据。

因此,类似经济制度安排被引入数据生产和供给,数据流通成为支撑智能产品生产或机器智能应用的经济基础。在域外称为数据经济,我国称之以数据要素市场,都是旨在构建数据资源的社会化配置和利用秩序。简言之,数据产权是解决机器智能对大量的可机读、可重用的原始数据的需求。

三、寻找数据产权的适用和价值定位

数据不是普通的经济资源,而是客观世界运行和各主体活动的数字化记录,只是这些记录经整理后可以被用来认知客观世界规律。因此,数据的价值在于认知价值,在大数据分析或人工智能语境下被称为计算价值,即能够被计算机识读、做关联分析(数据挖掘或剖析等)。只有当计算分析形成知识(预测分析、洞见判断等)或智能工具(如ChatGPT),支撑人类各种决策、智慧行动或直接产生智能行为(自动操作)时,才转化为社会生产力,产生社会经济效益。如果将数据的产出物称为数据产品(智能工具和知识输出),那么数据是生产数据产品的要素,而数据产 品是整个社会经济的生产要素。显然,数据要素市场建设旨在最大化实现数据流通或数据社会化利用,以促进数据产品的生产、人工智能的应用来提升社会生产力,

数据转化为社会生产力是一个过程,需要构建数据不断流通利用以发挥其计算价值的产权机制,在“二十条”被表述为“分别界定数据生产、流通、使用过程中各参与方享有的合法权利,建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”。换言之,数据产权是针对数据价值实现过程中不同形态、不同价值的数据,以最大化实现 其社会价值的制度安排。

数据在自然属性上具有非排他使用性,因而,数据是可以被分享的资源,而且分享的越多,社会价值实现越多。同时,作为计算分析价值的数据是短暂的、多样的,这又决定了数据适合分享,只有在分享利用中才能实现其价值。因为数据价值在于不断与更多数据结合和关联,一次数据集合,实现一次数据计算价值;数据产生和应用又具有场景性,因而数据可以跨场景、领域、行业应用,应用于解决特定问题。数据价值多次性、多样性甚或无限性决定了数据不适合由单一主体长期拥有和使用,反而适合持有者短暂地、特定目的使用,赋予持有者以使用权和流通权,即足 以实现持有数据的目的,同时实现让他人(社会)使用的目的。于是,不强调所有,而强调使用;为使用者赋权,构建数据使用权为基础的产权机制以最大化实现数据社会价值,就成为数据基础制度构建的基本设想。

四、数据产权的法律定位

在数据社会化利用任何一个阶段或时点,数据均为特定主体所控制和管理,这种事实管控者称之为持有者。数据产权问题就演变为“持有者应当配置以有何种权利”。前述已否定了传统两种产权模式,同时认为,给予数据持有者以使用权就足以构建数据流通利用秩序。如果认为数据使用可以产生收益,流通可以获得“对价”,那么,就可以将数据持有者所享有 的权利明确分为使用、流通和收益三类权能,统称为“数据持有权”。

由于数据价值实现是动态的过程,数据持有权应当覆盖数据价值实现过程中不同形态(不同价值)的数据,其初始状态为数据资源持有权,而最终状态则为数据产品持有权;在两者之间可能存在不同形态,但是,只要满足具有计算价值(使用价值)和可流通(可重用)两个要件,则都可以承认其持有者地位,赋予和保护其使用、流通和收益的权利。问题在 于,如何在法律上界定持有权,避免持有者基于事实控制形成长期排他支配权,落入传统产权窠臼,这涉及对持有权保护的限度或是要寻找适当权利的正当性基础。

正确地引入和定位这种非传统产权,首先需要承认数据是社会资源。数据源自社会,存在于社会,用之于社会,每个社会主体都有权获取和利用数据认知客观世界,分析交往或交易的对象。数据持有权不能导致数据私有,成为持有者意志支配的对象。如果持有者基于先行采集或加工处理即可以长期独享数据,且谈判交易成为获取和利用数据的惟一途径,就会给社会交往、研究探索等社会活动开展制造人为障碍和交易成本。

显然,持有权不能被塑造成对数据的支配权,而是对其使用数据(创造的价值)的保护。在数据是社会资源的定位下,持有者享有的权利应当限于加工处理或治理创造的价值。数据持有者的权利限于使用者价值(利益)的实现,而不是基于事实控制的长期支配和独自使用。在保护持有者既有使用利益的同时,还需保护其他社会主体获取和使用数据的权利,保持数据开放性或可获取性。

五、数据可获取性的实现

保持数据可获取性和数据的流动性是数据基础制度设计的另一重要目标。在数据成为经济资源、数据生产和治理需要成本的背景下,“数据公开即不受保护”,或者相反的“凡是采取技术手段可爬取的,就可获取”的两种极端都应当受到限制。数据产权设计必须在数据控制(保护数据持有者权益)与保持数据的开放性、可获取性(社会利益)之间求得平衡。

在数据是社会资源的观念下,数据不应闲置,而应当被利用,以最终产生认知世界和改造世界的能力。为解决数据控制与需求间的紧张关系,国际社会存在各种探索方案:在学术研究领域,倡导开放数据(Open data),科研数据的利用应当坚持可发现、可访问、可互操作和可重用,并建立数据目录索引和引用规则;在公共数据领域,建立政府数据开放制度,增 加公共数据的可获取性;在社会数据领域,则推行数据分享 流通(Data sharing)机制,以促进数据在不同主体之间的流动。所有这些促进数据流动的机制所 面临的共同问题是,无偿无条件开放或提供且可供任何人公开自由取用的数据,一般不具有可用性甚至不能用于机器学习;治理好的数据则需要投入或成本,没有投入或回报机制,也不可能开放或提供出可重用的机读原始数据。数据持有权旨在承认数据生产、治理者贡献,激励其向社会供给高质量数据要素。

流通数据就是提供数据供他人使用,既可以是移转数据给接受人,也可以仅提供计算环境或调用端口。流通核心是让人使用数据,而不是移转数据,因流通数据接受者获得加工使用数据的机会。流通是数据进入社会化大生产,实现社会价值的必要条件。在法律上可将数据流通定位于数据使用权的让与,而不是数据本身的转让。在有偿交易下,数据流通可以让数据持有者获益,可以激励持有者对外提供数据。

为了保持数据的可获取性,促进流通,需要相配套的制度设计。首先,应当限制持有者对后续流通的干预,切断持有者对后续加工使用的成果的干预或控制。其次,赋予因流通而获得数据的持有者再次加工使用并取得新数据(产品)的持有权,如此,构建数据价值实现过程的每个参与者以独立的数据持有权,以最大限度促进数据流通利用。这样,在数据价值实现链条上的所有参与者都因加工使用而成为独立的数据持有者,都可以发动下一次流通。最后,还应当给数据持有者施加流通的义务,以避免持有者怠于行使权利,妨碍数据需求者难以获取数据。所有这些均需要法律细化规范予以实现,以使数据持有权的行使纳入法律轨道。 保持数据开放性或可获取性。

六、合规高效流通是关键

“促进数据合规高效流通使用”是“二十条”所确立的数据基础制度的基本目标。因而关键的是,数据持有权是否可以支撑合规高效的数据流通。数据一 旦生成,就会频繁倒手和汇集,因而很难清楚地界分出持有者权利边界;数据的持有也并不能够完全界分出数据上所存在的多重利益;单凭控制、持有本身无法彰显其合法性。因此,还应当明确可流通数据的合法性标准、流通方式、可信和安全流通渠道,以降低数据流通的安全风险。在具体的数据流通法律关系中,数据提供者是否可以合法处分提供的数据、该数据是否满足特定使用目的(数据质量)、数据流通利用是否安全合规等需要清晰规则。一旦这些规则建立起来,那么数据就可以合法、安全和便捷的流通。这些应当是数据要素基础制度和数据流通市场机制建设的主要内容。

七、走向治理范式的数据产权

综上,数据持有权不是传统意义上的产权,不是让持有者自主决定数据的利用,而是在将数据视为社会资源的前提下,最大化实现数据社会价值的一系列的制度安排。作为社会资源持有者,数据持有者在享受数据利益的同时,既负有实现数据社会价值的义务,同时负有保护数据上权益的义务。因为数据源自社会,反映其他社会主体的利益,这在“二十条”中被称为数据来源者利益。比如,当数据关于个人时,就需要在保护个人信息权益的前提下使用数据。实际上,数据上还关涉其他组织、社会、国家的利益,都需要持有者维护和管理。因此,数据持有者需要协同处理数据上各种利益相关者的权益,负有保护数据上合法权益和对外提供数据(开放)的义务,因此,数据持有权是集权、责、利为一体的权利设计。这种权利不是持有者对数据的支配权,而是基于法益保护的促进数据社会价值实现的制度安排。这样的新产权被称为治理范式,既要构建数据重用秩序,又必须保持数据开放性或可获取性。



本文转载自 《中国改革》2023年第3期,感谢作者授权!引用请以刊发版本为准。

责任编辑:马小涵