摘要:在我国,越来越多的地方立法呈现出以公共数据开放替代政务(政府)数据开放的制度趋势。公共数据被定义为公共机构在履行公共管理和公共服务过程中所形成的数据。凡落入公共数据范畴,就应当汇集于公共数据开放平台以向社会开放。但公共数据不是被事先界定的,而应当依据数据开放行为的性质来定义所开放数据的性质,既充分实现数字政府的公共数据服务职能,同时使公共机构所持有的数据资源对接数据要素市场,满足社会对高质量可再利用数据要素的需求。在数据成为生产要素,数据持有者权成为数据基础制度核心的背景下,应当分别确立社会主体、政府和其他公共机构的数据持有者权,以清晰界定数据治理、流通利用的权责边界,从而构建多元的数据开放体系。
关键词:公共数据;数据开放;数据持有者权;数据基础制度
《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》)提出建立公共数据、企业数据、个人数据的分类分级确权授权使用和市场化流通交易制度,并将数据开放明确为流通数据的重要方式。[1]同时,《数据二十条》还提出建立数据资源持有权、数据加工使用权、数据产品经营权等结构性产权分置来构建数据流通利用秩序。这三种数据产权是围绕数据价值形成和实现的过程(即数据生产、流通、使用过程),针对不同数据形态的一种制度安排,本文将其抽象地表达为数据持有者权。
自从2015年《促进大数据发展行动纲要》提出政府数据开放共享,实现基于数据的科学决策政策以来,[2]各地方开展大量的探索,通过专门的公共数据立法或一般的数据条例,[3]探索建立公共数据开放制度。这些地方立法通过建立宽泛的公共数据概念,将政府(包括公共管理机构)和公共服务机构(公用和公益企事业单位)的数据也包括在内,并建立无条件、有条件和不开放三种开放模式。在《数据二十条》分类确权授权使用数据的指导思想下,如何确认公共机构的数据权利,并在此基础上构建公共数据的要素化利用制度以接轨数据要素市场,成为数据基础制度建设的重要任务。本文依据《数据二十条》的基本精神,在对地方立法探索检讨的基础上,做出政府与其他公共机构的区分,分别确认政府、其他公共机构和社会主体的数据持有者权,以此为基础构建符合数据要素特征的多元化数据开放体系。
一、公共数据:公共机构持有的数据资源
“政务数据”一词已经成为我国正式的法律用语,为《数据安全法》等法律所使用,[4]且已被用于国家政务服务平台建设。但是,在地方政府的数据开放中,立法却选择了“公共数据”这一概念,旨在界定公共机构可以向社会提供的数据。换句话说,一旦被定义为公共数据,公共机构即应当向社会提供或具有向社会提供的义务。[5]
在国家层面上,早期涉及公共数据的规范性文件更多指向信息资源。民政部2011年颁布的《国家地名和区划数据库管理办法(试行)》第17条规定:“公共数据是指经筛选并脱密处理的数据,面向社会公众,通过互联网、闭路电话、触摸屏等平台提供相关信息。”[6]显然,这里的公共数据指向可向公众提供并为公众自由使用的政府信息,是按照数据的共用性来定义公共数据范畴的。2016年,国务院发布的《政务信息资源共享管理暂行办法》所定义的政务信息则类似于目前的公共数据概念,[7]只是该《办法》是从政府部门之间数据共享的角度来定义的,更多服务于政府体系内部的共享目的,很难作为公共数据对外开放的制度蓝本。
目前,我国政府数据开放仍处于地方探索过程中,对于所开放数据的三种表述是政府数据、政务数据和公共数据,公共数据是主流。  从地方立法来看,目前关于公共数据定义的基本逻辑是,公共机构在依法履职过程中生成或获取的数据。也就是说,公共数据的定义基本上有两个要素,一是主体,“公共机构”,二是数据应当在主体“履行职责”过程中生成。(如图1)简而言之,系通过以公共机构和履行公共职责来定义数据“性质”,以生成数据作为公共机构“拥有”数据的依据。而在笔者看来,以公共机构履行职责过程中形成的数据是数据归属于特定机构管理的依据,而不能直接界定产生数据的性质。因此,这样的定义本质上是确认公共机构持有其所生成数据的一种定义。也就是说,公共数据本质上是对公共机构持有生成数据控制状态的描述。
(一)公共机构的范畴与数据性质
现行地方立法对公共机构范畴界定不完全相同,大致存在广义和狭义两种界定,狭义的将公共机构限于政府(含授权执行公共事务机构),而广义的除政府之外还包括公益事业和公用事业机构。[8]
2020年出台的《贵州省政府数据共享开放条例》为狭义定义的代表,它将公共机构限定于政府,并称为政府数据。[9]不过,该条例将授权执行公共事业的机构采“参照适用”方式,即法律、法规授权具有公共事务管理职能的组织实施的数据共享开放活动,适用本条例,[10]但是将“教育、卫生健康、供水、供电、供气、供热、环境保护、公共交通等与人民群众利益密切相关的公共企事业单位开展数据共享开放活动”留白,仅规定“依照相关法律、法规和国务院、省有关主管部门或者机构的规定执行”。这给这类机构的数据开放利用提供足够的探索空间。《天津促进大数据发展应用条例》将数据资源区分为政务数据和社会数据,而政务数据限于政务部门“在履行职责过程中制作或者获取的,以一定形式记录、保存的文件、资料、图表和数据等各类信息资源”,而政务部门“指各级政府部门和行政执法机构”。天津市定义的政务数据与贵州省定义的政府数据相近似。该条例将公共机构数据之外的数据定义为社会数据,只是鼓励这些单位向政务数据平台提供数据,用于数据共享和开放。[11]贵州省和天津市的做法与《大数据促进行动纲要》保持一致,[12]不使用公共数据,而仅规范政府数据共享开放,未将公共数据定义延伸到公用事业、公益事业机构(即其他公共机构)。
上海市人民政府2019年10月颁布的《上海市公共数据开放暂行办法》所定义的公共机构包括行政机关以及履行公共管理和服务职能的事业单位(以下统称公共管理和服务机构),[13]只是又设置了“遵照执行”条款将水、电、气、通信等公用事业纳入适用。[14]不过,2021年的《上海市数据条例》则直接将后者纳入公共机构,对公共数据作了较为宽泛定义:“国家机关、事业单位,经依法授权具有管理公共事务职能的组织,以及供水、供电、供气、公共交通等提供公共服务的组织(以下统称公共管理和服务机构),在履行公共管理和服务职责过程中收集和产生的数据。”2022年1月颁布的《浙江省公共数据条例》则将公共机构直接扩张到一切公用事业运行者。条例所称公共数据,是指本省国家机关、法律法规规章授权的具有管理公共事务职能的组织以及供水、供电、供气、公共交通等公共服务运营单位(以下统称公共管理和服务机构),在依法履行职责或者提供公共服务过程中收集、产生的数据。而且明确的规定“根据本省应用需求,税务、海关、金融监督管理等国家有关部门派驻浙江管理机构提供的数据,属于本条例所称公共数据”。
上海市和浙江省代表了最宽泛的公共数据范畴。这样的立法也影响了之后的地方立法,使公共数据界定走向宽泛化,如重庆市、四川省和厦门市等[15]。这些地方立法为了定义公共数据,将主体的“公共性”扩展到了业务公共性,凡是从事公用事业和公益事业的组织所生产的数据皆为公共数据。于是,公共数据的生产主体包括了政府等公共管理机构和从事公共服务的其他公共机构(本文合称为公共机构)。
(二)现行公共数据定义的困境与反思
上述公共数据的定义旨在划定公共机构应当向社会开放的数据范围,一旦被贴上公共数据的标签,数据持有者即具有向社会开放的义务。现行地方立法从数据持有主体的角度而不是从数据性质来定义公共数据。[16]这实质上是按照数据生成或生产关系来界定的,是以业务(行为)性质来界定其产生的数据的性质,而不是按照数据本身的性质或数据重用的目的来界定数据的性质。[17]这一定义造成的问题是,由具有公共性质的业务活动所产生的数据是否都属于公共数据?
笔者认为,地方立法对公共数据的定义是以初始业务的性质定义数据的性质,由于公共机构的业务性质属于公共性质的,因而其产生的数据也当然属于公共性质。这里忽略了一个问题,公共数据是为了界定哪些数据可以向社会开放,或者便于政府推动数据开放,因而其目的是界定数据再利用或重用的数据的性质。以“依法履职过程中”来限定所生成和获取的数据的公共性,似乎并不周延。很显然,公共管理业务和公共服务业务运行过程中形成的数据并不一定适合开放或者作为公共数据开放。
履行公共管理职责或者公用或公益事业服务所生成的数据覆盖到业务运行的全流程和各领域,几乎是这些公共机构“主营业务”。这些机构业务运营生成的数据,也并不都适合开放或定位于公共数据。以政府数据为例,政府在履行公共管理和服务过程中形成的数据至少包括以下类型:(1)来源于社会各主体提供的数据,比如社会主体为获得许可(或项目或资质等)提交的文件资料如申请书、申报书、招投标信息;(2)为社会管理,而采集社会各主体的基础数据,如法人和社会组织登记[18]、自然人户籍登记管理、车辆登记信息[19]等;(3)为实施公共管理过程中形成的地理空间布局、建筑物、设备基本状况信息;[20](4)各类行政执法记录、行政处罚的信息等。这些并非穷尽式列举类型中,除了纯粹地上建筑物或设备的水文地理信息外,几乎所有的公共机构从事公共事务管理的初始数据都涉及管理自然人和法人组织或关联到这些主体,因而这些主体的合法利益自然也延伸到这些数据上。显然,公共机构在从事公共事务管理中形成的数据并不都属于法律意义上公共数据——可以开放给任何人自由使用的数据。
公用事业和公益事业主体所从事业务或提供服务具有社会性和公共性,但这些法人组织在从事公用或公益服务的过程形成的数据也并不都当然属于公共数据。比如,燃气公司拥有组织和个人用气数据,通常包括用户编号、用户地址、用户姓名、当月或年度用气量等;同样,类似的电力公司、水务公司等也拥有类似用户用电量、用水量的数据。显然,这些服务具有公共性,但是这些公共服务生成的数据并不具有公共性,并不是可供任何主体使用的数据。更何况公用或公益事业机构本身是独立的法人机构,所生成数据当然地隶属于该组织管理,应当由该组织控制和依据法律规定进行开发利用。
为了有效地实施数据开放,我国地方探索出有条件开放和无条件开放两种方式,以解决公共数据开放的困境问题。早在2016年《贵州省大数据发展应用促进条例》就创新性提出主动开放和依申请开放。[21]两年后,贵阳市颁布的《贵阳市政府数据共享开放实施办法》明确提出 “应当按照无条件开放、依申请开放、依法不予开放等三类对开放的政府数据进行管理”,[22]2020年的《贵州省政府数据共享开放条例》,将三类开放表述为“无条件开放、有条件开放和不予开放”。[23]一直积极探索公共数据开放的上海市也在2018年9月发布的《上海市公共数据和一网通办管理办法》中,明确将公共数据开放分为无条件开放、有条件开放和非开放三类;[24]同时,这也是2018年《天津市促进大数据发展应用条例》对政务数据开放的分类。[25]因此,不管使用怎样的概念,在数据开放时均面临根据数据的性质或特征进行分类,再区分为不同类型的开放方式的开放流程。无条件开放的数据,是政府主动发布的,置于公开可下载或浏览状态,任何主体可以自由使用的数据,是真正的公共数据。有条件开放则依申请,满足政府认可的条件者才能获取,数据使用者既不具有公众性,对数据的使用也受一定条件约束。显然,有条件开放的数据既不公开,也不开放(限主体),是提供给特定人使用的数据,不能归入公共数据。这说明,在定义了公共数据之后,再实施不同的开放方式与公共数据的目的或性质相悖。
综上,以公共机构履行公共职责或公共服务来定义数据“性质”,本质上是在界定隶属于公共机构的数据,这样的定义与其重用数据的性质和开放目的都存在着逻辑断层。基于此,我们不妨直接将隶属于公共机构的数据界定为由公共机构持有的数据,确立公共机构的数据持有者权。在承认公共机构数据持有者权的前提下,重新探讨以公共机构持有的数据开放性质来定义数据性质。凡是能够落入普惠性公共服务范畴的数据开放,开放数据应当是无条件或自由使用的数据,即是法律意义上的公共数据;而不能纳入普惠性公共服务范畴的数据开放,则应当是有条件开放,而有条件的开放则不再是法律意义上的公共数据,而是受公共机构控制的数据。
二、公共机构数据持有者权的确立
一旦我们将数据理解为生产要素,那么我们就必须按照生产要素有效利用的制度规则对待数据。数据本身又是具有风险的资源,其本身既需要安全控制,又需要合规管理。隶属于公共机构的数据,不管是机构自用、在公共机构之间共享,还是向社会主体开放利用,都需要首先确立公共机构对其生产的数据资源具有某种管理权。[26]本文认为这种数据资源管理权即是公共机构的数据持有者权。
(一)数据持有者权的本质内涵
为解决数据确权和授权难题,《数据二十条》按照价值创造受保护的原理,区分设置了数据资源持有权、数据加工使用权和数据产品经营权,在本质上赋予了数据持有者以数据持有者权,以构建安全有效的数据利用秩序。而数据持有者权不仅仅是社会数据(非公共数据)市场化的产权解决方案,同时也是可以适用于公共机构所生产数据的制度安排,用来构建公共机构数据共享和开放利用秩序。由于《数据二十条》所确立的数据持有者权制度仍然停留在政策层面,还没有进入立法层面,本文这里从法理上探究其法律理念和制度逻辑。
对数据的持有是对数据控制的一种事实描述。与传统生产要素相比,数据要素具有价值多元、利益并存性、技术依赖性等特征,数据的价值又在于流通利用,这一切都离不开控制。虽然控制数据并一定享有权利或不等于享有权利,但是控制是主张数据权利的基础和前提。持有是对特定主体与特定数据之间事实控制关系的描述。“持有”在物权法体系中表示临时占有物的一种状态,而“占有”则属于具有物权推定效力的事实。为了避免与既有的物权占有制度混淆,《数据二十条》选择以“持有”来表述数据实际控制状态。将“持有”应用于数据资源管理和价值实现实践,可以恰当地表示在其控制和使用过程中对数据管理、控制的含义。这里的控制既是积极利用和获取利益的前提,也有对数据使用的安全和合规性负责的含义。这表明数据持有者应当履行数据安全管理和控制数据风险的义务,包括自己使用和流通利用数据的风险。为了构建数据资源社会化利用的秩序,国家则首先需要维护数据的安全秩序,而不是确立某种数据权利。在这个意义上,数据安全是数据持有者必须履行的公法上的义务。[27]
数据安全管理既是履行公法义务,也具有私法效果。一方面是维护数据持有者权益的工具。数据持有者对数据的安全措施,可以实现对获取数据的控制,防范他人非法获取,使其事实上控制数据,为己所用(安全管理)。另一方面,数据安全管理也是维护数据上各种利益的必要措施,防范数据泄露和数据滥用导致侵害他人权益、社会公共利益的风险(合规管理)。因此,安全和合规管理是数据持有者利用数据的自我管理措施,遵守法律,维护数据上的权益贯穿于数据获取、存储、分享和使用整个过程,成为数据资源转化为可用数据资产的前提条件。在这个意义上,数据安全和合规管理义务形成数据利用的第一道秩序,使数据持有者成为数据的责任主体,也是数据持有者享有任何私法上权利的前提。
数据安全管理维护的是数据利用秩序。数据持有者对所控制的数据是否应当享有或享有怎样的权利,涉及数据持有者与其他人及其整个社会的关系。我们需要寻求赋予任何权利的正当性,而不是仅凭事实控制即享有支配性权利。事实控制(或安全措施)并不当然产生法律上的权利,数据持有者享有的权利依赖法律明确规定。在数据生产、流通、使用过程中,个人、企业、政府、社会、国家等相关主体对数据有着不同的利益诉求。数据上可并存多重利益,数据持有者权并不能消灭数据上承载的合法利益。[28]  面对数据边界界定和成立单一的排他性支配权赋权困境,《数据二十条》提出淡化所有权、强调使用权,聚焦数据使用权流通数据的数据产权新思想, [29]  构建“数据使用权交换和市场化流通” [30]的数据基础制度。在笔者看来,数据持有者所能够享有的权利是基于事实控制的使用权,数据持有者可以通过转让数据使用权、许可他人使用(访问、计算等)、授权他人经营(创设经营权)等方式实现数据的流通利用。
由于数据来源于社会各主体,亦为各社会主体所需要,具有显著的社会性和公共性,一个良好的数据基础制度设计还必须保持数据的开放性或可获取利用性,以激励创新,充分实现数据要素价值。因此,基于事实控制的持有权也不能绝对化、持久化或者变相成为排他支配性质的权利。为此,数据持有者享有权利的前提除了取得和控制数据具有合法性外,还必须对数据进行加工处理,创造价值,以寻求法律保护其利益。对合法取得数据进行加工处理,创造新数据价值或添附了新价值,成为持有者处分其加工后数据的权利的正当性基础。单纯的控制或持有并不享有赋予保护实现该利益。[31]从本质上来看,数据持有者享有的使用权不是单纯对数据事实控制的保护,而是对持有者所创造价值的保护。
(二)公共机构的数据持有者权
如前所述,数据持有者的权利配置旨在构建数据的重用秩序,实现数据社会价值(数据资源社会配置效率)的最大化。包括公共机构在内的任何社会主体生产的数据只要能够用于分析客观世界规律,都可以成为生产要素。而且由于公共机构从事公共管理和公共服务,因而其产生和汇集形成的数据是社会最基础数据资源,具有普遍的社会需求。因此,公共机构也能成为数据要素市场的供给者。从20世纪90年代起,国际社会即开始提出以政府数据开放促进数据再利用。[32]  《促进大数据发展行动纲要》提出“推进数据资源向社会开放”“推进数据汇集和发掘,深化大数据在各行业创新应用”思想。如何构建政府数据开放基础制度,使政府或公共机构成为数据要素的供给者就成为制度设计的关键。
在语义上,“开放”与“封闭”相对,基本含义是解除封锁或限制。“开放”一词应用到数据领域,其基本含义为允许他人访问、获取、使用数据。数据开放被定义为“面向社会提供具备原始性、可机器读取、可供社会化再利用的数据集”。[33]在数据为生产要素的背景下,开放在经济学上可被理解为生产要素(资源)的供给行为,在法律上可理解为让与使用权或许可使用的行为。现在一般笼统地称之为提供数据的行为,提供数据者称为数据提供者,而接收数据者称为数据接受者(亦即使用者)。数据开放需要构建数据提供者与使用者的数据利用秩序,这不仅仅是因为它是一种数据资源流通利用关系,涉及对数据使用者使用行为的限定(甚或支付一定费用),而且是因为数据本身是有风险的资源,数据提供者需要控制数据流通的风险,使风险可控制,责任可追溯。因此,在生产要素视角下,数据开放是公共机构的一种经济活动或“交易”关系,应当在公共机构的“控制”之下。笔者曾撰文指出“数据开放规则的基础是承认数据持有人对数据的事实控制权”。应当“确认公共机构对公共数据的管理权”,“作为公共数据管理人,公共机构有义务开放数据,也有义务维护和管理好公共数据的利用秩序,而这些都以明确其权利为前提”[34]。这里的公共机构对其生产的数据的管理权实质上就是公共机构的数据持有者权。
公共机构的数据持有者权旨在明确公共机构的合法数据使用权,以推动公共机构参与数据市场培育,构建公共数据重用秩序。各地方立法探索中,对公共数据的定义基本上是从隶属于公共机构的数据的角度定义,其本身是对公共机构数据持有关系的确认。为实现数据共享和开放利用,公共机构首先也要依法开展数据安全和合规管理。《网络安全法》《数据安全法》《个人信息保护法》等法律均适用于公共机构和社会主体,只是安全责任的范围和内容略有差异。比如,《数据安全法》第6条是专门规范政府部门的安全责任及其分工,第8条则是对所有数据处理者的安全和合规义务的原则性规范,[35]第四章数据安全保护义务,亦是一视同仁地适用于包括公共机构在内所有数据处理者。因此,公共机构亦像其他社会主体一样,应当履行相应的安全管理义务,维护数据上合法权益和安全有序利用秩序。
(三)公共机构数据持有者权的制度价值
公共机构的数据持有者权与社会主体的数据持有者权差异主要在于公共机构(业务)的性质会对数据持有者权产生影响。从事公共管理和公共服务的机构只能在法律明确规定的职权或职责范围内行使所持有的数据资源管理权,以实现法律规定的目的,而社会主体在法律限定的范围内享有自主行使数据持有者权,实现各种利己目的。这一差异主要源自公法与私法的基本理念不同,在公法领域,法无明文不可为,而在私法领域,法无禁止皆可为。因此,受公法调整的公共机构,其所谓的数据持有者权,仅能在法律规定的目的或用途内行使权利,超出该范围即是违法。这种数据持有者权本质上就成为了公共机构依法律规定的目的而行使的资源管理权。
确立公共机构数据持有者权的意义在于明确数据资源的管理职责,使每个公共机构生产的有用的数据资源具有明确的责任主体,在确保数据资源安全管理的前提下,使其要素价值得到充分发挥。从现行法律来看,公共机构的数据的要素价值主要体现在以下三方面:其一,以数据支撑本部门决策,提升管理绩效和服务质量与效率。构建灵敏的数据采集和汇集架构,采取机器学习等智能手段分析数据,成为公共机构提升治理能力和服务效率的新手段。每个公共机构都应当充分运用数据智能,建立“用数据说话、用数据决策、用数据管理、用数据创新”的管理与服务机制,实现基于数据的科学决策。[36]同样,数字化也改变公共服务提供方式和质量,为各种公共服务提供便利高效的手段。其二,通过数据共享推进公共机构的科学决策能力、治理能力现代化。数据要素化还体现于,通过政务数据共享,支撑整个政府的智能决策,推进政府治理体系与治理能力现代化,进而提升整个社会资源配置管理和利用效率。其三,通过数据开放支撑社会经济创新和高质量发展。公共机构所生产和持有的数据具有明显的社会性、公共性,是整个社会智能化运行的基础数据,公共机构持有的数据向社会开放,与社会各行业数据汇集融合,可以支撑各行业和主体智能决策,产品和服务创新,形成社会经济发展的新动能,构建国家竞争新优势——数据生产力。
无论是提升各自智能决策和管理水平,还是机构之间共享、对外开放均需要各公共机构承担数据资源的管理职责,将数据治理成为可用、可再利用的数据要素,充分实现其要素价值。治理数据或管理数据就成为数字时代公共机构的一项新职责和新能力,成为提升政府社会治理能力的基本要求。每个公共机构都需要按照统一规范、标准和流程治理数据,实现数据汇集融通,实现跨层级、跨系统、跨部门、跨地区共享,同时对接社会需要,向社会提供可机读、可再利用的数据要素。[37]这样数据治理工作首先要界定数据持有边界,分清各自的职责,并在此基础上实现统筹协调,对既有的公共机构管理按照数据治理要求进行组织架构、业务流程、管理机制调整,以适应以数据为核心资源的综合治理体系,精准计算和高效配置各类数据资产,应用于行政管理、公共服务、经济社会发展等领域。而支撑这样数字政府形态的就是构建以数据持有者权为基础的基础制度,在此基础上形成公共机构治理数据、使用数据、管理数据、流通(共享和开放)数据的能力。为了与社会主体数据持有者权相区分,建议将公共机构的数据持有者权称为数据资源管理权。数据资源管理权本质上是数据持有者权,只是需要严格依据法律规定目的、流程等来行使数据持有者权。这样,我们就可以以公共机构的数据资源管理权来构建多元的数据开放体系。
三、基于公共机构数据持有者权的多元数据开放体系
确立公共机构的数据持有者权,以此为基础构建公共机构的数据开放利用体系,意味着改变地方立法先界定公共数据、再构建数据开放制度的惯常做法。简言之,就是在法律明确公共机构对其形成的数据资源拥有相应持有权的前提下,按照数据使用目的或用途来确定开放数据的性质及配套的开放机制,以最终形成多元化的数据开放体系。
(一)数据开放二分:数据公共服务与数据要素供给
正如本文前述,关于公共数据开放的地方探索将数据开放定位于数字时代的公共服务,[38]而立法为推进这项公共服务,定义了宽泛的公共数据,将所有从事公共服务(公用和公益事业)的机构在履行公共服务过程形成的数据视为公共数据,以支撑、推进公共数据开放事业。提供公共服务需要公共数据,公共数据支撑公共服务,因而,公共数据的定义、数据开放的定位都与公共服务有着密切的联系。从发展源流上来看,我国公共数据定义受到了国际社会“开放数据(Open Data)”运动的影响。开放数据中开放(Open)一词源自知识共享或知识开放运动,[39]意味着任何人都可以出于任何目的自由访问、使用、修改和分享(最多只需遵守保留来源和开放性的要求)开放数据和内容。《国际开放数据宪章》认为,开放数据(Open data)是指向公众提供的数字数据,它在技术上和法律上可以为任何人在任何时间和地点进行自由地使用、再使用和再分发。[40]在政府数据开放运动中,多援用了这样的开放数据概念,认为政府应当向社会提供开放政府数据(Open Government Data),并视为政府在数字时代的新型公共服务。[41]
公共服务往往被理解为是由公共投入的政府行为。[42]但在现代社会,更科学的是将公共服务分为基本公共服务和非基本公共服务。[43]政府仅对基本公共服务承担保障供给数量和质量的主要责任,引导市场主体和公益性社会机构补充供给,而非基本公共服务是在政府引导下由公益性社会机构或市场主体多元主体供给。《国家基本公共服务标准》基本限定了政府基本公共服务范围,[44]而非基本公共服务仍然呈一定开放性。不过,非基本公共服务也应当具备普惠性(即普惠性公共服务),[45]而普惠性则是从产品或服务的受众的开放性、大众性、平等性来判断的。在这个意义上,私主体或市场主体也可以提供公共服务,一旦其生产产品或服务可以以普惠性的价格为社会公众直接接受,仍然属于公共服务。这意味着,公共服务与主体性质无关,而与产品或服务普惠性有关。
在数据成为生产要素的情形下,我们应当按照这样的逻辑来区分和定位公共机构的数据开放,将无条件数据开放定义为基本公共服务,而将有条件数据开放定位于非基本公共服务(如表1)。当数据是为社会公众所需且也适宜公开让社会主体自由获取和使用,就应当将数据作为公共产品,向社会无偿提供。它应当成为政府在数字时代的一项基本公共服务。当向社会提供数据设置条件时,如限制获得主体、使用条件甚至收取费用,就不再是提供公共产品,不属于基本公共服务。此时,虽然数据使用可能导致创新、效率提升,最终改进社会福祉,体现数据的社会价值,但因数据使用者属于少数或特殊群体,数据使用直接目的服务于组织的业务目的,就不能视为应当由政府提供的基本服务,也很难将该数据定义为“公共数据”。相反,有条件开放是使用受控性质的提供数据行为,本质上属于《数据二十条》的“流通利用”行为。将其定位于非基本公共服务,使政府可以通过授权运营方式,使公共机构持有的数据资源可以接轨数据要素市场,使政府成为数据要素的重要供给者。依据这样的界分标准,公共机构持有的数据既可以作为公共数据向社会提供,亦可以作为非公共数据向社会提供。前者落入数字政府新增的公共服务范畴,后者则使政府合法地向数据需求者提供公共机构所持有的数据,满足大数据时代各社会主体对数据的日益增长的需要。[46]
数据开放的二分理论是建立在原始数据和原始数据分析结果二分基础上的。原始数据基本上是存储在特定系统中,标准化的可机读或机器学习的数据,具有受控使用特性;而原始数据关联分析或机器学习的结果转化可公开发布和传播的,亦可为人识读的信息。在笔者看来,能够满足大众消费(使用)的只有信息或知识,信息或知识经过大众学习和传播转化为人类智慧,形成社会生产力。而作为产生信息或生产知识的要素的原始数据,并非所有的社会主体都有这样的需求和转化能力,因而不适合公开的自由使用方式(这样的使用方式存在较大风险),只有在一定制度安排下,流通、汇集、融合以支撑机器智能或人工智能。我们也并不因此否定无条件开放的信息资源的要素性——对社会生产力促进作用,只是原始数据更加基本,是支撑机器智能的关键生产要素。
(二)基于公共机构数据持有者权的数据开放机制
上述两类数据开放的思想不是对地方立法探索的否定,而是对地方探索做出更符合法律逻辑的解释。这得益于《数据二十条》提出数据资源持有权和公共数据确权授权开放的思想。现行地方已经提出公共数据可以有条件开放,并提出公共数据的授权运营机制,而《数据二十条》进一步提出“有条件有偿”的数据开放,这为公共数据接轨数据要素市场或者公共数据市场化利用提供了极为重要的供给制度路径。但是如前所述,若事先将公共机构持有的数据定位于公共数据,将公共数据开放定位于公共服务,将会为公共机构持有数据接轨数据要素市场设置理论障碍。与之相反,若按照开放的行为性质来定义开放的数据性质,使得公共机构可以在做好数据公共服务的同时,可以向社会提供可机读、可再利用、可供机器学习的高质量原始数据,以满足日益增长的数据要素的社会需求。问题在于,如何解释公共机构因履行公共职责(管理或服务)产生的数据可以作为非公共数据而接轨要素市场。回答这一问题的关键是公共机构在从事公共管理和服务过程中所形成的数据是否应当作为公共产品(或公共服务)向社会提供。
在笔者看来,无论政府等行政管理机构还是公共服务机构,只要提供数据的行为仍然是传统公共服务的延伸,那么应属于公共服务范畴;如果提供数据的目的超越原来公共服务的目的范围,那么就必须重新评估该提供行为是否应当是满足公共服务的目的。本文之所以提出数据开放二分理论,就是因为公共机构在运行过程中会形成两类有价值的“数据”。一类是信息资源,即公共机构在履行公共管理和从事公用或公益事业过程中形成关于公共管理或服务业务的基本信息、统计报表等。这些成果属于公共管理和公共服务本身的自然延伸,因其为公共业务性质,因而其产生的成果自然应当作为公共服务的一部分或延伸而向社会公开提供,供全社会自由使用。另一类为原始数据,即为公共管理和公共服务运营所生成的支撑管理和服务业务的事实数据。这些数据在公共管理和公共服务中的直接使命已经完成(如支撑公共业务运营,产生业务成果),作为“副产品”,[47]这类数据开放的目的则是为了更多地满足数据社会价值,为社会主体重用或再利用,这种再利用已经脱离了原始业务目的范畴。[48]不仅如此,这些原始数据本身并不是天然可用的资源,还需要进行加工处理(即数据治理)才能形成有用的或可再利用数据产品(亦被称为数据资产),成为可开放的数据。在这个过程中,不仅仅要对原始数据进行分类、清洗、汇集、标注和必要格式转换等,使数据转化为生产要素(即要素化),还要对数据处理和流通利用的全过程实施安全和合规管理,以便防控数据开放利用的风险。[49]而所有这些不仅需要巨大的资源投入,而且其本身是专业性生产活动或经济活动,需要配置相应的权利以给予必要激励,构建对外提供(开放、共享、流通交易)的秩序。[50]由此可见,原始数据的对外提供(开放)并不是原始公共业务的延续,不能简单地落入既有公共机构业务性质范畴。因此,我们不能因为原来业务属于公共服务,所产生的数据也当然地作为公共产品提供,还要重新定位或评估开放数据行为的性质。
因此,公共机构持有数据的开放应当根据数据使用目的或普惠性来定义其数据开放的性质,再根据开放的性质界定开放的数据的性质。前述的二分理论实际上就是按照这一逻辑定义数据开放,将可为公众自由使用的信息资源的开放纳入无条件开放,开放出不受限制使用的数据;而将原始数据的开放界定为有条件开放,按照社会主体对数据的需求,提供特定需要、使用特定数据,实现特定目的。这样数据开放本质上属于满足特定需求交易行为,因而可以按照依据情形设定条件和收取相应费用。之所以要设置条件,最为重要的理由是控制数据的风险。因为原始数据的风险远高于分析利用形成的结果(信息或知识)风险,而数据风险不仅源自于数据本身(比如隐私风险、国家安全),而且更来自数据的使用,尤其是流通(包括开放)利用。因此,应当允许公共机构选择适格的数据使用者,建立相应信任和约束机制,以使开放的数据风险可控,责任可追溯。
收费(有偿)并不是公共机构持有数据开放的条件,而是有条件开放项下解决数据治理成本问题的一项策略。有条件的数据开放亦可以不收费,亦可以收费,这取决于数据开放性质。一旦公共机构开放的数据存在普遍需求或者直接的公益目的需求(比如基础教育、慈善事业等),可将开放定位于普惠性公共服务,可以由国家财政(公共资金)投入和运营数据开放,免费向社会提供。如果国家财政不能承担数据治理和开放的运营成本,需要引入社会资本运营,承担数据治理和对外提供的管理运营成本,那么亦可以将其定位于非基本公共服务,收取一定的运营成本费,以增强其普惠性。比如,政府持有的人口户籍、组织登记、地理信息三大基础数据库数据,即可以采取这两种开放政策(选择收费或不收费)。当数据受众不具有普惠性、大众性,而限于特定行业、特定主体,或者用途不具有公益性而是商业目的使用时,则公共机构持有的数据开放则应当采取有偿原则,按照市场规则运营。
因此,一旦我们承认公共机构持有数据资源,数据资源开放不再按照公共机构初始业务性质定位原始数据开放,而是按照数据作为生产要素的再利用性质定位数据开放,那么数据开放就应当在确立公共机构数据持有者权的基础上根据开放行为的性质,来选择数据开放运行机制。若数据开放可以视为非基本公共服务,那么可以选择 “有条件+有偿”或“有条件+无偿”;若数据开放不具有普惠性,不能视为非基本公共服务,那么数据开放应当纳入市场化的方式。这样的定位是符合广义公共机构持有的数据的要素化和市场化利用制度需求的。为此,我们还需要分离作为公共管理机构的政府所持有的数据和公用或公益企事业组织等其他公共机构所持有的数据,为不同数据持有者配置不同权利,设计多元化的开放机制。
(三)建立多元化的数据开放机制
为了推进和扩大公共数据开放,地方立法将公共服务机构(公用事业和公益事业的企事业组织)的数据纳入公共数据。而在数据成为一种经济资源或生产要素,在《数据二十条》明确公共数据可以确权授权实施条件有偿开放政策背景下,笔者认为我们应当区分政府的数据持有者权和其他公共机构(公用或公益企事业组织)的数据持有者权,采用不同数据开放(提供数据)行为,加上一般社会机构的数据持有者权,三类主体数据持有者权的区分可以构建适合数据特征和数据要素化利用规律的数据基础制度。
1.基于政府数据持有者权的数据开放
政府是专门生产公共产品,承担公共管理职能和基本公共服务职责的公共机构,因而政府向社会提供的服务一定是均等和普惠性的,且以无条件和无偿为原则。随着政府社会管理日益数字化,数字政府亦成为现代政府基本运行模式,其中很多公共服务也都以数字化方式提供,同时也不断扩大公共服务的类型和范围,比如数字社区居家养老、智慧出行、数字阅读等生活新图景和便民措施,而政务信息资源开放亦被认为是数字政府的一项新的基础公共服务,应当无条件和无偿向社会提供。在当前公共数据开放实践中,所开放出来的数据基本属于可公开为大众使用的信息资源。此类数据开放可以视为既有公共服务在数字时代的延伸,纳入基本公共服务范畴。
但是,可机读、可再利用的原始数据开放并不当然属于既有公共服务的自然延伸,而是一种向社会提供的新服务,这种服务的性质需要根据数据受众是否具有普惠性来重新评价,并且也要考虑数据治理(要素化)和运营管理的成本。从现在数据开放的实践来看,此类数据开放宜定位于非基本公共服务,可以设置获取者条件并可以收费,除非某些数据的开放被定位于普惠性服务,由财政支撑所有的运营成本。由于政府不能有经营行为,所以要实现有条件和有偿的政府数据开放,就需要以授权运营方式,通过引入社会资源将政府持有的数据要素化,并对接社会需求,按照政府调控的价格向社会供给数据。[51]因此,在确认政府的数据持有者权的基础上,还要有科学的授权运营制度,使政府持有的数据能够合法安全地提供给社会,政府成为数据要素的供给者。[52]
综上,承认政府作为数据资源持有者享有数据持有者权的意义仅在于使得政府可以具备授权适格机构运营数据开放并管理数据开放的权力基础,得以使政府的数据最大化实现社会价值的同时,确保数据开放利用的安全和合规,并最终使全体人民能够分享数据开放的红利。显然,只要承认政府对数据资源的管理权足以实现该目的,通过将公共管理活动延伸到对数据资源的管理,即可以通过授权运营的方式实现政府所持有数据要素资源的有效供给。
2.基于其他公共机构数据持有者权的数据开放
在本文中,其他公共机构即是地方立法中公共服务机构,一般指医疗、教育、供水、供电、供气、通信、文旅、体育、环境保护、交通运输等公共企业事业单位。显然,这些企事业单位在提供公共服务过程中收集、制作的数据并不一定都是公共数据,更不是可供全社会主体自由使用意义上的公共数据。为了更准确定义,《重庆市数据条例》开始以“涉及公共利益”来限制其他公共机构生产的数据。[53]《厦门经济特区数据条例》甚至将其他公共机构生产的数据直接分为公共数据和非公共数据两类。[54]
本文否定以业务性质来定义数据公共性,并认为只有无偿无条件开放的数据才满足公共数据性质,因而在允许政府数据有条件有偿开放政策背景下,将其他公共机构的数据纳入公共数据已经没有太大意义。正因此,笔者认为应当承认其他公共机构独立的数据持有者权,赋予其自主开发利用其产生数据资源的权利,同时施加向政府提供公共基础信息的义务,从而在实现数据资源自主处理的基础上,也可以为政府提供实现公共服务目的所需要的基础数据。
应当承认,无论立法表述,还是政府或立法者本义都不是要将其他公共机构所持有的全部数据纳入公共数据的范畴,而是以支撑开展数字时代的各类公共服务为根本目的。最为直接的是为实现“一网通办,一网通管、一网协同”的基础公共服务,需要打通各部门和各领域数据,实现互联互通、智能化应用数字底座或数据基础设施。这就需要接入医疗、教育、供水、供电、供气、通信、文旅、体育、环境保护、交通运输等公用和公益企事业单位的数据。显然,政府从事公共管理和服务需要采集这些行业的基础数据是非常正当的,这是从事公共服务的企事业单位应尽的社会义务。不过,将其他公共机构所持有的数据纳入公共数据范畴还应当具有更深层的制度目的,即支撑政府新的公共服务活动——数据开放。所开放的数据被定位于社会可再利用的原始数据,而政府又依赖于各行业社会主体(包括其他公共机构)所提供的各种原始数据,才能形成公共管理和公共服务所需要的数据集。因此,地方立法就探索出前述先定义公共数据,将公共数据汇集到统一开放平台,再由政府实施开放的制度方案。
这样的方案存在两个问题:一方面,其他公共机构是独立的法人,对于各自运营形成的资产享有所有权。在数据成为生产要素,可以转化为资产的背景下,其他公共机构自然成为其生产的数据资源的持有者,享有资源持有权,自主使用(包括开放)。将这些数据直接界定公共数据,提供给政府再向社会开放,这是对其他公共机构资源持有权或使用权的侵犯。另一方面,数据开放是提供可再利用数据,从原生数据到可再利用数据需要数据治理,且要根据产生场景、过程等开展校对验真、语义标注等。一旦脱离原始生产环境,数据治理变得异常困难或成本无限增加。在未明确治理责任的情形下,将数据汇集到统一平台,再实施开放,就会出现治理难题。谁是这些数据的开放(提供)主体,谁对这些数据的质量和合规性负责,谁承担治理的成本等,将成为公共数据开放亟待解决的问题。其他公共机构数据持有者权的确立需要我们承认其他公共机构的数据持有者权和管理权,并在此基础上破解这些难题。按照《数据二十条》的“谁投入、谁贡献、谁受益”原则,应当以“谁投资数据治理,谁持有和决定流通利用,谁受益”来构建数据开放利用秩序,在确认其他公共机构数据持有者权的基础上,施加数据开放义务,使其成为数据开放的责任主体,允许其自主对外开放数据,包括通过政府的开放平台。这也意味着其他公共机构除支撑政府的数字化公共服务外,不再作为公共数据开放的主体或者承担政府开放数据的义务。虽然如此,并不是减轻其他公共机构的数据开放义务,而是强化其开放义务,尤其担负起提供非基本数据公共服务的职责,为社会提供更多更高质量的数据要素。
最后,按照本文的思路,数据具有社会性和公共性,作为非公共机构的一般社会主体也具有开放数据的义务。[55]不过对于社会主体而言,除非法律施加明确地向社会无偿或无条件开放数据义务,如何向社会提供数据应当是数据持有者根据自身意志所决定的事项。对于其他公共机构而言,其本身肩负着公共服务基本职责,因而有义务在传统公共服务范围内提供信息服务或者数字化提供公共服务。这样,其他公共机构向社会(通过政府汇集)提供公众需要或者向政府提供基本公共服务需要的数据,就是这些机构既有公共服务的延伸,是应尽的义务。只要法律予以明确,这些机构就应当免费无偿提供。但是,如同政府一样,这些机构生产的数据并不一定都是或适合满足公众需要、可自由使用的数据,对于那些没有这样的共用性、公益性的数据,则应当由这些公用公益企事业单位自主决定,行使数据持有者权。由于其他公共机构本身是独立的法人,有独立资产,且不属于公权力机关,因而没有必要将其数据持有者权称为数据资源管理权,而应当直接称为数据持有者权。为满足政府向社会提供基本公共服务所需数据,只要在法律中明确这些公用公益企事业单位的公共数据提供的义务即可。
另外,不仅其他公共机构具有向社会开放数据的义务,而且一般社会主体也具有这样的义务。因为每个组织都是一个社会存在,社会需要基本公共服务和公共管理,政府为实施公共管理,提供基本公共服务,需要社会主体提供满足公共利益所需要的数据。为此就需要向社会主体施加向政府提供满足公共利益需要数据的义务,但应当严格限定于公共利益目的或基本公共服务需要。对此,本文不再赘述。基于上述,本文试图构建三类数据持有者权,即政府的数据持有者权(即数据资源管理权)、其他公共机构的数据持有者权和社会机构的数据持有者权,在承认这三类主体都享有数据资源持有者权的前提下,分别施加不同的数据开放义务,设计差异化的数据开放方式和机制,构建多元化数据开放利用体系,实现全面数据开放的制度愿景。
结论
数字技术不仅赋能人类处理和驾驭信息的能力,而且使人类具有利用原始数据的能力,这便是通过机器发现数据背后所蕴含的客观世界的规律,预测趋势的能力。数据日益成为有价值的资源,在我国将其表达为生产要素,《数据二十条》提出了以数据持有者权为核心的数据基础制度,以构建数据生产、流通和利用的秩序,激活数据要素潜能,增强经济发展新动能,构筑国家竞争新优势。问题的关键在于这样思想如何贯彻到公共机构生产和控制的数据当中,以衔接地方立法中形成的公共数据开放制度体系。本文认为,先界定公共数据,再对公共机构施加以开放义务,构建不同类型的数据开放体系不仅在逻辑上存在断层,而且在实施上存在困境。从本质上来看,公共机构所生产的数据,无论是公共机构自用(提升部门或单位智能决策能力和公共服务能力)还是共享(提升整个政府部门治理能力和效率)和开放(流通数据以赋能社会),都需要承认公共机构的数据持有者权,然后根据数据目的或用途定义数据开放(提供行为)的性质,再由数据开放的性质定义数据的性质。依照这样逻辑,只有开放出来供全社会自由使用的数据,才是真正意义上的公共数据。
实际上,在数字政府建设的背景下,政府(及其他公共机构)能够开放的公共数据一方面包括了其数字化运营所形成的可开放的信息资源,这样的信息资源可以纳入基础性公共服务的范畴;另一方面也包括了其机构运行所产生的原始数据,这些原始数据并非直接能够对外提供使用,需要治理之后才具有再利用价值,而且对这样的原始数据的利用需求并不具有普遍性,存在明显的行业和技术能力限制。同时,原始数据对外提供需要控制风险,这导致数据提供者与接受者之间存在可受调控的数据使用关系,而不是公开之后成为可自由使用的数字化信息。因此,原始数据的开放一定是有条件且受控制的。原始数据的对外开放已经脱离公共机构的初始业务目的,初始业务的公共性并不当然地导致公共机构将所生产的数据应当无偿提供给社会再利用于其他目的,特别是商业目的。我国目前地方立法提出有条件开放已经初步意识到这一问题,以使公共数据开放不完全等同于域外开放数据。《数据二十条》也明确公共数据可以有条件有偿开放更加强化的数据作为生产要素的供给特性。因此,公共机构的数据资源的有条件开放应当定位于数据要素供给行为,应当按照经济规律来设计开放制度机制。可行的方案是将其定位于非基础公共服务,可以引入社会资源弥补公共资金投入的不足,为社会尽可能提供更多更高质量的数据要素。作为解决数据生产、控制和流通利用秩序的数据持有者权不仅应当适用于社会主体(非公共机构),也应当适用于公共机构。既然不宜将公共机构生产的数据直接定位于公共数据,那么我们也无需过分追求使公共机构与政府构建完全一致的数据基础制度。而应当直接赋予这些公共机构法人组织以数据持有者权,使其独立行使流通和使用数据的权利;同时,向其施加向政府提供公共数据的义务甚或在特定情形下无偿开放原始数据的义务,以此限定公共机构的数据持有者权。至于政府的数据持有者权,则仅在实施数据开放时才有意义。因此,政府的数据持有者权可以称为数据资源管理权,只是管理者具有依法管理数据开放的权利和义务,而此时政府是作为数据持有者对外提供数据或开展授权运营的。
综上,数据持有者权可以分为三类:社会主体的数据持有者权、政府的数据持有者权和其他公共机构的数据持有者权。三类持有者权的目的均在确认三类主体对数据资源的控制权或管理权,以构建全面数据流通利用的秩序。其中,政府的数据持有者权是依照法律规定管理数据资源的权利。法律可以授权政府授权运营其持有的数据资源,对接数据要素市场。而对于社会主体和其他公共机构而言,将原始数据转化为生产要素,通过各种流通方式向社会提供数据资源的权利,还是应当还原于社会主体和其他公共机构自身。 
参考文献
[1]参见《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(2022年12月2日发布)。该文件明确提出,支持数据处理者依法依规在场内和场外采取开放、共享、交换、交易等方式流通数据。
[2]参见《促进大数据发展行动纲要》(国发〔2015〕50号)。该文件提出,“大数据应用能够揭示传统技术方式难以展现的关联关系,推动政府数据开放共享,促进社会事业数据融合和资源整合,将极大提升政府整体数据分析能力,为有效处理复杂社会问题提供新的手段”。
[3]典型如《上海市公共数据开放暂行办法》《上海市数据条例》《深圳经济特区数据条例》《山东省公共数据开放办法》《浙江省公共数据开放与安全管理暂行办法》等。
[4]《数据安全法》第五章专章规定了“政务数据安全与开放”,第41条规定了国家机关应当遵循公正、公平、便民的原则,按照规定及时、准确地公开政务数据。依法不予公开的除外。
[5]参见丁晓东:《从公开到服务:政府数据开放的法理反思与制度完善》,载《法商研究》2022年第2期,第131-145页。
[6]2011年11月2日,为进一步加强国家地名和区划数据库的建设,规范数据库的管理、使用、维护和更新,民政部制定了《国家地名和区划数据库管理办法(试行)》。
[7]《政务信息资源共享管理暂行办法》第2条规定:本办法所称政务信息资源,是指政务部门在履行职责过程中制作或获取的,以一定形式记录、保存的文件、资料、图表和数据等各类信息资源,包括政务部门直接或通过第三方依法采集的、依法授权管理的和因履行职责需要依托政务信息系统形成的信息资源等。
[8]为与政府这类公共机构进行区分,本文将这一类公益事业和公用事业机构统称为“其他公共机构”。
[9]参见《贵州省政府数据共享开放条例》第3条。
[10]《贵州省政府数据共享开放条例》第43条规定,法律、法规授权具有公共事务管理职能的组织实施的数据共享开放活动,适用本条例。
[11]《天津市促进大数据发展应用条例》第27条规定,鼓励行业协会、学会、商会等组织以及从事供水、供电、供气、供热、公共交通等公共服务的企业依法收集、存储相关数据,按照本市有关规定向市和区政务数据平台提供,用于数据的共享和开放。第28条规定,从事医疗、教育、养老等社会服务机构和电子商务平台经营者,应当依法规范数据的采集、管理和使用,鼓励、支持其将相关数据向市和区政务数据平台汇聚,或者开发利用政务数据开展业务。
[12]《大数据促进行动纲要》采取政府数据与社会数据二分,并提出政府数据应当通过政府数据统一开放平台实现共享开放。但在数据开放中用了“公共数据”,提出“稳步公共数据资源开放”“推进公共机构数据资源统一汇聚和集中向社会开放”。似乎没有将公共服务机构的数据定义为公共数据。
[13]《上海市公共数据开放暂行办法》第3条,公共数据,是指本市各级行政机关以及履行公共管理和服务职能的事业单位在依法履职过程中,采集和产生的各类数据资源。
[14]《上海市公共数据开放暂行办法》第47条,水务、电力、燃气、通信、公共交通、民航、铁路等公用事业运营单位涉及公共属性的数据开放,适用本办法。法律法规另有规定的,从其规定。
[15]《重庆数据条例》分别定义了政务数据和公共服务数据,但又将二者统称公共数据。另参见《四川省数据条例》第10条第2款;《厦门经济特区数据条例》第2条。
[16]唯一的例外是2021年出台的《北京市公共数据管理办法》不是从数据产生主体角度,而强调公共使用价值。该办法第2条规定:“本办法所称公共数据,是指具有公共使用价值的,不涉及国家秘密、商业秘密和个人隐私的,依托计算机信息系统记录和保存的各类数据。”
[17]相关研究者也针对公共数据的定义问题提出了质疑。参见郑春燕、唐俊麒:《论公共数据的规范含义》,载《法治研究》2021年第6期,第67-79页。
[18]统一编码、组织名称、法定代表人、法人身份证、联系电话、主营业务、经营方式等。
[19]车辆所在城市、车辆号牌、车牌颜色、核定载客位、车辆厂牌、车辆型号、车辆类型、车辆所有人、车身颜色、发动机号、车辆VIN码、车辆注册日期、车辆燃料类型、发动机排量、车辆运输证有效期起、车辆运输证有效期止、车辆初次登记日期、卫星定位装置品牌、卫星定位装置型号等。
[20]城市、城市代码、区县、区县代码、乡镇街道、乡镇街道代码、村社、村社代码、物业小区、建筑物、设备设施名称、地址等。
[21]《贵州省大数据发展应用促进条例》并没有明确提出这两类划分,但其规范可以概括为这两类开放方式:(1)主动开放:除法律法规另有规定不能向社会开放的数据(负面清单目录)外,均应当向社会开放;(2)依申请开放, 依法不能向社会开放的公共数据,涉及特定公民、法人和其他组织重大利益关系的,经申请可以向该特定对象开放。
[22]《贵阳市政府数据共享开放实施办法》第25条规定,行政机关应当按照无条件开放、依申请开放、依法不予开放等三类对开放的政府数据进行管理,并遵守《中华人民共和国保守国家秘密法》及其实施条例、《政府信息公开条例》《贵阳市政府数据共享开放条例》等法律、法规的相关规定。
[23]《贵州省政府数据共享开放条例》第21条规定,政府数据开放应当坚持需求导向、有序开放、平等利用、确保安全的原则,实行分类管理,按照开放属性分为无条件开放、有条件开放和不予开放三种类型。
[24]《上海市公共数据和一网通办管理办法》第30条规定,公共数据按照开放类型分为无条件开放、有条件开放和非开放三类。
[25]《天津市促进大数据发展应用条例》第21条规定,政务数据开放分为无条件开放、有条件开放和不予开放三种类型。
[26]有学者就提出,公共数据是一种信息资源,在权属上应当为全民共同所有,但在价值实现机制上由作为数据控制者的政府进行收集、归集、共享和开放,将公共数据按照不同类型区别使用,并在实践过程中不断优化使用方式,扩展可供使用的公共资源的范围和程度。参见胡凌:《论地方立法中公共数据开放的法律性质》,载《地方立法研究》2019第3期,第1-18页。
[27]  有学者提出,对于政府数据开放制度,需要明确政府数据开放范围与标准,建立数据开放保密审查和安全管理法律制度,规范数据开放平台建设与管理,明晰政府数据开放的法律责任。参见刘权:《政府数据开放的立法路径》,载《暨南学报》(哲学社会科学版)2021年第1期,第92-102页。
[28]  《“数据二十条”存五大权属焦点问题,“持有权”会是突破口吗?》,财经E法,https://baijiahao.baidu.com/s?id=17544540  71019675678.(最后访问时间:2023年1月27日)。
[29]  《构建数据基础制度 更好发挥数据要素作用——国家发展改革委负责同志答记者问》,国家发改委官网,https://www.ndrc.go  v.cn/xxgk/jd/jd/202212/t20221219_1343696.html.(最后访问时间:2023年1月27日)。
[30]《数据二十条》提出,在保障安全前提下,推动数据处理者依法依规对原始数据进行开发利用,支持数据处理者依法依规行使数据应用相关权利,促进数据使用价值复用与充分利用,促进数据使用权交换和市场化流通。
[31]数据持有者权需要控制数据,但实际控制并不等于享有持有者权。持有者权必须是保护创造价值和促进使用数据的权利。因此,在数据市场中的经纪人虽然可能控制数据,但并不因此享有持有者权。
[32]  八国集团(G8)于2013年6月签署的《G8开放数据宪章》提出的政府数据开放五项原则,除了强调政府数据以开放为原则(称为“自动开放数据”)和“改进治理”外,还强调“确保高质量和足够数量的数据”“使数据可为所有人使用”和“促进创新”。政府数据开放被定位于推进大数据应用,实现数据资源化(即要素化)利用战略举措。八国集团(G8)于2013年6月签署《G8开放数据宪章》,承诺在各自国家促进数据开放,造福社会。《G8开放数据宪章》提出政府数据开放的5项原则:(1)自动开放数据。政府机构应当以开放(open)和可机读的方式公开(release)所有的公共数据,除非存在正当理由不公开,比如国家安全或隐私保护。(2)确保高质量和足够数量的数据。政府机构应当公开已经充分审查和清洗处理过的各种数据集。(3)使数据可为所有人使用。政府机构应当为所有数据集设定标准化的元数据,采用开放许可协议,确保普遍可访问。(4)公开数据以改进治理。政府机构应当在国际范围内分享开放数据的最佳实践,公开在本宪章中规定的关键数据集,寻求社会力量投入。(5)公开数据促创新。政府机构应当公开本宪章认为有“较高价值”的数据集,与数据开发团体(developer communities)协作,资助开放数据创业。  See Cabinet Office.Policy paper:Open data chapter.G8 communique and documents,18.June,2013,https://ww  w.gov.uk/government/publications/open-data-charter.(2023-01-27 accessed)。
[33]这一定义源自2019年8月上海市人民政府发布的《上海市公共数据开放暂行办法》第3条:本办法所称公共数据开放,是指公共管理和服务机构在公共数据范围内,面向社会提供具备原始性、可机器读取、可供社会化再利用的数据集的公共服务。
[34]高富平、张晓:《政府数据开放的边界如何厘定》,载《人民论坛》2017年第21期,第98-99页。
[35]参见《数据安全法》第6条、第8条。
[36]参见《促进大数据发展行动纲要》(以下简称《纲要》)。《纲要》提出,建立“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制,实现基于数据的科学决策,将推动政府管理理念和社会治理模式进步,加快建设与社会主义市场经济体制和中国特色社会主义事业发展相适应的法治政府、创新政府、廉洁政府和服务型政府,逐步实现政府治理能力现代化。
[37]关于数据资源的要素化和产品化的论述,参见高富平、冉高苒:《数据要素市场形成论——一种数据要素治理的机制框架》,载《上海经济研究》2022年第9期,第70-86页。
[38]政府本身就是生产公共产品和提供公共服务的机构,其所拥有的数据被认为是公共数据,将公共的东西开放给社会主体自由使用,是政府顺应数字时代需求的一项公共服务。例如,《上海市公共数据开放暂行办法》第3条第2款:本办法所称公共数据开放,是指公共管理和服务机构在公共数据范围内,面向社会提供具备原始性、可机器读取、可供社会化再利用的数据集的公共服务。《浙江省公共数据开放与安全管理暂行办法》第2条规定,本办法所称的公共数据开放,是指公共管理和服务机构面向社会提供具备原始性、可机器读取、可供社会化利用的数据集的公共服务。《浙江省公共数据条例》第27条规定,本条例所称公共数据开放,是指向自然人、法人或者非法人组织依法提供公共数据的公共服务行为。《重庆市数据条例》第3条(七):公共数据开放,是指向自然人、法人或者非法人组织依法提供公共数据的公共服务行为。
[39]知识开放意义上的开放是指:如果任何人都可以自由访问、使用、修改和分享,那么知识就是开放的——至多受维护其来源和开放性的措施的限制。
[40]参见《国际开放数据宪章》(以下简称《宪章》)。《宪章》提出,开放数据可供所有国家和国家以下各级政府采用;以全新的原则促进数据的可比性和互操作性,以增加使用和影响;承认数字鸿沟等全球挑战,以及开放数据促进包容性发展的重大机遇;建议标准化(例如数据和元数据);鼓励文化变革;认识到保护公民隐私的重要性以及他们影响收集和使用自己个人数据的权利;促进加强与公民和民间社会的接触;促进了对数据素养、培训计划和创业精神的更多关注等原则。
[41]2003年欧盟颁布了《公共部门信息指令》,2009年美国总统奥巴马提出《开放数据倡议》,2011年开放政府伙伴关系(Open Government Partnership)设立,2013年的G8峰会《开放数据宪章》(the G8 Open Data Charter)发布。《开放数据宪章》成为域外国家政府数据开放的基本遵循,几乎所有的国家都运营了开放政府数据门户网站。
[42]公共服务有5个基本特征:(1)政府提供;(2)公共资源投入形成;(3)直接针对服务对象(公民、法人和其他社会组织、社会公众);(4)普惠性;(5)非市场性(为个人、组织和社会发展提供保障、创造条件)。参见梁春立:《公共服务事项目录编制工作探索》,载《机构与行政》2016年第8期,第19页。
[43]参见《“十四五”公共服务规划》(2021年12月印发)。
[44]参见《国家基本公共服务标准(2021年版)》(国家发展改革委联合20个部门印发)。《标准》明确了幼有所育、学有所教、劳有所得、病有所医、老有所养、住有所居、弱有所扶、优军服务保障、文体服务保障等9个方面、22大类、80个服务项目属于国家确定的基本公共服务范围。
[45]参见《“十四五”公共服务规划》。
[46]笔者曾撰文提出类似的主张,称为自由开放和受控开放。自由开放和受控开放两种数据利用模式应当是适用于社会所有主体(数据拥有者),而不是分别适用于公共部门和私人领域。也就是说,公共部门的数据既可以采取自由开放,也可以采取受控开放,私主体控制的数据既可以采取受控开放模式,也可以采取自由开放模式,实现其数据的社会化利用。这样的两类主体、两种方式的数据开放构成数据开放的全貌。参见高富平:《数据经济的制度基础——数据全面开放利用模式的构想》,《广东社会科学》2019年第5期,第5-16页。
[47]原始数据被视为是数据生产者从事主要经营业务而额外产生的副产品。See Farboodi, Maryam and Veldkamp, Laura, “A Model of the Data Economy ”.NBER Working Paper No.w28427,2021:p.5.
[48]这是数据价值的多样性所致。参见张蕴萍、翟妙如:《数据要素的价值释放及反垄断治理》,载《河南师范大学学报》(哲学社会科学版)2022年第6期,第59-65页。
[49]参见高富平、冉高苒:《数据要素市场形成论——一种数据要素治理的机制框架》,载《上海经济研究》2022年第9期,第70-86页。
[50]关于数据生产与数据流通的相关论述,参见高富平:《数据生产理论——数据资源权利配置的基础理论》,载《交大法学》2019年第4期,第5-19页;高富平:《数据流通理论:数据资源权利配置的基础》,载《中外法学》2019年第6期,第1405-1424页。 
[51]参见高富平、冉高苒:《数据生产理论下爬虫技术的法律规制路径》,载《江淮论坛》2022第5期,第109页。
[52]关于授权运营制度,本文不再赘述。关于公共数据授权运营机制的研究与讨论,参见刘阳阳:《公共数据授权运营:生成逻辑、实践图景与规范路径》,载《电子政务》2022年第10期,第33-46页;常江、张震:《论公共数据授权运营的特点、性质及法律规制》,载《法治研究》2022年第2期,第126-135页。
[53]参见《重庆市数据条例》第3条第5项。
[54]参见《厦门经济特区数据条例》第3条第3项。
[55]《厦门经济特区数据条例》即采取这样的规则。其第34条规定,探索构建安全高效的非公共数据收集、使用、共享、开放机制,发挥非公共数据资源效益,促进非公共数据开发利用。
 
本文内容来源于“行政法学研究”,感谢作者授权。