传真:+86-123-4567
手机:138 0000 000
邮箱:admin@admin.com
地址:广东省广州市天河区88号
数据使用中存在多种应用场景■■◆■★,企业数据权人有权禁止他人未经许可擅自将数据产品应用于具体场景。在当前的生成式人工智能中,数据输入和文本整理产品可以应用于办公场景,有效提升工作效率;数据分析和决策支持产品可以应用于企业管理,通过识别数据中的模型和趋势,辅助企业决策◆◆■◆◆;自然语言处理产品可以应用于客户服务,通过问题回答和沟通交流提升客户体验。随着通用人工智能的发展,数据产品可以运用于学习、工作、生产、生活的任意场景■◆◆,未经许可的第三人则不得擅自使用数据产品进行场景应用■■■■。
以深度学习为特征的算法模型,本质上是一个端到端的黑箱。在大模型预训练过程中,片面、虚假的数据会产生错误的反馈结果,产生数据偏见和算法歧视的风险。随着通用人工智能时代的到来★■◆■,有必要以企业数据赋权为主线★◆◆■◆,构建企业数据合规体系,化解企业数据侵权风险■■★◆■,有效促进数字经济产业的健康有序发展。
企业数据赋权为数据产品的商业化提供前瞻性的制度安排,促进数据的流通与保护。既要确保企业数据权中的数据资源持有权、数据加工使用权、数据流通交易权在不同的数据流通环节产生有效的排他性★■,又要进行必要的权利限制,保障其他数据产业者的使用权益★★◆★★■。在时空限制方面,赋予企业数据资源持有权、数据加工使用权、数据流通交易权差异化的权利期限,又要防止权利期限过长影响数据的流通复用。在合理使用方面,将科教文卫的小规模使用、公共部门和科研目的的数据加工使用行为纳入企业数据的合理使用情形■★◆★。在法定许可方面,当发生重大疫情或者涉及公共利益时■■◆★■,可以要求企业公开人工智能生成数据协助公用管理。同时,通过建立必要数据共享制度◆■◆,确保关键领域中必要数据的开放。
算法歧视也可能侵害数据加工使用权。数据加工使用权是基于对数据合法加工使用而产生的权利,数据因为加工使用而侵害了用户的权利,其过程亦侵害了数据加工使用权。算法系人机交互的决策,包含代码设置★★◆★■、数据运算和自动化决策等一整套机制。通用人工智能算法专注于解决如何模拟、再现智能的技术问题,在决策过程中,也可能会因为数据分析导致对特定群体产生不公正的对待。例如,上海某商务有限公司就曾在酒店预订中■◆◆,利用算法对客户进行价格歧视★★★,导致客户通过应用预订的酒店房价远高于门市价◆■★◆■。4美国亦有航空公司曾利用个人隐私大发其财■■,当航空公司发现某个机票的询票者最近必须旅行★■★★◆◆,而且在过去对票价不是很敏感时,它给出的报价就会比其他人的高很多◆★。因为算法歧视的存在,数据在加工使用中侵害了网络用户的权利,亦侵害了企业数据的加工使用权。
数据资源持有权是企业数据的基础权利■★■◆★★。企业对数据资源的加工使用形成了数据加工使用权,对于数据资源的交易或者数据产品的交易形成数据流通经营权,数据加工使用权和数据流通经营权系数据资源持有权的衍生权利。相比于数据加工使用权和数据流通交易权,数据资源持有权着重于保护数据生产要素,系企业数据权的基础权利。通用人工智能产业中,数据资源的主要作用是为大模型提供预训练功能,与之相对应的数据资源持有权则应适当体现一定的开放性和包容性,以促进产业的成长发展。
通用人工智能时代,模型产品的生成和优化离不开数据训练★◆★■■,数据产品的价值亦不断得到重视。无论是数据资源还是数据产品,都因为产业的发展而具有了交易价值。通过赋予数据流通交易权,既可以促进数据资源和数据产品的市场化流通★◆■■◆,又可以实现数据投资回报,促进数据产业发展。
企业在行使数据流通交易权时■◆★◆,对在境内收集产生涉及个人信息的大数据或者重要数据,应当在合规申报的前提下进行数据跨境流动。就通用人工智能模型而言◆■★■■★,其在模型训练时的数据输入倘若涉及个人信息★◆,或者产生的数据产品依然含有个人信息,需要进行合规审查后再进行数据跨境流通。当然,数据的跨境流通也有例外情形,如仅涉及学术合作★★◆★■、国际贸易的数据出境,不是境内收集的数据,以及特定情形下的个人合理有限使用数据■★,并不需要进行跨境审查★■。
在数据流通交易权的实现过程中■◆★■,收益分配决定了数据的优化配置★◆■◆◆★。在收益分配时,一方面要处理好企业数据和个人数据之间的关系■★,若采集的企业数据涉及个人信息,应当以合理形式对个人进行补偿。另一方面,要根据数据加工的环节■★,按照■■◆“谁投入、谁贡献★■■★、谁受益”原则,充分考虑企业在数据持有、加工使用等环节投入的劳动和资金★★★◆,保障数据持有者和加工使用者获得收益的权利。
在知识产权中★■■◆◆,著作权、专利权■◆■★、商标权属于强排他性权利,权利一经取得■◆◆■■,任何人未经许可不得擅自使用■◆★■■。商业秘密具有弱排他性,需要在行使排他权之前个案认定商业秘密的成立■■★◆◆。商业秘密并不具有绝对的排他性,而是符合特定条件下的相对排他性。企业数据权作为一种从权益演化而来的权利,亦具有弱排他性,需要在个案中证明企业数据的公开性、有价性、管理性,在此基础上才可以排除他人使用★■■◆■。因此,相比于一般的民事权利★★■◆◆,企业数据权的权利属性较弱。
随着通用人工智能时代的到来,企业数据在数字治理生态体系中的重要性日益凸显■■,产业发展产生了企业数据赋权的需要。企业数据权是智能时育的新型知识产权,具有鲜明的时空性与地域性★★◆■★■。相比于现有知识产权,企业数据权是一种弱权利,具有相对排他性■◆★,需要在证明公开性◆★★■■◆、有价性、管理性基础上才可以有限排除他人使用。通用人工智能视野下的企业数据赋权◆★■■★,应当以促进产业发展为根本◆★◆■★■,构建科学合理■★■■、宽严相济的企业数据权体系。其中,数据资源持有权是企业数据权的基础,加工使用权是企业数据权的核心,流通交易权是企业数据权的价值实现。本文认为通过构建类型化的企业数据权利体系,可以有效激励数据投资■■★、促进数据流动■■■■◆★,推动人类社会加速进入智能时代★■,并系统分析了企业数据赋权的法理基础★■★■。
2023年6月◆★■★,国内也出现了笔神作文诉学而思未经授权使用其数据训练人工智能大模型的纠纷。
数据污染侵害了数据加工使用权。人工智能产业中,数据加工包含数据学习、训练过程和结果输出三个阶段,数据学习的本质是对数据要素的复制。人工智能通过学习语言表达模式,生成自然流畅的对话内容;基于自我学习能力,改进交互经验表现;利用有监督微调方法,通过在高质量标注数据上微调基础语言模型,使用带有人类反馈的语言模型进行强化学习,使模型更安全。高质量的数据资源是人工智能加工使用的基础。目前,人工智能技术的训练数据多来自互联网上的公开数据。这些数据的质量参差不齐,时常隐藏着虚假信息和带有价值偏向的政治议题和道德立场,导致人工智能生成内容存在潜在的侵权风险。通用人工智能阶段★★★■◆◆,要想避免企业加工使用权被侵害,就要降低此类数据的风险,通过数据标注◆◆◆◆★、数据分级和数据交易■◆★★,不断提升基础数据的质量★◆★。
大规模的数据训练是人工智能模型生成准确结果的基础,在海量的训练素材中可能包含侵害个人信息◆◆■◆■、知识产权或者违规信息的存在★◆。通过对数据的收集、清洗、整理后,产生了数据资源持有权,但难免仍有违法违规的不良信息存在。对大规模的数据集进行人工审查不具有可操作性,通过设立数据资源持有权,客观上阻断了数据加工使用权、数据流通交易权与在先权利的关系。如果数据资源产生侵权◆■,相应责任由数据资源持有者承担,客观上保护了后续环节数据加工使用者、数据流通交易者的信赖利益,也降低了数据加工使用的门槛。通过设立数据资源持有权,可以有效提升数据的复用价值★■◆◆■。
数据是通用人工智能的基础。例如ChatGPT和sora就是基于大数据基础上的深度学习,训练出的语言模型和文生视频模型。《中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》)根据数据来源和数据特征★◆◆◆,将数据区分为公共数据、企业数据和个人数据。企业数据指的是各类市场主体在生产经营活动中采集加工的,不涉及个人信息和公共利益的数据。在通用人工智能中,供数据模型训练的数据集以及数据模型形成的数据产品都属于企业数据■★★◆。
企业数据加工使用权包含加工生产和使用两个方面★★◆■。数据加工系企业根据用户需求,通过大模型对数据进行分析处理的过程◆★★◆。加工既可以是对数据要素的分析处理,也可以是对数据产品的再加工。通过数据加工,形成了新的数据产品。在数据使用环节,企业将加工生产的数据产品应用于具体场景◆■★■,以解决特定需求,实现企业的数字化转型。
数据资源应当保护知识产权。无论是开源数据、自采数据、商业数据★■★◆★、使用者输入数据,企业在数据获取使用过程中都应当保护在先的知识产权◆■■。企业在数据输入时应善尽注意义务,对数据是否侵害著作权、商标权、专利权、商业秘密等知识产权进行识别审查,防止在后续数据的加工使用过程中知识产权的违法复制和使用行为发生。同时对数据资源中涉及知识产权部分的摘要信息进行公开■★★★,在投诉渠道中支持第三方就相关的知识产权情况进行查询。
禁止他人未经许可交易数据亦存在例外情形。例如,为保护特定利益,在确保优先保护的利益与数据持有人因此遭受的损失★★★■、数据安全风险等符合比例原则的前提下,可以未经权利人许可交易数据;又如,为了促进经济发展和创新、建设数字政府和智慧城市、增加社会福利等公共利益,可以未经权利人许可交易数据★★◆★■◆。
人工智能加速了人类知识发现进程,同时也会带来知识的贬值。人工智能通过强大的检索和运算能力,不论是对技术场景的拆分组合,还是对跨领域数据的挖掘加工,都能轻易生成海量的能够通过实用性审查的专利申请◆■◆★■,也使得平庸的作品创作失去意义。通用人工智能时代的到来倒逼人类社会的发展从追求知识进入追求智慧的新阶段,人的价值不仅体现在拥有多少知识,更在于获取数据◆◆■、加工数据★★■◆★◆、运用知识的能力。通过完善企业数据治理体系,建立企业数据的法律赋权制度★★◆◆■■,可以推进数据的获取◆◆◆★★、加工和流通,激励数据在运用中发挥更大的价值■■。
美国最高法院1991年审理的“费思特”案件,是版权法关于独创性认定的里程碑案件■★■,也是数据保护的萌芽。在该案中,美国最高法院认为号码簿以客户姓名的字母顺序编排电话号码等数据,不具有任何版权法所要求的独创性,因而不被版权法所保护。诚然★◆■,不具有独创性且未经独特编排的企业数据难以受到版权法的保护■■。但知识产权法不仅保护具有独创性的作品或者技术方案,也保护具有商业利益的商业标识和商业秘密等。知识产权法是一个不断扩张的过程,商业实践的发展促进知识产权法律体系逐步完善。19世纪中期以前,商业标识的财产性一直没有得到承认。而在19世纪后半期■★★■◆,由于商业标识在商业实践中的承认和使用◆■★◆,商标法开始成为独立的法律领域,逐渐纳入知识产权法领域◆■★★。商业秘密本身亦不必然具有创造性,例如经营信息★■,更多的是与公有领域的信息区分开来。虽然商业秘密的保护历史悠久,但一开始并未作为单独的知识产权类型写入巴黎公约。与商业标识一样★★,商业秘密也是经过长期的商业实践不断得到认同而单独立法,并最终纳入知识产权法系统。因此,知识产权法本身就是一个随着技术和商业发展不断扩张的过程。知识产权法不但保护具有创造性的作品和专利技术方案,同样也保护具有商业利益的商标和反不正当竞争法规制的商业秘密■★◆、商誉等客体。
随着大语言模型ChatGPT(Chat Generative Pre-trained Transformer)的应用■◆◆■★,人工智能已经从专用人工智能逐步迈向通用人工智能(Artificial General Intelligence)。专用人工智能◆■,指从特定的数据集中提取信息,在特定的场景下运行■★■★★◆,用来执行单一任务的人工智能■◆。而通用人工智能指具有与人类相当或更高的认知能力的智能系统★◆★,能够理解★◆、学习、计划和解决问题★★◆,从而在各种应用场景中完成任务。
企业数据与知识产权法存在密切关联。在工业时代◆◆,以电话号码簿中客户电话号码为代表的企业数据一开始并未得到著作权法的保护,亦未得到其他知识产权法的保护。原因在于,囿于当时的生产力水平,数据的作用未能得到充分利用,数据的价值亦未能得到足够的重视■◆。虽然企业数据一开始没有得到著作权法的保护,但从一定程度上体现了企业数据与知识产权存在某种密切的关联。随着人工智能的发展,使得数据体现出前所未有的价值。随着社会发展的需要■★◆■★,个人数据、企业数据■■★◆◆、公共数据承担着不同功能定位,亦有不同的立法需要◆◆★■★。当前★■,个人数据、公共数据已分别立法★★◆,具有市场价值的企业数据完全有可能单独立法,系统纳入知识产权法律体系之中。
企业数据的本质是信息★■★◆◆,早期的企业数据不具有规模性、创造性和价值性,不为传统的知识产权所包含。近年来,随着算法、算力和数据存储能力的发展,人类社会逐步进入智能时代。层出不穷的大模型使得企业数据呈现爆发状态,产生日益凸显的价值。产业发展需要是企业数据赋权的基本需求,企业数据赋权亦需要立足于产业规律和企业数据的属性特征。
通过赋予企业数据加工使用权,企业可以禁止第三人未经许可擅自生产加工、使用数据★■◆★★。例如,在北京奥蒂思品牌管理咨询有限公司与北京车质网信息技术有限公司、赵某不正当竞争纠纷案件中,车质网公司收集海量用于对各品牌汽车的投诉信息后◆★◆◆★■,进行逐一审核、分析、整理◆★◆◆■★、修改,并通过专业编辑最终按照统一格式在网站前端展示■★■★★。这一过程并非简单的数据收集,而是对消费者投诉信息进行了特定格式和内容的加工整理。奥蒂思公司作为同业竞争者◆★◆,用复制和搬运手段将他人积累的投诉信息据为己有,并公然作为自身经营资源予以展示和使用,侵害了车质网公司基于对数据加工获得的数据加工使用权■★。
流通交易是企业数据价值实现的重要渠道★◆★★★,通过赋权实现法律保障有助于推动企业数据的价值实现,促进数据投资得到回报■★,强化基于数据价值创造和价值实现的激励导向。企业数据的流通交易存在多种方式◆◆◆:一是企业数据的转让。企业数据转让后,虽然实现数据的市场化流通◆★◆★■,但也丧失对产品享有的使用权。二是企业数据的许可。许可他人使用数据产品是企业数据流通交易最常见的模式,企业数据权人可以通过许可使用的方式获得数据产品收益,同时通过数据许可实现数据的流通复用★★■★。三是企业数据的融资担保。担保是企业数据融资的重要方式,通过在数据之上设立担保,实现数据价值的市场评估。四是企业数据的投资入股★★■。企业数据作为生产要素■★,与土地、资金一样具有投资入股的价值■◆■■,将企业数据用于投资入股,有助于实现数据的多元化资产配置。
当前,企业数据虽未被赋权■★★■,但已经产生了司法保护的需要。国内的企业数据保护主要通过知识产权法律体系中的《反不正当竞争法》来保护,例如在大众点评网、美景案中,均通过我国《反不正当竞争法》第2条一般条款保护。在《反不正当竞争法》修改建议稿中,也专门规定了商业数据专条。未来一段时间内,企业数据仍主要以《反不正当竞争法》的路径进行保护。《反不正当竞争法》以行为规制模式保护企业数据权益◆■◆,避免了企业数据财产权可能导致对数据的绝对支配问题,但《反不正当竞争法》具有个案认定、事后规制等问题难以解决。随着通用人工智能时代的到来,智能技术与治理场景深度融合,企业数据在数字治理生态体系中的重要性日益凸显◆■,企业数据的保护仍应通过单独立法进行赋权。
企业数据和个人数据■★■、公共数据定位不同,对应的权利体系亦不相同■◆◆★。但企业数据权和个人数据、公共数据并非完全独立,通用人工智能预训练的数据很多来自个人数据,大模型形成的数据产品经过一段时间保护后终将流向社会◆■◆,成为公共数据。既要关注数据资源持有权和个人数据权利存在的交集◆★★,在数据资源持有权的行使过程中保护个人信息、补偿个人利益★■。又要厘清数据加工使用权、流通交易权和公共数据权利的关系,合理考虑企业数据的时效性◆■■◆,形成动态的企业数据权利评估体系。
赵拥军|新型网络支付方式下非法取财行为的类型化定性——以账户中资金的性质及占有为视角
根据国家互联网信息办公室发布的《生成式人工智能服务管理暂行办法》,企业数据不得侵害他人依法享有的知识产权和个人信息★■■■。在智能时代■■■◆◆★,企业数据的很多内容来源于用户生成的数据,用户生成的数据含有个人信息的,企业在收集数据之前应当取得个人同意,加工过程中应当过滤个人隐私。在对数据标准化处理过程中,推动个人信息的匿名化处理,充分保障隐私权★◆■★、名誉权、荣誉权等人格权■■◆◆★。算法模型的预训练依靠数据资源◆★★,相应的数据资源应当合法取得。目前,各国都出现了数据未经授权用于算法模型的侵权行为◆■◆◆。2023年2月,全球最大的图片库公司★■■★■★“Getty images”起诉Midjourney未经许可利用自身作品进行算法模型训练■★■■◆。
通用人工智能中★■,企业数据的加工使用成为标准化的流程。数据经过脱敏■★、清洗、分类、排序■■★■■◆、整合而成为数据资源,数据资源经过加工使用成为能够标准化使用的数据产品■★,数据产品在流通交易中实现了数据价值◆◆◆★◆■。根据数据产生的周期,分别产生了数据资源持有权、数据加工使用权◆★◆、数据产品经营权,这样的分类标准与《数据二十条》关于企业数据权利的分类相同。对企业数据的赋权可以知识产权自用权和排他权为视角◆■■★◆◆,对于企业数据的三种权利进行法律化解释◆★。
靳匡宇|治理现代化背景下自然保护地役权的证成与展开——以自然保护地为中心的考察
人工智能技术依靠视觉技术★◆◆★■★、语音技术★■◆■◆、自然语言理解和规划决策等系统实现人机交互,人机交互的过程亦是数据加工使用的过程。在生成式人工智能中◆◆◆★★★,大模型产出的数据产品需要通过加工使用权进行保护,在未来,通用人工智能产生的数据产品亦需要通过加工使用权加以调整。因此◆★◆★■★,数据加工使用权是企业数据权的核心,也是通用人工智能产业需要重点保护的对象。
作为科技发展产生的新型权利,企业数据赋权最合适的路径依然是知识产权。在保护客体上,企业数据与知识产权保护的都是信息,两者在创造性上呈现递增关系。具有一定创造性的信息可以成为知识产权的客体,创造性较弱的信息则可能成为企业数据的客体。在发展历史上★■★★◆,知识产权的保护促进了作品、商标、专利的披露与流通。和知识产权赋权一样,对企业数据赋权的重要意义在于彰显合法性■■◆,从而为数据后续的加工使用、流通交易进行合法性确认,促进数据的进一步使用。通过对企业数据赋予知识产权,可以平衡相关经营者投资加工数据获得私益和社会公共利益,从而构建具有中国特色的数据产权制度体系。
值得关注的是◆■★◆,在原《民法总则》的制定过程中,草案第一稿第108条第2款规定,知识产权是指权利人依法就下列客体所享有的权利:◆★“……(8)数据信息;……”鉴于对数据和网络虚拟财产的概念范畴■◆■★■★、保护范围◆★■★、权利属性■◆★★★、权利和义务内容存在较大争议■★◆,草案二审稿将数据和虚拟财产单列一条作出规定,规定“法律对数据、网络虚拟财产的保护有规定的★★★■◆,依照其规定”,最终通过的《民法总则》保持了这一规定★★★。《民法典》总则编维持了《民法总则》的这一规定■◆■★。数据分为个人数据、企业数据◆★、公共数据,三者各有侧重。个人数据侧重信息保护■◆,公共数据侧重信息公开,企业数据侧重流通使用◆★,一概认定为知识产权客体赋予垄断权利并不科学。企业数据同知识产权一样,属于具有信息结构但没有外形的■★◆“有构无质”之物◆■★■,因为具有商业利益而受到知识产权法的保护。
企业数据的定价应当建立在对数据质量、数据成本、产品层次和买方异质性等多维度的考量基础,通过推动市场主体不断尝试符合商业需求和经济规律的数据定价模式,进一步释放数据生产要素的活力。在现有的裁判中◆★★,多以法定赔偿或者裁量性赔偿来计算企业数据的价值★■■★。其原因在于企业数据的实际损失或者违法获利难以充分举证,由于数据交易刚刚兴起,也缺少可供参照的数据交易记录。随着数据交易市场的成熟完善■◆★★,企业数据在流通交易过程中可以参考许可使用费定价,同时也可以参照数据收集、存储、挖掘★◆■、加工及交付的成本★★★★,数据服务接收方可能获得的经济利益等方式对企业数据进行价值评估。
企业数据权的时效性强、保护期短。人工智能时代,电脑、物联网传感器★■■■◆、网络用户◆★★■、大模型等源源不断地产生数据,数据信息迭代更新速度快★■■■。对于企业数据权赋予过长期限的保护期★◆■★◆,可能造成已经失去时效的数据信息被过度保护,影响了数据的流通使用。因此,相比于其他知识产权,企业数据权的保护期限更短。
人工智能时代■◆■◆◆,海量的企业数据经过分类整合形成了数据资源。企业基于对数据的管理形成了数据资源持有权,数据资源持有权系企业数据权最为常见的表现。随着通用人工智能的加速到来,数据资源主要集中于为大模型提供预训练功能,与此相对应的数据资源持有权系企业数据权的基础性权利。
通用人工智能大模型的学习分为通用智能和专业智能两阶段★■★■★,前者侧重于语言理解、推理能力以及通用知识的学习,后者侧重具体任务指令的学习。相比于精于某一领域的专用人工智能,通用人工智能涉及的面更广,事先收集和人机交互过程中获取的用户数据更为多样,基于自我学习特定算法衍生的数据数量更多。这些企业数据具有使用价值,需要法律予以规制◆■,以防止数据的无序利用。
数据使用是数据增值的重要途径。数据作为无体物的一种,不会因他人的使用而减少其数据本身的价值★★,反而因无数人的不断使用使得数据产生新的衍生价值与附加价值■★■◆★★。在尊重数据来源主体法定在先权益的前提下★◆★,数据持有人可以根据自己的商业生产经营需要使用数据,包括利用数据分析生产经营规律、训练人工智能模型、加工数据产品等诸多使用方式。数据使用是数据加工的目的◆★◆■■,数据使用权也是数据赋权的重要权能。
企业数据权保护的是企业持有的公开又具有市场价值且采取管理措施的数据集或者数据产品,系对现有知识产权体系的补充保护◆★■◆★。本来无法得到知识产权法保护的企业数据,因为人工智能产业的发展而得到赋权。如果赋予企业数据权和知识产权一样的保护力度,可能会造成对现有权利位阶的冲突,最终架空了既有的法律保护体系。因此■◆◆★■◆,符合创造性要求的企业数据应当选择著作权或者专利权进行保护★★。相比于现有知识产权◆★,企业数据权是一种弱权利。
非法复制他人数据并构成实质性替代■★,亦会侵害企业数据持有权。例如★◆,在大众点评案件中,大众点评网的用户点评信息不一定属于大众点评公司★■■■,但已成为企业的核心竞争资源。大众点评网对于用户点评信息进行清洗,初步排除虚假和非法信息,同时按照商户位置和类别★■◆★,参照评论发表的时间先后顺序对用户评论数据进行排序。通过对数据的清洗★■◆★★■、分类★■■、排序◆■,大众点评网获得了数据的管理控制权■◆■。百度公司的搜索引擎抓取大众点评网上的涉案信息,虽未违反robots协议,但实施了对大众点评网管控数据的复制行为,造成对大众点评网管理控制数据的实质性替代,可以视为侵害了大众点评公司的数据资源持有权。
企业数据赋权与科技发展密切相关,当前正是由于人工智能对传统产业带来了颠覆性革命◆■◆◆★★,才使得企业数据赋权进入法学研究的视野。鉴于此,本文拟在分析企业数据赋权客观背景的基础上★★◆◆★,结合企业数据的发展历史,深入分析企业数据的权利属性。并根据企业数据的产生周期,从自用权和禁用权角度◆◆◆★◆◆,对企业数据权涵盖的数据资源持有权、数据加工使用权、数据产品经营权三项子权利进行类型化展开,最后提出企业数据赋权的结构性权利体系,以期对通用人工智能视野下的企业数据赋权问题作出更为深入的研究和分析★■■◆。
就企业数据而言,当前我国主要通过《反不正当竞争法》以权益形式予以保护★◆★◆◆,然而行为规制模式存在权利边界不清、稳定性不足等问题,难以满足通用人工智能的产业需求★◆★■★◆。对是否需要对企业数据赋权以及如何进行赋权◆★■★★★,既有研究存在明显分歧。数据赋权否定论者认为◆★■★■,我国对于企业数据的保护水平,已经远超财产权保护规则的保护水平■◆,数据确权只会增加数据利用的难度,而不会推进数据利用◆★■。数据赋权肯定论者对于如何进行数据赋权的观点也是大相径庭◆◆★■■■。多数学者主张以权利模式对数据进行赋权★★★◆,但对于企业数据权系何种权利★◆★◆■■,目前主要有三种不同观点:知识产权法学者主张企业数据与信息保护类工业产权具有深度的契合性★★◆◆,有必要将企业数据权纳入工业产权序列★◆;民法学者认为数据权与知识产权在权益结构★★◆■■、保护期限、保护理念★■■★■◆、权利客体等方面均不相同,主张通过借鉴物权经验,确认和保护数据处理者的持有权、使用权◆★■、收益权■■★◆■■、处置权等财产权益★◆◆,并根据不同主体对数据形成的贡献来源和程度的不同,设定数据原发者拥有数据所有权与数据处理者拥有数据用益权;还有学者主张数据财产权具有财产性、对世性、有限支配和有限排他的基本属性,是与物权■★、知识产权相并列的第三类具有对世性的财产权利■★★■◆。权利模式之外,也有学者主张数据保护本质上是构建数据流通利用秩序的一种财产治理范式◆◆。关于赋予何种权利,有学者认为可采取数据制作者权和数据使用者权二元权利结构,其中,数据产品制作者权是数据赋权的核心权利;也有学者按照数据生成的周期构建数据权利,为数据采集、数据加工利用、数据产品交易构建资源持有权★◆★■★、数据加工使用权和数据产品经营权。由此可见,企业数据作为数据的一种类型,在赋权必要性和权利属性以及权利内容上面临着巨大的分歧。目前■★■,大多数学者在讨论企业数据赋权问题时,并未根据人工智能产业发展的特点、数据类型的特征★★,构建符合企业数据价值的结构性■■◆■■★、类型化权利体系。数据财产权理论主张对数据进行财产保护■◆◆■■,不利于数据在人工智能产业中的流通使用◆★★◆;数据新权利理论将企业数据视为全新的民事权利★★,未能充分考虑企业数据的历史渊源和技术背景,使得对该问题的研究与既有的民法体系难以自洽■★◆■■■;数据持有理论强调治理范式,保护的客体仍为数据利益■■◆★★■,没有从根本上明确企业数据的权利范围和权利内容。
正是由于人工智能技术的兴起■■★◆◆★,使得企业数据的价值不断被重视◆◆◆★■■,产生了企业数据赋权的保护需求。企业数据权体系的构建应当以促进产业发展为根本,构建科学合理◆■■、宽严相济的企业数据权体系。企业数据权利体系的构建应当以促进人工智能产业发展、实现企业数据流通复用为价值导向。
从ChatGPT到sora★◆,大模型对于数据的处理能力不断加强,可以预见随着通用人工智能时代的到来,数据迭代速度更快。通用人工智能视野之下,企业数据赋权具有鲜明的时效性,一方面要促进数据的有序开发◆■★◆,另一方面又要对企业数据权的保护期限进行限制,促进已经被迭代的数据尽快进入公有领域,实现数据共享共用。
智能时代,万物皆可数字化,但并非所有的数据都是可以直接使用的数据资源★◆★■。数据之上的个人信息需要隐匿,零碎的数据需要进一步收集整合★★★◆★。企业对数据进行收集、脱敏、清洗、分类、排序、整合◆◆◆■■■,使得数据成为可供进一步加工使用的数据资源★◆★■■◆。在谷歌★■★◆■,至少有四成的工程师天天在处理数据,然后通过数据得到知识,通过知识使得计算机变得更智能。一方面企业在数据的收集和整理过程中投入了时间、财力■■■、管理等方面的资源,另一方面获得技术(算法)、智力加工的支持,这使得企业数据产生了商业利益,需要通过赋予数据资源持有权来实现权利保护。
企业数据权的地域性体现在权利产生的前提条件方面■◆★,企业数据要在国内获得保护就应当在国内产生或者登记。企业数据权的地域性亦体现在对企业数据的审查管理方面◆◆★◆◆◆。智能时代■■★■,企业数据涵盖了社会经济生活的大量信息,涉及国家安全。因此各国都出台了数据的监管措施,对数据实行分类分级保护制度。对于可能影响国家安全的企业数据,在数据处理、数据传输过程中进行安全审查,构建数据安全合规有序跨境流通机制。
数据加工是数据利用最为核心的环节,企业基于对数据加工的实质性投资产生数据权利■◆★◆。经过加工的数据可以成为分享◆■、转让的客体,但并非所有的加工数据都具有交换价值,只有真正意义上实现一般意义上且公认的★◆“价值增值■■◆★◆◆”的数据才能成为客体。数据经过加工产生了两类数据产品★■。一种是模型产品,例如文生语言智能模型ChatGPT、文生视频智能模型Sora。另一种是知识产品■■★■■,例如分析报告或解决方案等。企业数据作为一种生产要素■■◆,经过加工产生了新的数据。因此■◆■,在整个数据利用体系中,数据加工权处于核心地位。通过赋予数据加工使用权,使得企业加工数据的过程得到法律的保障,加工的产品得以顺利流通★★◆◆◆,不断促进数字经济的发展。
相比于专用人工智能,通用人工智能对于基础数据要素的需求更大,产生的数据产品也更为集中,数据持有企业在数据流通交易中应做到公平◆◆■、合理◆★■■◆★、无歧视和透明,防止数据垄断行为的发生■■■★◆。企业数据流通交易的渠道是多元的,既可以进行场内交易,也可以进行场外交易,符合数据合规和数据安全的企业数据可以进一步实现跨境流通和跨境交易。通过打造可信的数据流通交易体系,增强数据的可用、可信、可流通、可追溯水平,有序发展数据跨境流通和交易■◆★■,实现数据共享互利。
数据资源持有权包含两方面的内容■◆■,即数据资源持有者持有的数据系合法获取,数据资源持有者基于对数据的合法获取对数据进行管理控制。合法获取他人数据既包括对于他人原始数据的获取,也包括对他人数据要素和数据产品的获取★■■◆■★。管理控制数据指的是企业有权对合法收集的数据进行脱敏、清洗■◆■★★、分类◆◆、排序、整合。数据管理是数据加工的前序和准备工作,通过对企业数据实施清洗、分类、排序等管理措施◆■★◆★◆,数据得以转化为可供生产使用的数据资源。企业基于对数据的获取和管理而产生数据资源持有权,以此排除他人未经许可使用相关数据◆◆★◆★。
非法获取他人数据是侵害企业数据资源持有权的典型行为。例如,在腾讯公司诉珍分夺秒公司侵害商标权及不正当竞争纠纷案中,珍分夺秒公司通过使用近似商标★■★、近似软件名称及宣传语等方式误导微信公众号平台用户下载其■◆★“公众号助手”软件,并通过■★★◆◆“公众号助手”软件下载过程获取微信公众号用户的账号■★、密码★★■■◆,属于对微信公众号账号、密码等数据的收集★★■◆、存储行为。上述行为可以认定对企业管理的数据进行了非法的获取和存储公海赌船大爆奖★■■■★,侵害了企业的数据资源持有权。又如,在北京微播视界有限公司与上海六界信息技术有限公司、厦门市扒块腹肌网络科技有限公司■◆★★◆■、浙江淘宝网络有限公司不正当竞争纠纷案中,六界公司利用技术手段非法获取◆★★★“抖音”平台上抖音用户直播打赏记录及主播打赏收益相关数据,并通过自行整理计算后予以公开展示★■,其行为系非法获取“抖音◆◆■”平台持有的数据,侵害了“抖音”平台的数据持有权。
以数据资源持有权■◆◆◆◆★、数据加工使用权■★◆◆★★、数据流通交易权为主体的企业数据权■◆,本质上是以数据资源和数据产品为区分客体形成的权利体系■◆★■。企业通过对数据资源的管理而形成数据资源持有权,数据资源经过加工使用形成数据产品★◆◆◆■,数据产品形成过程中产生的民事法律关系构成了数据加工使用权的权利客体,数据产品的经营又产生了企业数据流通交易权的需要。企业对大数据进行脱敏★★■★、清洗、分类、排序、整合而形成数据资源,在这个过程中并不产生新的数据,这是数据资源持有权与数据加工使用权在客体上的明显区别■◆。在企业数据权体系中,数据资源持有权是基础权利,数据加工使用权是核心权利,数据流通交易权是价值实现。在企业数据的三种权利之中★★,最为重要的是数据的加工使用权,数据加工使用权的构建对于保护人工智能生成的数据产品至关重要★◆★。构建企业数据权◆■,本质上是以数据加工使用权为主体、数据资源持有权和数据流通交易权为“两翼”的权利体系◆★★。
数据资源应当保护个人信息。网络用户在使用模型产品过程中会留下大量的数据,这些数据能够让通用人工智能为我们提供更加个性化的服务◆◆★◆◆★。然而,如果这些数据被滥用或泄露◆★★★,将会给我们带来巨大的安全隐患。数据资源持有权得以存在的前提是个人信息收集的合法化,以及个人隐私的匿名化。倘若数据资源的获取未得到个人信息主体的同意,抑或数据在清洗过程中并未进行个人隐私的匿名化,未删除具体的生物信息,则数据资源本身不具有合法性◆★■★■,也难以产生法律可保护的利益。
李航|我国个人金融数据保护的理论适用和规则完善——以“卡—梅◆■■◆★◆”框架为核心进路