与隐私权天生对立的大数据
六年前,《大数据时代》一书出版,美国政府发布《大数据研究和发展计划》。《纽约时报》惊呼:“大数据时代已经来临,一场用数据改变世界的技术浪潮随之席卷全球。”
但时至今日,比较客观的分析认为, 2018年全球大数据产业规模不到500亿美元 ,产业影响力与当初的预期差距较大,数据显然改变不了世界。
不仅如此,2018年初,Facebook网站泄露5千万用户信息的丑闻曝光,英国一家名叫“剑桥分析”的数据公司弄到了这些数据,并通过数据分析和信息推送影响选民,帮助特朗普当选总统。
大数据所带来的信息泄露和权利侵害问题日趋严重,已经波及到政治敏感地带。5月,欧盟《通用数据保护条例》生效,对个人数据的使用和监管作出了严苛的限定。
在我国,2015年国务院印发《促进大数据发展行动纲要》,大数据产业迎来概念爆发期,2016年大数据成功融资的项目超过400个,但当年8月就发生了高中毕业生学费被骗导致身亡的“徐玉玉事件”,行业所伴生的个人资料买卖、侵权伤害、骚扰诈骗等乱象被全面揭示,整顿随之开始。
2017年6月,《网络安全法》实施,对信息资料的安全保护作出了严格的规定,车辆、学历、房产、税务等政府数据接口陆续关闭。
此后,虽然政策热度并未下降,但大数据行业发展疲态尽现,融资能力和增长潜力不断收缩,行业伦理架构和业务模式都面临反思和重塑。 “大数据”,到了需要进行正本清源的时候。
新兴科技勾勒的远景是诱人的 :人工智能代替生物人从事各种劳动;区块链支撑起一套完全平等、诚信、没有权威和失衡的社会运行体系;算力通过无限扩张最终实现了数字对现实世界的完全解构和支配;而大数据则是人、机器和系统正确理解彼此、精准预测未来和做出恰当选择的根本保证。
在这样全息交互、完全透明的乌托邦里,现实社会的各种问题都将消失,所有差异都将不复存在,全球一体化、财富和价值的普世化、人与自然的统一等幻想轻而易举就可实现。彼时,人和人性都需要重新定义,权利的概念也会消失,象隐私权、个人信息保护等问题当然也就不复存在。
这样的技术远景可能永远都只是假设, 但大数据技术在对待个人隐私时,早就开始将这种假设作为立论前提使用了。
像Hadoop这样广泛应用的开源大数据软件,早期没有任何安全机制,而是假定了一种完全可信的环境;许多大数据企业完全漠视数据中所涉及的隐私问题;许多大数据专家则信仰“隐私在算法上不成立”的理念。
大数据行业这么做似乎也有一些道理:因为通常情况下,科技创新只有摆脱人文方面的羁绊,才有可能取得突破,所以那些成功的创新技术都会挑战现有伦理秩序,大数据当然也不例外。
但大数据挑战的是隐私领域,这个领域离人性太近,因而与其他技术完全不同。
从本源上,隐私权是自然权利;从价值上,隐私权基于正当性和自治性而产生;从功能上,隐私权所确认的隔离与差异是多元与自由的保障,能为社会进步奠基。
由此可见隐私权的体制根基无比深厚,大数据或者其他更高明的创新技术撼动不了它,或者说根本就不应该去招惹它。 但大数据是一种预测未来和精确判断的技术,且存在“大数据悖论”,也即只有在足够提前量和少数人独占关键信息的情况下,产业价值才能最大化。
所以,真正有意义的数据离不开最能贴近主体心理活动和行为轨迹的那些信息,也就是最隐私的那部分信息,如此说来, 这个行业与隐私权天生就是对立的。
大数据产业对此显然没有足够的警惕,早期的野蛮发展已经招致了各个层面的质疑和干预,大数据产业如果不能有效缓解与隐私权之间的冲突,法律管制必然会越来越严厉,照此发展下去,行业的生存空间和盈利模式都可能发生颠覆性变化。
解决问题的途径无非两个 :一是努力完善身份信息和画像信息双重架构的权利保护体系。除了要保护与个人身份直接相关的信息之外,那些借助大数据画像技术可以确认身份的间接信息、行为信息、非关系型数据等,也需要得到足够的保护。
至于具体应当包括哪些保护性机制,要根据技术进级的速度来不断扩充,过于狭隘的权利定义很容易被技术所规避,像《通用数据保护条例》,刚刚生效就已经过时了。
二是要尽快升级大数据安全技术。目前,平台、数据和隐私信息三个层面的安全技术水平都存在较大问题,需要在简单的数据脱敏技术之外,建构适用于多源数据环境的实质匿名算法保护机制。
乐观的是,从历史上看,隐私的范围一直在缩小,从农耕时代的住宅边界,到工业时代的人身边界,再到信息时代的数据边界,这个趋势很明显。
随着信息共享场景的增加和创新技术对个体差异性的削减,权利主体对保护隐私的认真程度必然也会下降。一直以来, 技术挑战伦理的最终结果都是伦理标准被改变,这对于大数据及其他创新技术来讲,无疑是希望之所在。
大数据这项技术的特点之一,在于它只反映和整理既有事实,而并没有创造新的社会事实,但它创造了一种认知和掌控社会事实的手段。 正因如此,大数据作为新技术, 其对于社会治理的意义要大于生成财富的意义。
美国作为世界警察,很清楚这里面的逻辑,从2012年起,几乎每年都会出台大数据方面的战略性文件,除了强调核心技术的重要性之外,强调最多的就是关键优先领域的大数据支持保障。 所谓优先领域主要是指军事和国家信息安全领域,最典型的例子就是由五个英语国家组成的全球监听组织“五眼联盟”对大数据技术的使用。
在全世界范围内, 政府占有的数据总量超过80% ,而且都是价值量较高的数据,政府还有权随时向私人部门调取数据,美国各类政府机关向Facebook调取用户数据的请求每两年翻一倍,而且半数以上是不给理由的秘密行动。
所以,大数据在横面上是与隐私权的冲突,在纵面上是对争议极大的“网络权力”的强化。政府可以将所拥有的数据便利归于权力,从而衍生出一种不容易被察觉的新型管制方式;也可以将之归于福利,从而促进决策优化和权力监督。
如何使用大数据这一手段,考验的是权力自我约束的能力 ;对于转型国家而言,考验的则是能否兑现从“社会管制”转向“社会治理”的承诺。
至少政府开放公共数据已成共识,这样做能够增进社会福利,促进产业的发展,帮助投资者预测房价,还能让美国的游说集团精准地推断议员的投票结果。
但这改变不了大数据时代公众相对于政府越来越弱势的地位 ,比如政府在物理世界里原本已经不能偷窥你,但通过数据就能够,所以,最终的出路仍然要回到权力制约之上。
而对于网络权力的制约目前并无成熟的机制,在强政府成为趋势的当今时代,似乎也看不到哪国政府对此显示出足够的兴趣,相反,依赖数据优势不断提升支配能力的“大数据暴政”现象日趋严重。
最新最严厉的大数据法规主要也是用来规范产业和监管市场的,而几乎没有约束政府的条款,从欧盟《通用数据保护条例》,到我国《网络安全法》,再到美国加州刚刚出台的《消费者隐私法》等,莫不如此。美国作为大数据第一强国,甚至没有制定联邦层级的“数据保护法”。
而且,“大数据暴政”看起来与体制没有关系,最多可以用来检验体制的纠错能力。
对于国内市场而言,重要的信息技术几乎没有原生的,在技术输入的过程中,存在“概念先行”的问题,互联网的发达使一种新概念很容易就能广泛传播,再加上人为赋予的金融或者财富暗示,能很快引发大众追风,最终形成了一种“概念诅咒”现象。
也即新的技术都要经过一轮概念化的炒作 ,炒作的过程中都会引发各种各样的风险事件,形成乱象,最终对公众造成伤害。电子商务的假货和欺诈;P2P的非法集资和跑路;区块链的“空气币”等,都经历过或者正在经历着诅咒期。
大数据也不例外,对隐私的侵犯和数据占有便利的滥用,远远不止于电信诈骗和电话骚扰,公共数据基于寻租动机流向个别垄断性的互联网企业几乎成了公开行为,这会将政府与市场之间的关系扭曲到极致。
在这个过程中,大众跟风的是概念,政府需要的是项目,企业得到的是网络支配权的强化和附带的暴利。非但大数据,各种概念不断推陈出新,显然不仅是为了引领观念,更非是对创新事物的准确总结,那些被过度强化的概念大多是为了掩盖利益的错位。
信息技术本质上是虚拟技术,将现实世界中的物质形态转化成信息形态是其最核心的方法。所以,在信息技术领域里, 越靠近物质端的技术,越具有基础性价值,构成各种应用技术和整个行业生态的根基。
这些基础技术的垄断企业依靠智力成果的价值溢出,也即知识产权的许可使用就能获取超额利润,对他们而言,扩大利润的路径有二:一是知识产权的收费机制稳定可靠;二是基础技术所衍生的应用范围无限扩充,所谓的“大数据”在很大程度上就是这种“扩充”的结果。
大数据作为互联网技术的边际成果和信息交互的冗余部分,在最近几年出现了空前快速的累积,互联网的顶级企业很快看到了商机,以及超常的、有些意外的利润预期,然后通过一些概念制造和前景描绘,大数据产业热潮随之而来。
中国是大数据数量最多的国家,自然也成了大数量产业风潮最盛的国家, 但这无法掩盖核心技术被他人垄断,对开源技术贡献不大,产业发展摆脱不了“我们的数据,别人的价值”的魔咒。
事实上,大数据中非结构化数据偏多,存在贫矿属性,顶着“在稻草里找到针”的光环,面对的却是“所有的稻草看起来都像针”的困境。
实践中许多企业所拥有的数据体系属于局部密集的稀疏矩阵数据体系,价值创造能力有限,产业发展前景不明朗,处在“先圈再说”的阶段,从技术到产业模式都有待升级。而要想真正实现脱胎换骨的升级,首先就需要尽快走出上述困境。
无论如何,大数据所蕴含的经济利益是现实而且诱人的,但这些利益的分配方式和转移路径却仍然晦暗不清,这主要是法律理念滞后所致。
现代权利体系是宪政产物,制度背景是民主法治,社会背景是农业和工业社会生活方式,随着时代的发展,这套体系落后是必然的。
信息社会虽然很难说是一种新型的社会形态,不足以颠覆原有的权利体系,但新型社会关系的形成却是无可阻挡的,这就要求必须建构新的法律权利类型,以调控新的互动方式和新颖标的物的交易。
法律理念和规范更新速度太慢,导致许多社会关系找不到对应的法律范式,最突出的表现就是私法领域里的人身 ——财产二元权利架构受到极大挑战,无法对实际存在的权益进行准确的概括,造成了权利饥荒。
人身——财产权利架构的根基是人与物的对立,这是人对于自然的技术能力不足时,为了突出强调主体性的结果。随着科技的进步,人与物之间的界限出现模糊化的趋势,人身的财产化,物的主体化,人与机器的统一等都正在发生,原有的根基必将被摧毁。
人身财产化早期的代表是智力的财产化,催生了知识产权,但知识产权最终被归结为人身权与财产权的结合,从而延续了既有权利架构的解释逻辑。
具体到财产权体系内部,这种挑战同样无处不在,如物权(人与物)债权(人与人)化、债权物权化、债权股权化,金融创新和区块链技术中的收益权独立化等,都是例证。
从这个角度而言, 大数据所面临的利益困局本质上是人格、身份、隐私等可否用来卖钱,也即个人信息的财产化如何获得伦理上的正当性。 个人信息与智力成果不同,更贴近人的主体性,成为可交易的财产违背既有伦理,因而很难找到合理的法律解释及适用机制。
最新的法律对此给出的解决方案是:从权利属性上,假设个人信息的匿名化在技术上已经可以充分实现,从而使之变成单纯的数据财产纳入财产权,但这显然与技术的现状不符;从交易路径上,设定能够满足主体控制自由的法律保护机制,以维持主体性原则,这显然又与产业的模式不符。
或者说,目前的作法只是试图借助立法技术,尽量让大数据回到传统的二元权利架构之中,为此只好容忍一些法律调控上的空白和不足。
这种立法实践显然只解决了一半的问题,其结果是个人信息的财产价值被那些合法或非法的占有者获得,而真正的权利主体并没有改变被动地位。
除了大数据之外,在其他诸多科技和金融创新领域,都存在类似的权利供给不足的困局,最终的出路恐怕是适应社会发展和文明变迁的需求,不断创建新型权利,乃至调整原有伦理标准。
“只要相关性,不要因果性”曾经是《大数据时代》最为推崇的原则。在完全采样且足够透明的理想状态下,根据大数据所揭示的过往行为轨迹或许可以预测未来,但纵然如此,也只能是在假设环境不变的前提下。
所以,“只要相关性”作为创新概念形成之初的号召性口号可以,作为实践中的指导原则却不足为用,无论信息技术怎样发展,因果逻辑对于认知过程的主导地位都是无法替代的。
大数据技术应用的结果显示:技术本身所蕴含的因果性恰恰正是评价技术水平的最重要的指标,而且大数据对于相关性的挖掘限于长尾信息和碎片化信息范围时,才具有一定价值,那些有效的决策仍然需要基于准确信息和因果判断。
同时,由于数据结构化程度不足,全样本大数据根本无法实现,数据清洗、分析在理论上存在障碍等原因,导致基于大数据的相关性判断失准严重,经常陷入验证不足和数据偏见的困局,从技术到商业模式都问题重重。
相关性是一种浅思维,是无法找到因果性的无奈选择,或许符合信息传递多媒介和碎片化的现实需要,但不足以成为上位的原则。
从实务看,大数据所揭示的相关性局限于经验层面,并且主要采用简单的算法验证,因而其结论不可靠是必然的,对于解决问题最多具有参考意义。相关性判断在转型社会更容易得到认可,与短期决策需求和过度的实用主义有关,甚至与泛道德化的社会现实有关,因为道德正是一种相关性评价机制。
事实上,历史就是一组大数据,只是这组大数据呈规律性分布,其内在的因果逻辑十分清晰,历史传承越长,逻辑沉淀越深,因果性也就越显著。在足够数据量的历史结构中,所有的问题都不能说是错误,而只是一种结果。
经验主义者总是借助不同文明之间的数据采样,基于比较和相关性论证来简单地判断对错,期望快速建立起一套全新的制度,从而结束转型过渡期。其所犯的错误与大数据产业一样,都是意图以相关性取代因果性,都只是一厢情愿。
总之,对大数据过高的定位和期待,使一项新技术和一个新兴产业过早地形成了泡沫,暂时走入了困局。 大数据的困局同时也是整个创新技术领域的困局,甚至是整个市场的困局。
未来之路唯有回归务实和理性,通过机制的完善,致力于核心技术的突破和产业长期价值的塑造,让曾经的困局转化为支持正确决策的数据,最终促进整个市场不断走向繁荣和稳定。
本文来自JIC投资观察,创业家系授权发布,略经编辑修改,版权归作者所有,内容仅代表作者独立观点。[ 下载创业家APP,读懂中国最赚钱的7000种生意 ] 返回搜狐,查看更多
责任编辑:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。