时间:2018-04-16 10:05:03
来源:光明网-时评频道 作者:张田勘
当地时间4月10日、11日脸书(Facebook)首席执行官扎克伯格分别在美国参议院司法和商务委员会、美国众议院能源和商务委员会的两场听证会中,围绕用户数据隐私等问题接受了议员们的质询。
议员们在质询中使用得最多的词汇也是最担心的问题就是隐私(该词共出现了84次),也即用户的个人数据是否被泄漏。扎克伯格除了表示其公司在阻止网络信息被滥用方面做得不够好,“这是我的错,我很抱歉”外,从头到尾坚持脸书并没有销售用户数据,而是广告会针对某些具体类别的用户进行投放。
事实上,要弄清脸书上的哪些用户信息或数据被泄漏,以及如何处置这类数据泄漏问题,扎克伯格和议员、公众,对脸书事件的看法并不一致,前者不认为是泄密,至多是被滥用;后者则认为个人数据被不当分享就是泄密。
如果按规范的大数据分类、收集和利用来看,社交网站或软件用户的信息(数据)主要有两类:一是用户选择向大家自愿分享的内容,二是让广告更具相关性的数据。在脸书上,前者指的是用户自愿发布到脸书上公开分享的个人信息,包括姓名、个人简介等;后者则指的是脸书收集的个人信息,包括个人喜好等,从而对用户投放相关性广告。
脸书上的第一类信息,其实不算隐私,因为在页面上已经公布,但即便如此,个人信息被第三方采用仍需获得用户的知情和同意。第二类信息,即脸书或其他公司收集的个人用户数据,无论是商业公司还是政府,对个人数据的收集和使用首先要进行数据匿名化。
欧盟数据保护条例(GDPR)对于匿名化的定义是:匿名化是指将个人数据移除可识别个人信息的部分,并且通过这一方法,数据主体不会再被识别。匿名化数据不属于个人数据,因此无须适用条例的相关要求,机构可以自由地处理匿名化数据。美国的《健康保险可转移及责任法案》(HIPAA)是以去身份化来定义匿名化,“通过处理使得数据不能识别特定个人,或者没有合理的基础能够认为该数据可以被用来识别特定个人。”
因此,数据匿名化至少要满足两个标准,一是仅从该数据本身无法识别特定个人,二是即使结合其他数据也无法识别特定个人。
如果脸书等公司严格按这样的法律要求来做,8700万名脸书用户的个人信息是由用户自己提供的,而不是由脸书收集的,人们并不会通过匿名化的数据知道谁是谁,做了什么、喜欢和讨厌什么。匿名后的用户个人数据,也同样可以用来进行分析,为决策作依据。
所谓依据,首先就是无数个人数据汇集成的大数据(匿名数据)只是提供了某种现象,并呈现为事物A与B的某种关联性。例如,脸书用户中在一段时间很多人买过香蕉,而且买的是产自马来西亚的香蕉,就能提示,在某段时间美国人喜欢吃马来西亚产的香蕉,这是一种相关性。
其次,根据大数据的分析只能是预测而非得出肯定结论,即美国人在某一段时间爱买香蕉的行为,只能预测在来年相同的时间段内可能香蕉消费在美国有一定市场,但不能得出美国人会大量消费香蕉的结论。
顺理成章地,大数据信息和分析只能对决策起辅助作用,或者只是决策的一个变量或要素。还从香蕉的例子来讲,大数据的信息和分析,可以成为美国进口商是否在来年进口马来西亚香蕉或者马来西亚蕉农是否需要大量种植香蕉提供依据。
担心脸书用户个人匿名信息泄露影响了美国大选,也至多是从大数据的相关性、预测和辅助决策上帮助了竞选团队。但是,这种信息的收集和利用,所有网络公司都可以收集到。任何具有信息技术背景的个人、公司、机构和政府,都可以通过不同的社交媒体、网站、论坛、网络实时通讯工具、网上交易、电子邮件等收集到大量的文字、图片、音频、视频、等数据,并且是以“4V+O”为特征的大数据或个人信息,即数据容量大(volume)、数据的快速获得性(velocity)、数据的多样化(variety)、数据的准确性(veracity)和数据的实时性(online),然后对这些数据进行分析、算法学习和获得相应的分析结果等。
因此,只要脸书是按美国法律对个人数据的收集进行了规范,其泄密也不过是间接泄密,是经过处理后的匿名信息的泄漏,能接触到这些信息的人是无法解读出更多数据隐含信息的。
当然,这并不意味着脸书没有责任。脸书必须通过这次事件进一步规范个人信息的收集和利用,例如知情同意权等。
就脸书而言,已经提供了一些改进措施,让用户能方便地更改隐私设定,阻止自己的信息被滥用;对立法和社会而言,美国国会可能会推动新的立法,严格监管互联网和信息技术公司,并限制政治广告的准入和投放等。通过这些方法,既能保证个人信息受到保护,也让无数个人信息汇集成的大数据得到合理和有效使用。