1、危险的大数据数据从哪里来事实上,所谓“大数据时代”的说法并不新鲜,早在2010年,“大数据”的概念就已由美国数据科学家维克托迈尔舍恩伯格系统地提出。他在大数据时代一书中说,以前,一旦完成了收集数据的目的之后,数据就会被认为已经没有用处了。比如,在飞机降落之后,票价数据就没有用了;一个网络检索命令完成之后,这项指令也已进入过去时。但如今,数据已经成为一种商业资本,可以创造新的经济利益。数据能够成为一种资本,与移动互联网有密切关系。随着智能手机、平板电脑等移动数码产品的“白菜化”,Wi-Fi信号覆盖的无孔不入,越来越多的人不再有“在线时间”和“不在线时间”之分,只要他们愿意,便可几乎24小时一刻不
2、停地挂在线上;在线交易、在线支付、在线注册等网络服务的普及固然方便了用户,却也让人们更加依赖网络,依赖五花八门的网上平台。而随着科技的进步,以往需要几盒软盘或一张光盘保存的信息,如今只需一片指甲盖大小的芯片,即可全部储存而且绰绰有余;以往需要电脑、显示器、读卡器等专门设备才能读取的数码信息载体,如今或许只需一部智能手机和一个免费下载的APP第三方应用程序,便可将数据一览无余。大数据时代的科技进步,让人们身上更多看似平常的东西成为“移动数据库”,如带有存储芯片的第二代银行卡、信用卡,带有芯片读取功能的新型护照、驾驶证、社保卡、图书证,等等。在一些发达国家,官方为了信息录入方便,还不断将多种“移动
3、数据库”的功能组合成一体。很可能出现“灾难性大数据”数字化时代使得信息搜集、归纳和分析变得越来越方便,传统的随机抽样被“所有数据的汇拢”所取代,基于随机抽样而变得重要的一些属性,如抽样的精确性、逻辑思辨和推理判断能力,就变得不那么重要,尽可能汇集所有数据,并根据这些数据得出趋势和结论才至为关键。简单说,以往的思维决断模式是基于“为什么”,而在“大数据时代”,则已可直接根据“是什么”来下结论,由于这样的结论剔除了个人情绪、心理动机、抽样精确性等因素的干扰,因此,将更精确,更有预见性。不过,一些学者指出,由于“大数据”理论过于依靠数据的汇集,那么一旦数据本身有问题,在“只问有什么,不问为什么”的模
4、式下,就很可能出现“灾难性大数据”,即因为数据本身的问题,而做出错误的预测和决策。早在伊拉克战争时,一些军事记者就美国第一个“数字化师”第四师的表现指出,“过多但无法辨析真伪和价值的信息”和过少的信息一样,对于需要做出瞬间判断、一旦判断出错就很可能面临生死考验的战地官兵而言,同样可能是一种危险,甚至灾难。斯坦福大学专家特来沃尔哈斯蒂也指出,“大数据”的理论是“在稻草堆里找一根针”,而面临的问题是“所有稻草看上去都挺像那根针”。而乔治梅森大学专家瑞贝克高尔丁则提出“数据提供者造假”的危险,在“大数据时代”变得更有害,因为“大数据”理论建立在“海量数据都是事实”的基础上,但人们无法控制数据提供者和
5、搜集者本人的偏见和筛选。近年来已有不少学者指出,拥有最完善的数据库、最先接受“大数据”理念的华尔街投行和欧美大评级机构,却每每在重大问题上判断出错,这本身就揭示了“大数据”的局限性。不仅如此,“大数据”时代造就了一个传感器和数据库无所不在的世界,而政府、情报部门和大商业机构在这方面有着先天优势,这很容易造成信息数据的“单向透明”,对小公司、个人的隐私和利益构成伤害。危险的芯片卡由于“大数据”炙手可热,数据的流失、泄露和私下买卖也成为噩梦,全球各地不时发生的个人信息被盗,可被看做“大数据时代”对个人生活的伤害,而“维基泄密事件”则提醒强力部门和各国政府,“大数据”的魔力同样会对强者构成威胁。或许
6、是为了证明这一点,2013年4月24日,一名加拿大广播公司的记者,为验证某北美信用卡公司信誓旦旦的“安全承诺”,在大庭广众下做了个试验:他使用一台市面常见的三星Galaxy S3智能手机,在谷歌Play在线商店下载了一个免费APP第三方应用程序,在公共场合距离一名陌生人三四英寸(约10厘米)远,用手机扫描,成功读取了装在陌生人衣袋中钱包里的一张信用卡芯片中的资料,包括卡号、持卡人姓名和到期日,然后他用窃取的这些信用卡信息,让这位陌生人为自己埋单在自动售货机上买了一罐可乐。事实证明,在“大数据时代”,芯片卡可能比磁条卡安全系数更差密码的设置和芯片加密功能可防范传统的窃密手法,却在移动数码产品AP
7、P第三方应用程序的配置面前不堪一击:加拿大安大略省女皇大学教授戴维斯基利科恩指出,无需什么特别的专业技术和设备,一个普通人仅凭一部巴掌大的智能手机,就可以在几英寸距离内窥视其他人“移动数据库”里的隐私,或许您没有信用卡,不使用智能手机和平板电脑,但护照、身份证、社保卡、图书证、健身卡、驾照您总会有一样或几样,而所有“移动数据库”内都会储存几项大同小异的关键信息:持卡人姓名和生日,这些关键信息或许能帮助窃密者破解更多的“数据库”。偷数据如此容易一些商家对“大数据时代”的商业捆绑开发,也在有意无意间助长了个人信息数据的“不设防”:脸谱上点一个“赞”,或许不知不觉就参与了一项商业营销活动,用户的个人
8、数据也在懵懂中向相关广告方敞开;第三方应用程序廉价又方便,但使用者点击“授权”时,或许已打开自己的“移动数据库”大门而不自知今年3月,欧洲议会公布的一项研究报告指出,云计算时代的“大数据”对个人隐私的威胁不仅存在,而且比人们想象的更严重。加拿大多伦多大学信息教授安德雷克莱门特指出,脸谱和微博等社交网络和新一代移动通信技术的结合,令个人信息搜集在“大数据时代”变得十分容易,而对个人信息数据保护则变得越来越难。2011年,加拿大隐私委员会曾做过一项调查,结果显示,60%的受访者认为,和10年前相比,如今他们的个人隐私变得更加不安全了,其中55%的受访者认为,社交网络会泄露他们的个人隐私。业内人士指出,由于“大数据时代”商业和经济驱动力的巨大推动,信息交换变得极为方便,然而保护却变得十分困难,作为个人,即便加倍小心,也往往防不胜防。如今,许多人的生活已变得越来越离不开智能手机、平板电脑和社交网络,而这也令个人数据的安全形势变得更加复杂您很难判断,究竟谁在获取您的个人信息,以及他们打算怎样使用这些“偷来的数据”。