请不要被「小道消息」这个名字误导.在这里,我只想努力为读者呈现一幅中国互联网的清明上河图.

我们的隐私都是怎么泄露的?

发布日期:2018-01-02 08:49:09 +0000

这篇文章谈谈隐私。之所以谈这个话题,是看到吉利集团的李书福在一次会议上这么说:


我心里就想,马化腾肯定天天在看我们的微信,因为他都可以看的,随便看,这些问题非常大。


李书福懂汽车,但看起来不太懂互联网和隐私是怎么回事。不过,他的说法倒是一部分用户的想法,腾讯为此还特地做了 回应


作为一个比较理性的用户,我当然不会认为「马化腾肯定天天在看我们的微信」,原因也简单,信息量太大了,看我的信息也没用。我倒是想天天看马化腾的微信,以便决定怎么买腾讯的股票。当然,这是玩笑话,我要说的意思是,如果要看别人的隐私,你的目的是什么,要付出多少代价。


李书福在会议上说的另一句话更值得注意:


现在的人几乎是全部透明的,走在路上到处是摄像头,开个车到处都是闪光灯,很亮,稍微一停他就啪啪啪的照,你坐在车里面几乎很难回避这个现实。


如果看过美剧 《疑犯追踪》 ,会发现编剧担忧的不是未来,而是我们的现在。我们已经来到了没有隐私的时代。


但是,这并不意味着我们不应该重视自己的隐私。因为,你的隐私数据泄露到什么程度,对你才是真的有影响。


假设,有一台超级计算机,The Machine,知道你所有的隐私信息。但是,这台计算机从不会用你的隐私去危害你。那么,你可以认为自己的隐私是安全的。这台超级计算机,某种意义上是存在的, 你自己 就是知道你所有隐私的超级计算机, 你的手机 上也存储着你的所有隐私信息,还有,这个世界上 某个不能言说的地方 ,可能也存储着你的所有隐私信息。怕么?已经是这个样子了,不需要怕,但你应该知道当下的情况。


有人说,那么,反正我信息都被超级计算机知道了,那么我干脆破罐子破摔了,隐私值几个钱?当然不是这样,如果你小区附近房地产中介知道你的电话号码,也知道你最近在搜索引擎上搜过附近地段的房价,很可能就会频繁给你打电话,对你造成干扰。你不在乎的隐私,这时候就变得有价值起来。


经常有人向我抱怨,说我刚在百度上搜索了某个疾病信息,没过几分钟就有私人医院给我打电话,「百度真垃圾,出卖我的信息」,这个情况下,百度可能只是背锅的。你并不了解打开手机上的浏览器,访问百度,输入关键词,返回结果这个过程中都发生了什么,所以你觉得出了问题就是因为百度。


我当然不喜欢百度公司,过去的文章里也经常骂百度,所以,在这里居然说不都是百度的错,应该不会被认为是收了百度的钱。


以我所知,上述这个查询的过程,中间有好几个环节都会把你的行为透漏给第三方。一个是运营商层面的  DPI(Deep Packet Inspection)技术实现的,一般称之为「深度报文检测」或「 深度包检测」。另一种,是灰产的流量劫持。当然,还有其他可能性,比如你用的浏览器也在分析你的关键词,你的输入法也在分析你的关键词…


为什么你这么值得分析?因为有些搜索意向很值钱。如果搜索房价,你买房的倾向性很高;如果搜索疾病,可能有求医问诊的可能;搜索教育类信息,可能你要给孩子上培训班… 这些背后都存在很大的商业价值,所以,无论是灰产黑产,都会盯着。


再比如,你这个月信用卡账单信息刚发到你的手机上,没过一分钟,又来了一条垃圾信息,是现金贷的广告。一次两次你可能觉得就是巧合,一段时间之后你发现,每次都这样。


做现金贷的公司怎么知道你的信用卡账单信息呢?按照前面李书福们对微信的逻辑来推测,肯定这个黑锅是银行信用卡部门背,一定是他们泄露了用户的信息嘛。


答案是,不排除是 银行信用卡部门出问题。 更大的可能是,还有其他各种原因。可能是银行信用卡部门泄露信息,比如,银行内部有员工监守自盗,定期把记录导给第三方公司卖钱,这种事有没有过?有,公开报道里就有。但这种方式效率太低,还以有其他可能么?有,第三方短信发送方层面会不会出问题?会,银行接口信息过来了,号码包传过来了,中间有无数个可能性导致信息泄露,比如被黑客拖走了信息。还有没有可能?有,电信短信网关层面直接过滤分析,然后按照各种信息分门别类,卖信息就行了。哪一种更有效率,那一种方式更精准,哪一种成本最低,哪一种可能性就越大。


双 11 的前后,几乎每个人都收到大量的营销短信。其中的一部分短信来自己你买过东西的商家,其他则是不明来源,他们怎么知道你手机号码的?获取号码的方式也有很多种可能性。


你在一个店铺买东西,基本上留的是自己的号码,这个号码会在淘宝存储,会在支付宝存储,会在物流公司存储,会印在快递单上,会被快递小哥看到… 商家和快递公司给你的通知信息,里面包括你的联系方式,还有无数个途径会泄露你的号码。甚至,当你拆了快递,扔了包装盒在垃圾堆里,那上面还有你的信息呢。当然,现在有些公司开始注意这方面的信息处理,把一些信息隐藏掉,但仔细看快递包装,上面信息还是很完整的。


尽管一些公司网络层面的安全防护做的很好,但如果有人假扮清洁工,去翻这家公司垃圾桶里的各种信息,可以找到的有价值的信息肯定不少。这个工作,专业领域叫「社交工程」/「社会工程」(Social Engineering)或简称「社工」。


我们生活的周围有商业间谍吗?你没见过,但不代表没有。或许,这些商业间谍就在做这些事情,但他们不会去知乎上洋洋洒洒给人揭秘自己的工作吧。


总有人被电话诈骗之后一头雾水,「我什么都没做啊,骗子怎么会知道我这么多信息」,你不可能什么都没做,你所有网站用同一个密码,你去商场购物,你买车,你住院生孩子,孩子上幼儿园,你出行坐飞机订票,你旅游办护照,你在社交网络上晒美食,晒自拍…你的一切日常行为,都会涉及到隐私的泄露。这些信息被拼凑起来,可能比你自己都了解你,然后用来骗你或是骗你的亲戚朋友,难度就降低了很多。


即使你觉得自己是普通人,并不代表你的信息不值钱,并不代表你不会被人盯上。要知道,能泄露你隐私的地方实在是太多,你的信息,加上其他信息,拼接起来,就可能被用作更坏的用途。比如,现在还有不少公司被骗钱,方式很简单,骗子通过某种方式获取到公司的通信录和 QQ 信息,然后伪造一个群,把新来的财务拉进群,假冒公司 CEO 告诉财务打款到某个账户。这种骗局听起来很小儿科,但现实世界里还在不断发生。


李书福说担心腾讯看他的信息,那么,是不是他应该鼓励公司员工更多用电话,用传真、短信或是邮件去交流信息呢?那样恐怕他就更睡不着觉了。在相对安全和更不安全之间选择一个,应该怎么选?


如果腾讯可能看你的信息,那么电信运营商是不是更能看你的信息?我们要问,腾讯看你信息的 动机是什么?代价是什么? 如果有人证实,腾讯某个员工偷着看用户的聊天信息,那么,腾讯明天股价会怎样?要付出的成本太高。假设某个人一旦做坏事,代价是多大?你的信息通过微信传输到另一个用户,有多少个不受控制的中间环节?中间环节越少,出问题的可能性就越少。


一部分新卢德主义(Neo-Luddism)者的倾向性是,认为应该回归到信息技术发明之前的状态,不用智能手机,不发邮件,不网购,拒绝沟通和交流,隐私信息会得到最好的保护。另一种极端的想法是,生活里只用绝对安全的端到端通信,不安全的通信方式一律不用。但这两种方式都不可能满足大众的需求。


人人都可以提高自己隐私保护的可行措施是什么呢?


  1. 永远不要贪便宜。比如填写一大堆个人资料去换取折扣或优惠信息的行为并不可取。

  2. 不要偷懒。比如所有网络服务都用同一个密码,几乎就是开门揖盗的行为。

  3. 具备基本认知:自己的隐私是有价值的。


我们对隐私应该担心什么呢?怎样设定隐私的边界?如果我们不得不交出自己的所有隐私(指纹、DNA),有什么机制能确保隐私不被滥用?如果有人恶意侵犯公民隐私,惩戒是否足够有震慑力?当一个人遭遇网络暴力的时候,怎么保护自己?


如果我们未来生存在 The Matrix 之中,我们的隐私还将包括什么呢?


我们真正应该担心的该是什么?



题图:Roy Lichtenstein