Blog on 27th Floor
主页 随便 电脑 电影 社会 阅读 下载 本站 存档
主页 随便 电脑 电影 社会 阅读 下载 本站 存档

AOL搜索数据泄露事件

08/13/06。  cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。


8月7日,AOL公布了65万8000用户的搜索记录,时间从3月到5月。这些用户是随机选择的AOL网络服务的用户,他们的名字或ID被用数字代替。AOL公布这些数据的目的是为了帮助搜索引擎研究者。但是这些数据实在太过私人化,因而成了一起不折不扣的个人隐私泄露事件,有人称之为一场噩梦,也并不为过。

从这些匿名数据找到这个人应该是可能的,不过没想到这么快。NYT报道里就公布了一位62岁的女士的名字,她在那个文件中的号码是4417749。她搜了一些有关地方,年龄,园艺,白蚁老年疾病等信息,但我不知道到底是哪条信息出卖了她。Wired也说,他们可以找到一个14岁的男孩以及一位女士。因为有人会搜自己的名字、地址、电话以及信用卡号,他们是想确认这个信息是否在网上,但现在这些记录都公布出来了。

最近应该没有比这个更让人记忆深刻的个人隐私泄露事件了。而我们这里还要实名制,真不知这样做的结果会如何吓人。

Wired的文章实际上是在解答有关此事件的一些问题。其中特别提到了在搜索时登录该网站是一个风险,那样实际上让搜索引擎把搜索同你的个人信息联系在一起;但不登录就没问题了吗?也不是,因为它们都有Cookie,而且为了方便起见这个Coodie通常的过期时间是2038年1月18日,或者是半年后或2036年,视乎服务的不同。这样,他们仍然能把你的搜索同你的连网数据联系在一起。

通过一些手段,比如匿名的代理,可以改变一下连网的数据,从而让他们记录一些不真实的信息,比如tor+Privoxy,或者定期清理Cookie(用Firefox这个很方便),但清理完马上上网也不可行,这样很容易认出两个记录是一起的。

其实就算没有太长的连续的搜索记录,通常某些重要的信息仍然可能定位一个人,比如信用卡号,没事还是别搜它;还有名字和地址,虽然你有可能搜索许多人名和其他地址,但通过这些信息定位你是绝对可能的。

但终归个人能做的事是有限的,还是要靠这些保存数据的公司,希望再也不要出像AOL这种好心但显然脑子缺根筋的事。当然我们这里没有人用AOL的网络服务。


08/13/06 14:25:42,由cathayan发表。目录:电脑

3条评论

这个数据400多MB,网上还有。这个地址也可以看:
http://data.aolsearchlogs.com/
泄露出来就挡不住了。

http://blog.cathayan.org/member/1 cathayan 于 08/13/06 14:27:41 发表. 

我前几天把那些下载下来了。

准备写个脚本分析这些数据。我想对于研究用户搜索引擎习惯肯定很有帮助的。

http://blog.vingel.com Vingel 于 08/13/06 14:49:49 发表. 

我也试了http://data.aolsearchlogs.com,非常有趣

于 08/14/06 12:26:21 发表. 


这篇文章已经关闭,不能添加评论和投票
I am watching and will delete all spam.

我的E-Mail


Copy&Paste Exchange

访问CPeX Group

订阅Feed

订阅Feedburner
Feedsky订阅
本站订阅

请登录

导航

cathayan.org Web

最新贴

RIME 小狼毫/鼠须管的极点及五笔拼音配置
Software that rocks or sucks less
一棵热带的树换新叶的过程
几个有用的Vim招术
论语七 述而
Nomacs 图像浏览器
Windows 文件校验
Windows 10 文件批量命名简单方法
Windows 10 文件删除高级操作
本站也算是有响应式设计了

最新评论

Powered by

Powered by Nucleus CMS

版权声明

Creative Commons License
Blog on 27th floor by Cathayan is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.
Powered by Nucleus CMS v3.71. Best view with Mozilla browsers.