Google 解决收集数据信息的1些剖析

2021-03-11 00:50 admin

点一下追踪

Google logs 把所有客户在其服务商品上的正确引导点一下(广告宣传,行動,作用点一下这些)都纪录起来。

方式 -伴随着客户键入数据信息的方式立即进到(客户名,登陆密码等),Google 纪录了時间和时间和递交的部位。

申请注册 Google 帐号时的表单

键入种类是掩藏的,应用户不容易看到或进到特殊行业的数据信息

向客户推送后递交 (掩藏) 的部位

键入种类是掩藏的,因此客户不容易看到或进到到特殊数据信息里头。

客户应用引入数据信息,并根据报表得到如何才把”申请注册”放在甚么部位客户会点一下

Cookies

Google 把它全部网站特性的 Cookie 都用到了,另外,他还留下了广告宣传 Cookie 来追踪客户在网站上的个人行为。根据这类方式,Google 便可以在有 doubleclick 和AdSense 广告宣传的网站下追踪该网站就任何1个客户的网站个人行为。

储存的cookies目录

储存在系统日志文档的服务器恳求

每个向 Google 服务器传出的恳求都储存在系统日志文档里头,而储存的內容取决于传出恳求的种类。

系统日志文档

URL - http://www.google.com/search?hl=en&q=seomoz&ie=UTF⑻

从客户努力的恳求而得到的 IP 详细地址,能够依据这个IP 详细地址精准定位该客户的实际自然地理部位。

时间,時间和时区偏位的客户

客户的語言

客户的实际操作系统软件

客户的访问器

别的信息内容就沒有那末关键可是务必实际的叙述向服务器传出的恳求,服务器的回应和转译模块。

Javascript

Google 有小一部分的 JavaScript 早已嵌入到互联网技术上诸多的网站上面。当客户的访问器实行情况中的脚本制作情况下,Google 就可以够了解许多有关这个客户访问习惯性等关键信息内容(自然地理部位,实际操作系统软件,访问器种类和版本号等)

网站信标

Google 向许多清算显示屏嵌入小规格的全透明 gif 照片,就仿佛 JavaScript 1样,1个客户免费下载隐形的照片而且向 Google 推送她们的电脑上信息内容。

网站信标样例(甚么?你看不见?这才是关键)

掌握1下 Google 是如何解决这些数据信息

储存

Google 应用1个內部数据信息库叫 BigTable 拓展到近乎 100W 个服务器

Google Data In 2006

 

Data

Size (TB)

Crawl Index

800

Google Analytics

200

Google Base

2

Google Earth

70

Orkut

9

Personalized Search

4

这缩小的数据信息的尺寸贴近 TB(1024GB)。而 Google 表露的数据信息尺寸超出 1PB(1048576GB)。这乃至不必须考虑到 AdSense,Gmail,Google Map,街景,Google照片,或别的独享数据信息库。而且这些数据信息全是超出2年前的。

很多的数据信息剖析

这就有点像 Charlie and the Chocolate Factory (电影《查理与巧克力加工厂》)。大家都了解有许多数据信息都进到到 Google 那里,大家也了解有很多解决好的数据信息会导出来来。大家就只是不知道道二者之间是产生了甚么,是如何变换的。

大家也了解 Google 自身有许多运优化算法则机构他的数据信息,Page Rank 便是最知名的了。听说,Google 也是有许多繁杂的 spam 的过虑系统软件,內容拷贝过虑系统软件,种类侦察运优化算法则,当然語言分析程序流程,图象鉴别手机软件,和别的很多的繁杂的手机软件。

永久性备份数据

Google 上的数据信息最后的栖居地将会会在永久性储存。Google 的隐私保护政策提醒一些客户数据信息始终都不容易彻底被删掉,由于早已被永久性的备份数据。

了解Google搜集特殊客户的数据信息状况

下列全是1些当客户与许多网站互动的情况下 Google 搜集到的客户的材料的清单目录。这代表着实际上有更多的数据信息被 Google 搜集而却又沒有公布的。但是实际上无知便是幸福快乐,当你看完以后,你也许会觉得很不爽:

Google客户数据信息搜集状况汇总:Google客户数据信息搜集状况汇总

你能坚信 Google 会帮你信息保密1切信息内容么? 你敢坚信 Google 会遵循全部信息保密规定么?

原文详细地址:http://semwatch.org/2009/11/evil-of-google-data