2009年1月24日星期六

[翻译]Google analytics shortcut-GA如何工作

理解Google analytics系统的构造(比如它如何采集数据、识别访问者、创建报告),是理解本书将在以后章节要谈论高级信息控制系统的关键。在我们开始讨论“过滤器”、“目标”和“高级功能”之前,让我们先回顾一下系统工作的基本法则。

数据收集和处理

我将用图表1来解释Google analytics是如何收集、和展示数据的。

数据采集开始于用户从网络服务器访问一个网页之时,服务器以向用户的浏览器发送所访问的网页作为回应(步骤#1)。当浏览器处理数据的时候,它将访问可能存放被请求网页主要部分的其他服务器,这要归功于Google analytics的跟踪代码(Google Analytics Tracking Code -GATC)。

用户的浏览器向台Google analytics的服务器发出代码访问请求(步骤#2),Google analytics的服务器则向访问用户的浏览器发送代码。所有的代码都包含在一个叫做urchin.js的文件里。一旦浏览器接受了代码,GATC在打 开页面的同时就开始生效。在代码执行期间,代码识别用户的基本属性和他的浏览环境,如用户在你的网站停留多长时间,用户从哪里来等等。

转载请注明来自:www.hongchenghao.com,洪成浩编译

当所有的需要的数据成功收集之后,GATC就放置(或者上传,依据具体情况而定)一些COOKiES(步骤#3),这些我们将在本书以后的章节进行讨论。这些COOKIES用于储存访问者的信息,写完coockies之后,监测代码就向Google analytics服务器发送数据。这些数据通过访问一个隐藏的JIF图片文件传送给服务器(#4)。当Google analytics服务器收到访问请求之后,它将所有的数据保存在一个叫做“日志”的巨大的文本文件里(#5)。在日志文件里,Google analytics为每次页面刷新(pv)创建一访问记录。日志文件里的每一行都包括着每次页面访问的很多属性,这些属性包括:

•页面访问是什么时候发生的(数据和时间)

•访问者是从那里来的(关联网页,还是搜索引擎等等)

•网站被用户访问了多少次(来访用户数量)

•访问者所处的位置(地理分布)

•访问用户是谁(IP 地址)

当所有的数据都被储存在日志文件里之后,数据采集步骤就完成了,剩下的就是数据处理了。

每间隔一段时间,通常是几小时,Google analytics就开始处理日志文件里的数据了。在处理过程中,每行日志文件都被分割成几段,每段内容都描述一个页面浏览的独立属性。这有一个简单的日 志记录行(特别说明:这个不是真实的Google analytics日志文件,仅仅是个范例。)

65.57.245.11 www.epikone.com - [21/Nov/2006:19:05:06 -0600] "GET

/__utm.gif?utmwv=1&utmn=323703347&utmcs=utf-8&utmsr=1600x1200&utmsc=32-bit&utmul=enus&

utmje=1&utmfl=8.0&utmcn=1&utmdt=EpikOne%20-

%20Google%20Analytics%20Support%2C%20Training%20-%20Urchin%205%20Software%2C%20

Analytics%20Consulting&utmhn=www.epikone.com&utmr=-

&utmp=/ HTTP/1.1" 200 35 "http://www.epikone.com/" "Mozilla/4.0 (compatible; MSIE 6.0;

Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)"

"__utma=100957269.323703347.1164157501.1164157501.1164157501.1; __utmb=100957269;

__utmc=100957269;

__utmz=100957269.1164157501.1.1.utmccn=(direct)|utmcsr=(direct)|utmcmd=(none)"

相信这里的多数数据都是很难辨认的,仅仅有部分是比较突出,比如:数据和时间(Nov 21, 2006 at 19:05:06),访问用户的IP地址(65.57.245.11),是比较容易辨认的。

Google analytics将日志文件里的每个数据段都转换成一个叫做“field”(领域?)的数据单元。比如,IP地址变成了“访问者IP”。这对理解每个页面浏览里的众多属性中的每个属性都很重要,而且每个属性都被存放在不同的文件里。

在每行数据都分解成不同的文件之后(步骤#6),这些数据将通过“过滤器”进行过滤处理(步骤#7)。“过滤器”是你添加在google analytics里的商业规则,它决定着那些数据出现在你的报告里,以什么形势出现在你的报告里。

最后,在“过滤器”过滤完你的数据之后,报告就被创建(步骤#8),而且储存在数据库里(步骤#9)。Google analytics里的每一个报告都是通过比较来创建的,比如“访问者城市”,以一整块的数据来显示(访问次数、浏览量、跳出率、转化量等等)。

一旦这些数据处理完毕并储存在数据库里,数据处理就完成了。当你(或者是其他用户)想查看报告时,相应的数据就被调用出来,并且发送到你的浏览器。

特别说明

一旦Google analytics处理完了数据,并且存放在了数据库里,这些数据就不能改变了。这就意味着,历史数据不能被更改或者再加工。在设置或者统计是的任何错误将永久的影响数据的质量。这同样也意味着,任何配置的改动也不会影响历史数据。

(未完待续)//转载请注明来自www.hongchenghao.com,作者洪成浩//

没有评论: