电子商务网络营销实战志: [翻译]Google analytics shortcut-GA如何工作

理解Google analytics系统的构造（比如它如何采集数据、识别访问者、创建报告），是理解本书将在以后章节要谈论高级信息控制系统的关键。在我们开始讨论“过滤器”、“目标”和“高级功能”之前，让我们先回顾一下系统工作的基本法则。

数据收集和处理

我将用图表1来解释Google analytics是如何收集、和展示数据的。

数据采集开始于用户从网络服务器访问一个网页之时，服务器以向用户的浏览器发送所访问的网页作为回应（步骤#1）。当浏览器处理数据的时候，它将访问可能存放被请求网页主要部分的其他服务器，这要归功于Google analytics的跟踪代码（Google Analytics Tracking Code -GATC)。

用户的浏览器向台Google analytics的服务器发出代码访问请求（步骤#2），Google analytics的服务器则向访问用户的浏览器发送代码。所有的代码都包含在一个叫做urchin.js的文件里。一旦浏览器接受了代码，GATC在打开页面的同时就开始生效。在代码执行期间，代码识别用户的基本属性和他的浏览环境，如用户在你的网站停留多长时间，用户从哪里来等等。

转载请注明来自：www.hongchenghao.com，洪成浩编译

当所有的需要的数据成功收集之后，GATC就放置（或者上传，依据具体情况而定）一些COOKiES（步骤#3），这些我们将在本书以后的章节进行讨论。这些COOKIES用于储存访问者的信息，写完coockies之后，监测代码就向Google analytics服务器发送数据。这些数据通过访问一个隐藏的JIF图片文件传送给服务器（#4）。当Google analytics服务器收到访问请求之后，它将所有的数据保存在一个叫做“日志”的巨大的文本文件里（#5）。在日志文件里，Google analytics为每次页面刷新（pv）创建一访问记录。日志文件里的每一行都包括着每次页面访问的很多属性，这些属性包括：

•页面访问是什么时候发生的（数据和时间）

•访问者是从那里来的（关联网页，还是搜索引擎等等）

•网站被用户访问了多少次（来访用户数量）

•访问者所处的位置（地理分布）

•访问用户是谁（IP 地址）

当所有的数据都被储存在日志文件里之后，数据采集步骤就完成了，剩下的就是数据处理了。

每间隔一段时间，通常是几小时，Google analytics就开始处理日志文件里的数据了。在处理过程中，每行日志文件都被分割成几段，每段内容都描述一个页面浏览的独立属性。这有一个简单的日志记录行（特别说明：这个不是真实的Google analytics日志文件，仅仅是个范例。）

65.57.245.11 www.epikone.com - [21/Nov/2006:19:05:06 -0600] "GET

/__utm.gif?utmwv=1&utmn=323703347&utmcs=utf-8&utmsr=1600x1200&utmsc=32-bit&utmul=enus&

utmje=1&utmfl=8.0&utmcn=1&utmdt=EpikOne%20-

%20Google%20Analytics%20Support%2C%20Training%20-%20Urchin%205%20Software%2C%20

Analytics%20Consulting&utmhn=www.epikone.com&utmr=-

&utmp=/ HTTP/1.1" 200 35 "http://www.epikone.com/" "Mozilla/4.0 (compatible; MSIE 6.0;

Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)"

"__utma=100957269.323703347.1164157501.1164157501.1164157501.1; __utmb=100957269;

__utmc=100957269;

__utmz=100957269.1164157501.1.1.utmccn=(direct)|utmcsr=(direct)|utmcmd=(none)"

相信这里的多数数据都是很难辨认的，仅仅有部分是比较突出，比如：数据和时间（Nov 21, 2006 at 19:05:06），访问用户的IP地址(65.57.245.11)，是比较容易辨认的。

Google analytics将日志文件里的每个数据段都转换成一个叫做“field”（领域？）的数据单元。比如，IP地址变成了“访问者IP”。这对理解每个页面浏览里的众多属性中的每个属性都很重要，而且每个属性都被存放在不同的文件里。

在每行数据都分解成不同的文件之后（步骤#6），这些数据将通过“过滤器”进行过滤处理（步骤#7）。“过滤器”是你添加在google analytics里的商业规则，它决定着那些数据出现在你的报告里，以什么形势出现在你的报告里。

最后，在“过滤器”过滤完你的数据之后，报告就被创建（步骤#8），而且储存在数据库里（步骤#9）。Google analytics里的每一个报告都是通过比较来创建的，比如“访问者城市”，以一整块的数据来显示（访问次数、浏览量、跳出率、转化量等等）。

一旦这些数据处理完毕并储存在数据库里，数据处理就完成了。当你（或者是其他用户）想查看报告时，相应的数据就被调用出来，并且发送到你的浏览器。

特别说明

一旦Google analytics处理完了数据，并且存放在了数据库里，这些数据就不能改变了。这就意味着，历史数据不能被更改或者再加工。在设置或者统计是的任何错误将永久的影响数据的质量。这同样也意味着，任何配置的改动也不会影响历史数据。

（未完待续）//转载请注明来自www.hongchenghao.com，作者洪成浩//

电子商务网络营销实战志

2009年1月24日星期六

[翻译]Google analytics shortcut-GA如何工作

没有评论:

我的博客列表

博客归档

标签

Google analytics