•页面访问是什么时候发生的(数据和时间)
•访问者是从那里来的(关联网页,还是搜索引擎等等)
•网站被用户访问了多少次(来访用户数量)
•访问者所处的位置(地理分布)
•访问用户是谁(IP 地址)
当所有的数据都被储存在日志文件里之后,数据采集步骤就完成了,剩下的就是数据处理了。
每间隔一段时间,通常是几小时,Google analytics就开始处理日志文件里的数据了。在处理过程中,每行日志文件都被分割成几段,每段内容都描述一个页面浏览的独立属性。这有一个简单的日 志记录行(特别说明:这个不是真实的Google analytics日志文件,仅仅是个范例。)
65.57.245.11 www.epikone.com - [21/Nov/2006:19:05:06 -0600] "GET
/__utm.gif?utmwv=1&utmn=323703347&utmcs=utf-8&utmsr=1600x1200&utmsc=32-bit&utmul=enus&
utmje=1&utmfl=8.0&utmcn=1&utmdt=EpikOne%20-
%20Google%20Analytics%20Support%2C%20Training%20-%20Urchin%205%20Software%2C%20
Analytics%20Consulting&utmhn=www.epikone.com&utmr=-
&utmp=/ HTTP/1.1" 200 35 "http://www.epikone.com/" "Mozilla/4.0 (compatible; MSIE 6.0;
Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)"
"__utma=100957269.323703347.1164157501.1164157501.1164157501.1; __utmb=100957269;
__utmc=100957269;
__utmz=100957269.1164157501.1.1.utmccn=(direct)|utmcsr=(direct)|utmcmd=(none)"
相信这里的多数数据都是很难辨认的,仅仅有部分是比较突出,比如:数据和时间(Nov 21, 2006 at 19:05:06),访问用户的IP地址(65.57.245.11),是比较容易辨认的。
Google analytics将日志文件里的每个数据段都转换成一个叫做“field”(领域?)的数据单元。比如,IP地址变成了“访问者IP”。这对理解每个页面浏览里的众多属性中的每个属性都很重要,而且每个属性都被存放在不同的文件里。
在每行数据都分解成不同的文件之后(步骤#6),这些数据将通过“过滤器”进行过滤处理(步骤#7)。“过滤器”是你添加在google analytics里的商业规则,它决定着那些数据出现在你的报告里,以什么形势出现在你的报告里。
最后,在“过滤器”过滤完你的数据之后,报告就被创建(步骤#8),而且储存在数据库里(步骤#9)。Google analytics里的每一个报告都是通过比较来创建的,比如“访问者城市”,以一整块的数据来显示(访问次数、浏览量、跳出率、转化量等等)。
一旦这些数据处理完毕并储存在数据库里,数据处理就完成了。当你(或者是其他用户)想查看报告时,相应的数据就被调用出来,并且发送到你的浏览器。
特别说明
一旦Google analytics处理完了数据,并且存放在了数据库里,这些数据就不能改变了。这就意味着,历史数据不能被更改或者再加工。在设置或者统计是的任何错误将永久的影响数据的质量。这同样也意味着,任何配置的改动也不会影响历史数据。
(未完待续)//转载请注明来自www.hongchenghao.com,作者洪成浩//
没有评论:
发表评论