题记:自己做个小搜索网站玩(实际就是装了Google,Yahoo和Bing等的搜索引擎而已),然后使用Google Analytics来检测用户检索的关键字。结果排在检索前几名的从来都是和S-E-X相关的词语(我把单词分开是因为我可不想Google给我送来这样的流量,呵呵)。一次无聊的时候查看站内搜索关键词报告,一个女同事从身边经过,“哇,你在看什么?”- 囧!
早知道这样的话使用Google Analytics的过滤器(filter)过滤掉这些词语了 – 很简单的操作,可以在GA的关键词报告中把所有S-E-X相关的词汇全部使用(比如说)G-F-W代替。不过这不是本文的主题。GA的过滤器可不是用来过滤敏感词汇的,而是根据你的预期需要,归纳整理你的数据的。
在上篇关于中,笔者提到可以通过GA的filter功能,把在Google Adwords中购买的广泛匹配的搜索关键字和用户实际搜索的关键字放在一起来看。有朋友问我如何才能做到,让我想起介绍一下GA中的过滤器的使用。
对于不很熟悉Google Analytics的朋友,推荐查看“”,这里详细的一一介绍GA各种基本功能,使用方法和案例,很是难得。
在我个人的应用范围中,GA过滤器主要帮助我做三件事情:,和。
使用GA过滤器来过滤流量可以分为3个步骤来完成:
做完这些工作之后,这个新的profile就可以开始收集符合条件的流量了。不过,注意,GA过滤器的作用是不可逆的。所以,
下面我便通过例子介绍这些用途。相信根据网站分析的需要,GA过滤器可能还能帮我们做很多其他的事情。你有什么经验吗?欢迎分享。
通过GA的过滤器,我们可以把不同的参数和维度交叉联系起来,生成交叉试图。比如上次说的购买关键字和实际查找关键字的交叉,还有下边第二例中和购买商品的交叉。
进行下边两步操作之后,你将看到GA中的关键词报告呈现题目中的形式,比如,你购买了“鞋”的广泛匹配,你会看到关于“鞋.(皮鞋)”,“鞋.(回力鞋)”的报告。
这里需要解释一下,为了读懂这个过滤器中正则表达式(Regular Expressions)的含义,进而举一反三,需要首先了解一点儿通配符(Wildcards)的含义.如果你会写.htaccess文件中URL rewrite的程式的话,你会发现这个是同样的道理。
{dy}步,我们先从搜索链接中把关键词提取出来。三个括号分别代表三个项目,后面有用;其中前两个括号中的内容确定代表搜索关键词的变量,Google的是q, Yahoo的是p, 如果你使用百度的话,还应该加上(|wd)。第三个括号中的是搜索关键词,我们提取下一个“&”前面的字符。
第二步,我们确认这是付费搜索的结果。
第三步,我们把字段A中的第三个项目,也就是$A3,放到{dy}个自定义字段中保存。
{dy}步,我们先提取以上保存的{dy}个自定义字段中的字符,“.*”是任意匹配的意思;
第二步,我们提取广告系列中购买的关键词;
第三步,我们把这两部分结合起来,组成一个新的广告字符,使用“.”连接(你也可以使用“-”),使用()分隔。
这里,我们把广告中的所有元素和转化效果进行挂钩,不过前提是广告链接中含有能被GA识别的GA的标准Tag,或者是搜索广告。
这需要5个过滤器来完成,然后在交易ID,商品名称和类别报告中,你都可以看到类似于“交易ID-来源-媒介(名称)”之类的报告系列。实际上,在这个案例中,你可以想象很多种组合的可能。
GA过滤器的另一个作用是对内容的重组,比如说,URI的重写,数据的向上卷起(roll up)。看例子:
很多网页的URL中有很多参数,是站内搜索也好,是分类索引也好。这些参数往往对应了网站内容的分类和等级,所以构建一个合适的报告来分析这些数据可以提供很多价值。不过,如果让GA自动来汇报的话,我们得到的仅仅是一长串的URL的报告,没有任何层次和联系。
通过GA的站内搜索功能可以部分解决这个问题,比如说GA可以自动侦测多达5个搜索变量,另外5个分类变量-不过,除非我的错误,GA是不能同时侦测这么多的变量的,每次它仅仅捕获最多一个搜索变量一个分类变量而已,其他的信息都丢失了;另外,通过搜索功能来解决这个问题,可以具有其优势,比如对于后续访问的报告,不过也有其劣势,比如内容的分散,等级层次不清晰,变量值的实际意义的缺失
这里我们来尝试使用GA的过滤器来提供另外一种补充方案:
URL Rewrite:在下边的例子中,我们已经知道type=10是指婴儿产品。通过这个GA过滤器,我们可以把“baby”归到“product”这个内容模块中(content group),然后把“baby”作为二级分组,整理所有相关的“reference”的信息。这样,在GA的按照URL的报告中,我们看到的便不再是一串常常的URL,而是一个Product的内容模块和所有的综合信息,然后我们可以降到次级的baby,然后降到ref。
注意:报告中使用的URL将是新生成的虚拟的URL,这个URL在网站中不可用,所以你点击它不会到达实际的页面,同时,对于这个网站配置文件,点击热图(heat-map)也将失效。
在这个例子中,我们把所有来自电子邮件的流量归结到一处,使之成为一个总体的报告。也许你已经遇到类似的情况,在GA中对于流量来源的报告中,对于从电子邮件来的流量,GA会报告一个很长的带有各种参数的URL,因为每个URL机会都不同,所以会有很多referring url,使报告看起来很吃力。下面的GA过滤器把这些流量整理到一处,得到类似于“webmail/邮箱服务商”的报告
本例中,广告系列来源可以根据需要换成引荐链接,在字段A中,参数主要是从Hotmail,yahoo mail的URL链接中总结出来的。
在”多看了你一眼”中我提到的关键词的roll up也可以通过GA的过滤器来简单实现。比如下边的例子,我们把所有带有baby的关键词都归结到baby一个关键词下面:
以下通过过滤器给未来流量分组的例子:
GA有预先定义的过滤器,比如排除IP地址,include或者exclude部分流量,相信这个大家应该都使用过。我这里想举得例子是按照广告营销活动分组(见图I-V)。
这里我想回答一个可能有人要问的问题:我们既然有了GA的高级分组(Advanced segmentation)功能,为什么还要费力去使用过滤器(filter)呢?
不得不承认,高级分组功能是GA的一个亮点,它对过滤器起到了一定的替代作用,并且除了其简单灵活的特点外,关键是它能够对历史数据进行再次处理,得到我们需要的结果。
不过过滤器却也有自己的优点和不可以替代的地方:
1.高级分组功能对处理大量数据的能力有限,在数据量过大或者时间过长的时候,GA并不会处理所有的数据,而仅仅抽取样本进行处理,然后给出估算的结果;而通过过滤器得到的结果没有此类限制,都是根据{bfb}的数据获得的结果,没有时间限制;
2.过滤器对流量的分割比较“彻底”。通过过滤器对流量进行过滤,我们所得到的网站配置文件就是仅仅处理符合条件的流量和内容,不会有其他流量和内容的干扰;但是通过高级分组获得的报告会有其他流量和内容的干扰;
3.过滤器对内容的重新组合功能和对URL的rewrite功能是高级分组所不具备的。
对过滤器的使用,需要预知商业需求,提前建好分组,因为它只对未来的流量有效;其次要注意的是对分组使用的过滤器要仔细编写,不要出现漏洞,导致结果的偏差;然后注意对流量的过滤和重组是不可逆的,所以再次提醒,一定要保留一个原始的网站配置文件!!
相信根据网站分析的需要,GA过滤器可能还能帮我们做很多其他的事情。你有什么经验吗?欢迎分享。
--
发表评论: