使用Google Analytics辨别虚假流量

虚假流量是指那些为了骗取广告费通过人为操作产生的流量,(人为操作可能是点击你的广告,访问制定的landingpage,或者完成某个简单的任务。具体情况还要根据不同的广告形式来判断。)这种流量通常不会在网站上产生任何转化行为。虚假流量可能是通过程序产生的,也可能是人肉产生的。后者的成本会更高些。行为更智能一些。也更难防范。

这里简单的介绍几种使用Google Analytics辨别虚假流量的方法。首先把流量产生的背景设定为某种CPA(Cost Per Action)广告,并且我们对广告的URL通过工具网址构建器将来源统一设定为bluewhale(utm_source=bluewhale)。这样,所有通过这个广告产生的流量来源都将被记为bluewhale

具体的广告URL形式:

http://bluewhale.cc/?utm_source=bluewhale&utm_medium=cpa&utm_campaign=bluewhale_traffic

下面在Google Analytics报告中对这个广告产生的流量进行检查,看看是否有虚假流量存在。检查的思路是先分割出广告产生的流量。然后使用不同的维度对这部分流量进行检查。通常虚假流量都是人为控制完成的。在行为上会有一些统一的特征。检查的方法就是找到这些统一的特征。

使用高级群组分割流量

在检查前先要将这部分广告流量与网站的其他流量进行分割,高级群组是最好的选择。因为我们之前对流量进行过来源标记,所以只需要创建一个来源等于bluewhale的高级群组就可以分割出这部分流量了。

流量来源高级群组

创建完成后,在报告中选择使用这个高级群组。这部分流量将会贯穿整个报告。这也是在检查流量前的准备工作。避免其他来源流量的干扰。

流量产生的时间

使用的Google Analytics报告:访问者—访问者趋势—访问次数

24小时访问数

这里的时间要精确到每小时的访问数据。通常,网站正常的访问流量会分布在一天中的各个时段,即使有访问高峰,在曲线图中也会是较为平滑的曲线(广告刚上线时除外)。而虚假流量是人为控制产生的流量。为节省成本不会在意流量的时间分布,所以会在时间曲线上发现流量突增的情况。所以,如果流量过于集中在某个时段,或者在某个时段有了不正常的增长。这部分流量就可疑了。

当然也不排除有的程序会计算好日期和时间端,并按时间曲线模拟点击。如果碰到这种“智能流量”的情况,就要继续使用第二种方法。

流量的地理来源

地图覆盖图使用的Google Analytics报告:访问者—地图覆盖图

通常访问网站的访客会来自各个不同的地理位置(Google Analytics通过访问者的IP来判断流量来源的地理位置信息)。所以在地图覆盖图报告中可以看到很多不同地区的流量来源。而虚假流量通常很难使用多个地区的不同IP来产生流量。所以通过地区覆盖图来看,如果流量来源都集中在一个地区,这部分流量就很可疑了。

这里可能你的广告只针对某个地区的访客,所以访客的地理位置范围对你不适用。或者是你又遇到了“更加智能”的流量,比如,人肉流量!可以通过代理或者是分布在不同地区的兼职人员模拟出来自多个地理位置的访问。那么请接着往下看。

流量的网络属性

使用的Google Analytics报告:访问者—服务提供商

服务提供商

服务提供商报告显示的是网站访客所使用的网络接入方式,正常情况下网站访问者的接入方式应该是千差万别。而虚假流量的接入方式会很单一。所以如果这个报告里只显示了1-2种服务提供商名称,就说明你的流量很可疑了。但其实这里还是没有回答上面的问题,就是那部分超级智能的人肉流量。因为人肉流量的接入方式也会有很多种,在服务提供商报告里是无法识别出来的。那该如何辨别人肉流量呢?别急,这个问题很快就会有答案了。

流量的跳出率

使用的Google Analytics报告:访问者—访问者趋势—跳出率

24小时跳出率

跳出率是衡量页面质量的指标,反过来看,也是辨别虚假流量的好工具。如果发现在某个时段网站的跳出率突然增高,找到那个时段的流量与前面的访次时间段,地理位置信息和接入方式综合对比。如果符合前面的任何一个条件,这部分时段的流量都非常可疑。

流量的网站停留时间

使用的Google Analytics报告:访问者—访问者趋势—网站停留时间

24小时网站停留时间

网站停留时间其实并不是一个非常准确的指标,会受到cookie30分钟生存期的影响。但可以配合着前面的几个报告共同对可疑流量进行进一步验证。

进入路径&点击分布图

使用的Google Analytics报告:内容—热门内容—进入路径

进入路径

通常我们都会为广告活动制定一个登录页面 landingpage,所以广告的入口页面只有一个。但访问者来到网站后会有不同的行为,他们会点击不同的链接,访问不同的页面,并且在不同的页面结束对网站的访问。这些都是人为操控很难完成的。虽然现在的某些“智能流量”也能完成2-3次的点击行为。但都是通过预先设定的。所以它们的访问路径和结束页面基本相同。

与目标报告匹配

使用的Google Analytics报告:流量来源—目标

流量来源_目标

最后一种方法,也是你在每次的广告活动前最应该做的。就是为流量设定目标。Google Analytics现在升级了目标功能。你可以为流量设定多个目标。通过多个维度来检查流量。目标的完成度是辨别虚假流量的最好方法。很多智能流量可以绕过跳出率,停留时间和访问时间分布等等指标,但很少有能够完成目标的。当然这也要依你设定目标的复杂程度来定。如果设定的CPA是完成购物,那么这对虚假流量来说就是一个杀手级的目标。如果目标只是注册用户或者是填写信息,人肉流量都是可以完成的。

本篇的几种方法都已经说完了,好像还是没有能完全辨别出虚假流量的方法。是的,虚假流量在不断的模仿真实的流量。并且人肉流量又是那么廉价。让我们防不胜防。(之前看过一篇文章里介绍说,人肉流量的一个点击只有几分钱,很多学校里整个宿舍都在进行这种任务。)单靠Google Analytics报告可以辨别出一部分虚假流量,更多的虚假流量要通过时间的检验才能够现形。比如在广告活动期过后,这部分流量的回访率,驻留率,等等。

大家对虚假流量有更好的辨别方法吗?也和我共享一下你的经验吧。期待你们的留言。

——【所有文章及图片版权归 蓝鲸(王彦平)所有。欢迎转载,但请注明转自“蓝鲸网站分析博客”。】——

Comments

  1. 宋天龙 says:

    呵呵,其实总结起来看就是分为两个方面:

    首先是高级群体细分出这部分流量;
    然后就是看访问者本身属性、网站行为。

    看完之后和整体网站用户行为进行对比就可以分辨出来了

Trackbacks

  1. […] 第4章 网站流量的那些事儿——网站流量分析。解答了常见的流量分类问题。并提供了多种辨虚假流量的方法,让我们在日常营销过程中更好地认识流量。 […]

  2. […] 第4章 网站流量的那些事儿——网站流量分析。解答了常见的流量分类问题。并提供了多种辨虚假流量的方法,让我们在日常营销过程中更好地认识流量。 […]

  3. […] 第4章 网站流量的那些事儿——网站流量分析。解答了常见的流量分类问题。并提供了多种辨虚假流量的方法,让我们在日常营销过程中更好地认识流量。 […]

  4. (20170310)虚假流量初步分析(规律总结)

      参考虚假流量判断文章: 使用本福德定律甄别数据造假:http://mp.weixin.qq.co

Speak Your Mind

*