【原创】百度取消传递referer关键词对SEO数据分析的影响?

Tags:

【孙文研/作者】

6月28日,百度宣布已于6月25日正式取消HTTP referer中的关键词。这对于网站的数据会有一定影响。

Baidu Referrer Keywords Gone Forever

referer是如何影响数据报告的?

HTTP referrer 存在于HTTP header中,记录了一个网页被请求的来源地址。当一位访客进入网站的时候,网站统计及分析工具会记录下访问页面的referer,我们假设你使用Google Analytics报告。通常分为这样几种情况:

1. referer为空,访问将被记为直接访问流量。

2. referer 不为空,但不是网站本身域名下的URL,也不是网站统计及分析工具预先设定好的搜索引擎,访问将被记为引荐流量。

3. referer是网站本身域名下的URL,属于网站内部流量,不会被归为以上任意一种。

4. referer 是网站统计及分析工具预先设定好的搜索引擎列表中的其中之一,访问页面的URL后面有预先设定好的参数(比如GA中的utm_source、utm_medium、utm_term、等)表明是付费流量(paid search),访问会被记为付费搜索来源流量。

5. referer 是网站统计及分析工具预先设定好的搜索引擎列表中的其中之一,但是访问页面的URL后面没有预先设定好的参数表明是付费流量的(比如GA中的utm_source、utm_medium、utm_term、等),访问将被记为自然搜索来源流量(organic search)。这个是SEO做分析时一直关注的,尤其是做国内SEO(比如百度、360、搜狗、等)。而Google早在2011年就开始不传递HTTP referer中的关键词。

当然另一个情况是,网站统计分析工具通常也支持自定义,将其他的某个或某些referer定义为某个流量来源。

百度这次取消传递referer中关键词显示,某程度上只是跟进国际标准做法。比如早在2011年Google就开始不传递HTTP referer中的关键词,后来Bing也跟进了这个做法。所以长期一直做Google SEO或Bing SEO的国外SEO同行们,他们大多早就有应对方法。

来一个实例仔细研究

自然搜索报告和付费搜索报告中检索词将会受到影响,我们先说付费搜索(SEM / paid search)。付费搜索中,我们依然可以通过竞价账户后台以及为着陆页面URL添加参数的方式追踪到触发广告的关键词以及用户检索词。

自然搜索流量(organic search)的数据以Google Analytics 为例,从百度来源的检索词在报告里将显示为(not set)。注:Google Organic Search的一直显示为not provided。

我们从GA报告中观察了几个网站,时间段为2015年1-6月,几个网站大致都出现类似以下图中的趋势。

baidu-organic-sessions-not-set-increasing

1. 百度organic的访问(sessions)中在1-3月份期间很正常的提供organic关键词。

2. 在4月份(4月中)开始已经开始。估计是百度在4月开始测试强制用户从https://www.baidu.com进行搜索(不是原来的http://www.baidu.com)。5月份这个行为继续。

3. 到了6月份,尤其是6月底,(not set) organic关键词的比例一下子飙升。猜测百度应该已经对PC端的搜索全部强制到https://www.baidu.com上。

应该怎样解决?

对此,百度提供了两个解决方案:

1) 使用百度站长工具中流量与关键词工具
2) 使用百度统计

先说百度站长工具中流量与关键词工具。

这个工具存在于百度站长工具后台,但是这个工具有一些局限

a.只能记录到部分流量较大的关键词,很多长尾关键词则不会展示出来
b.只能记录到30天内的详细数据
c.难以将每个关键词及对应的着陆页面批量导出

当然,这个报告也有独特的优势:它记录了关键词及着陆页面对应的排名,展现,点击及CTR数据,可以方便SEO们调整网站的Meta Description和Title,以提升网站在搜索引擎中的点击率。

再说百度统计,分三种情况:

a.网站原先就已经使用百度统计,那么恭喜,百度的这次调整对网站数据影响并不大

b.网站原先没有使用百度统计,但经过百度这次调整,决定更换网站现有数据统计工具为百度统计。
这个做法将会产生更大的问题,不同的工具从数据采集规则到指标设定都不同,更换工具意味着先前的网站数据与之后的数据难以对接。

c.网站原先没有使用百度统计,经过百度这次调整,开始使用百度统计,原先的网站数据统计工具继续使用。

这个做法可以尝试,但需要注意网站页面性能以及JS冲突的问题,可以尝试一些网页标签管理工具。

此外,从百度统计导出的自然搜索流量检索词报告不建议与之前其他的网站分析工具的检索词报告比较,同样还是因为不同的工具数据采集规则到指标设定不同,对比这样的数据意义不大。

还有其他解决方法吗?

通常在SEO实际工作中,看自然搜索的检索词报告一个重要意义在于判断网站内容质量是否符合用户需求。因此我们可以把自然搜索检索词报告中获取不到关键词这一部分单独拿出来,按照着陆页面进行细分,通过平均页面停留时间,跳出率,页面访问深度,转化率等指标去评判内面内容质量。