孙总想找一家数字营销公司来将自己的线下业务互联网化。他想先找一些了解网络营销的资深人士咨询一下。于是他在自己的浏览器里打开了百度,接着在输入框里输入“数字营销顾问”,从搜索结果里找到了极诣。极诣通过Google Analytics看到了这位访客,也知道了这位访客是通过哪个关键字进入访问的。本来故事就到此终结了,因为极诣并没有安装第三方广告联盟的代码。但是如果孙总访问的是别的网站,而那家网站又安装了第三方的广告联盟代码,那孙总就被标记了。
搜索词历史是标记受众的重要手段
如果网站安装了第三方的广告联盟代码,孙总就会和“想找数字营销顾问”绑定。当孙总访问该第三方广告联盟(DSP)的其他网站时他就会被“推送”和“数字营销”相关的广告。各个广告主们知道有孙老板这样一位有需求的潜在客户就会对这个广告位进行竞价。这就是我们熟知的Real-time Bidding(RTB)。
由于搜索引擎的搜索词代表了一种“意愿”(intention),它比人物基本属性(demographics),如年龄、性别、地区,以及人物偏好(psycho-graphics),如摇滚、喜剧、网上购物更强且更有价值,因此它是DSP精确定位访客的重要手段。
搜索词是如何获取的
当用户进行一次页面访问时,无论是http协议还是https协议都会有一个header,这个头部信息包含了referrer。也就是说,当该请求是来自于其他页面时,你的网站将会得到这个请求来源。我们曾经探讨过这个referrer,实际上是同一个东西。在你的服务器log文件中,你也会找到相应的信息。如果你的网页中添加了第三方广告联盟的代码,那么该第三方广告联盟也会得到一个副本。
那么搜索词信息从何而来呢?在百度的搜索结果页面(SERP)上的每个结果到你的网站的链接中都会有wd=XXXXX的参数。这就是用户的搜索词。而这个链接的URL会被包含到referrer中去,这便是搜索词的传递。
那么问题来了,极诣说了半天到底想说什么?我们想说的是
百度或将不再提供wd参数
我们先回顾一下墙外发生的事。在2011年,谷歌宣布将开始对登录谷歌后的用户的自然搜索采用https协议,并在所有的https搜索结果中不再提供搜索关键字,在不久之后谷歌把它扩展到非登录用户,再然后扩展到PPC。一时间哀鸿遍野,“SEO已死”的论调四处可闻。这就是著名的Not Provided事件。如今,有90%以上的谷歌流量已经不再有搜索关键字信息。你很难知道用户是如何通过谷歌访问你的网站的。
在百度方面,我们已经可以看到开始出现不带wd参数的百度自然搜索访问。
极诣拿了一个大型网站某天的log做粗略统计,来自百度的自然搜索流量:
匹配类型 | HTTP | HTTPS | 小计 |
---|---|---|---|
link?url= + wd= | 975 | 1788 | 2763 |
link?url= | 97 | 0 | 97 |
s? + wd= | 4576 | 110 | 4686 |
总计 | 5648 | 1898 | 7546 |
从上面表里的这个孤例里我们可以看出几点:
- 目前有1.3%的搜索访问不带关键字信息,百度没有必要传递wd参数给你的网站。目前你能拿到仅仅是“福利”。
- 不带搜索关键字信息并不特别少见,极诣在昨日自测的时候就全部都不带wd参数。而且可以排除并不是由于url过长导致参数舍弃。
- 不带搜索关键字的搜索流量目前只在http搜索中存在。
- 百度同时在使用新版本的link?url和老版本的s?wd的url。四六开的分布。
- 百度正在部署https加密的搜索。四分之一的搜索已经在https上。
手机搜索呢?
手机搜索(m.baidu.com)中百度搜索词的参数为word,目前还保留了搜索词。
一点感想
以上研究我们可以得出一些结论,虽然极诣的结论有些凌乱,但我想我们还是可以得到一些启示。
- 笔者咨询过百度为什么还会有link?url和s?同时存在,对应的环境是怎么样的。答案是“无法回答”。但至少极诣可以肯定和百度用户的登录状态无关,和浏览器或许相关。
- 搜索词是长久以来我们研究“SEO”的一项福利,它并不是想当然的,也不是一种权利。
- 百度已经开始“省略”一些搜索词,其目的在当前可能是因为反作弊或者“增强安全性”,但最终会是打压广告业的竞争对手。毕竟百度是一个广告公司,其百度联盟是国内最大的广告平台。
- DSP们要进一步加强其他维度获取用户肖像,增强其准确性以面对未来的风险。
先聊这些,我们下次接着探讨。