中国IDC圈10月9日报道:在网络推广营销中,当我们开始开展一项SEO工作时,第一件要做的事情是要保证我们做的任何事情都可以有数据的支撑——而不是自己的直觉。SEO网站推广的主要数据来源来自两块:网站的服务器日志、第三方流量分析工具。
第三方流量分析工具
Google Analytics的安装
对于免费流量分析工具,Google Analytics绝对是其中的佼佼者(以下简称GA)。不过如果网络推广的月浏览量大于500W的话,只有Google Adwords的用户,才能继续免费使用GA进行流量的记录与分析。
在GA添加需要追踪流量的网站以后,它会提示你添加一段JavaScript代码,到每一个你需要追踪页面的标记之前。代码的添加可能是一件很轻松的工作,但也可能非常麻烦,主要取决于网络推广的模板层。
先提下常见开源博客程序WordPress的方法,它采用了包含的模板处理方式,比如网站首页、列表页、文章页等自身的网络推广模板,都是只有当中一部分的。而包含网页LOGO等的网页头部,都使用WordPress的get_header方法来加载另一个独立的模板文件(get_header方法本质上是PHP里面的include函数)。简言之,只要在header.php那个文件上面添加代码,包含它的所有网页都会跟着改,很快就可以把GA代码添加好。
那么,至少要在每个网页的网络推广头部,额外包含一小段加载全局JavaScript的区块,以方便的添加全局性的JavaScript代码。
虽然未必在添加GA代码时,对可能糟糕的网络推广模板结构去进行更改,最多到几十个不同的模板文件里面去分别加下代码就是了(当然也要花些时间去保证没有漏过哪些页面)。但一次性搞定一些本质性的问题会带来很多日后的便利性——比如又要换一套统计代码。
网站服务器日志
Apache,Nginx等常用服务器的内置日志配置格式Combine已经可以满足大多数SEO分析需求。它看上去类似是这样的:
111.111.111.111 – - “[20/Feb/2012:18:09:25 +0800]” “GET / HTTP/1.1″ 200 3121 “http://semwatch.org/” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”
必须记录的信息诸如:访问来源IP、访问时间、访问页面、HTTP响应状态码、访问来源及客户端标识等,这些在Combine日志格式里面都有。
在确保服务器日志可以满足其他部门的分析需求下,至少要确保上面提到的几项被记录在服务器日志里面。但也不要将任何可以记录的数据都记录下来,只选择实际需要的部分,不然会使得网络推广日志体积非常大,不利于分析起来的效率。这些内容可能需要和运维进行沟通解决。
然后关于日志的分析,我认为没太多固定的准备工作可做,因为它的数据来源是原始的(raw似乎听上去会更有感觉?),所以可选择的数据维度几乎是无限的。因此尤其要按实际需求进行相应的网络推广处理与分析。
对于一些要求并不是特别高的日志分析需求,可以尝试使用光年日志分析系统。虽然我个人对所有图形界面的实用类程序都不带好感,但它提供了一些很不错的网站推广数据维度的思路。
听说有一家大型的旅游网站是采用MongoDB结合Map/Reduce进行日志分析的,我个人也用过MongoDB实现过前面提到的光年日志分析的一部分重要功能。所以感觉MongoDB是个可以考虑的选择。
相对最麻烦的网络推广事情或许是如何说服程序员为了一些看似小的需求而修改模板结构,这边就略过了。
总结:网络推广营销优化中上面叙述的这些,但情况并不总是理想的,尤其对于使用网站框架自己进行开发的网站,有时并没有将包含这样的方式很好的运用。这可能是网站推广的建设规范不完善的关系,也可能是网站推广需求导致了确实无法使用和WordPress类似的包含方式。