网络营销 > SEO技术 > 正文内容

避免站内出现镜像网页

2009年9月29日

随着目前SEO行业的普及以及知识点的日益增多,很多SEO技术细节往往被更多的SEOer们所忽视。甚至有时提到一些技术术语会让不少的SEO从业者感到陌生,今天Zeaer的这个技术话题是很多SEO高手们最容易忽视的细节 — 如何避免出现站内镜像网页

什么是站内镜像网页?
站内镜像网页是指一个网站中包含很多相同的页面,这些页面就连文字、编码等完全相同。在网站优化过程中,需要对网站的程序进行改良,避免此类网页的出现。否则会导致网站权重与信任度遭受影响。

如何避免站内镜像网页的出现?
1、 网站域名未作301处理。
例如网站首域名未做301永久定向,加以外部链接的疏忽就很容易导致搜索引擎同时收录几个相同版本的首页,这些页面只是访问Url不同而已,其实都是同一个文件。例如:http://xxx.org/、http://www.xxx.org/、http://xxx.org/index.html假如搜索引擎同时收录这3条Url,就会对首页权重造成不同程度的影响。仅需要将其它的访问途径都做301到首选域名上即可。

2、 站内Tags关键字标签与分类名称重复
这点是更多的Zblog或wordpress作者容易疏忽的问题,往往喜欢将分类名称与Tags标签使用相同的词汇,这样极容易引起分类页面与对应关键字的Tages页面造成重复,因为很有可能里面选取的文章都全部相同,只是访问Url不同罢了。解决办法,建站起初,做好整体的规划,Tags关键字标签要比分类词汇进一步细化,例如分类名称为SEO技术,那么当中的某一篇文章可以用“外部链接”这个词汇作为Tags,或者通过robots禁止蜘蛛抓取网站的所有Tags页面。

3、 内部链接不当引起的站内镜像网页
诸如很多网站的分页面返回首页的链接都是“/index.html”,这样很容易导致搜索引擎同时收录另一个版本的首页,这个跟第一条域名未作301比较相似。

不少的wordpress作者最容易忽略的细节,wordpress程序有一个Bug,一般的SEO很难发现这个细节。就是评论中存在着不规范的站内链接,而这些链接未曾加上“nofollow属性”就直接导致了搜索引擎收录了多个不同Url的相同页面,为了向大家更好的说明此问题,Zeaer特意找了一个例子,如图:

semyj
诸如Google收录的这两个页面完全是不同路径的相同页面,引起这个原因的问题便是未做处理的内部链接所致。如下图:

semyjpinglun
前台显示的评论链接属性截图

下面是网页源码显示的链接代码:
<a href=”http://www.semyj.com/archives/528/comment-page-1#comment-805″>2009年09月27日于22:38</a>

参考例子引用的为国平同志的博客,可以作为一个博客优化的疏忽点来讲。
化解方式,在评论模板源码中将该链接加入nofollow属性,告诉Google,该链接不用搜索引擎进行爬行。

应该这样去注释该链接:
<a href=”http://www.semyj.com/archives/528/comment-page-1#comment-805″  rel=”nofollow”>2009年09月27日于22:38</a>

本文出自:泽雅营销日志
原文链接:(http://wlyx.org/search-engine-optimization/basic-technology/mirror-image-page)

本站原创,转载时请保留版权文字以及正规链接

收藏本文到:添加到百度搜藏 | 添加到Google收藏 | 添加到雅虎收藏
  1. Zeaer
    2009年12月8日21:20 | #1

    测试

  2. 2009年12月8日21:39 | #2

    不错,学习了。

  3. 2010年6月9日20:59 | #3

    楼主写的真好~学习了~谢谢!

  1. 目前还没有任何 trackbacks 和 pingbacks.