<?xml version="1.0" standalone="yes"?>
<?xml-stylesheet type="text/xsl" href="css/rss.xslt"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/"><channel><title>SEO研究院 - SEO两百个秘密</title><link>http://www.dugutianjiao.com/</link><description>搜索引擎优化技术解密 - </description><generator>RainbowSoft Studio Z-Blog 1.8 Arwen Build 81206</generator><language>zh-CN</language><copyright>Copyright 2004-2008 SEO研究院 All Rights Reserved.Powered by Z-blog，Theme by Google黑板报，washun仿制。</copyright><pubDate>Wed, 08 Sep 2010 01:36:28 +0800</pubDate><item><title>SEO两百个秘密：网站性能对SEO的影响以及解决方法</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/wangzhan-xingneng.html</link><pubDate>Sun, 04 Jul 2010 20:24:03 +0800</pubDate><guid>http://www.dugutianjiao.com/post/wangzhan-xingneng.html</guid><description><![CDATA[<p>搜索引擎到底有多智能？独孤天骄只能很严肃地回答你说，&ldquo;超级智能！智能到令人恐怖的程度！！&rdquo;&mdash;&mdash;引言</p><p>独孤天骄先提个问题：&ldquo;如果您的网站打开速度较慢，或者有很多广告之类，会否对SEO造成影响？搜索引擎又是怎么知道的？&rdquo;</p><p>许多SEOer心里可能觉得多少有些影响，但是影响的程度有多大并不是很敢肯定，而且也不清楚搜索引擎是如何判断网站性能。</p><p>今天，我就来讲讲这个话题，作为SEO两百个秘密系列中的用户体验篇。</p><p>网站性能其实是用户体验的一部分，我们都知道，搜索引擎是以用户体验为第一要素的，所以假若一个网站的性能较差，举个例子，比如打开页面的速度较慢，投放广告较多，尤其是弹出广告过多都将会影响到<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>效果。</p><p>那么，搜索引擎是怎么知道你网站打开速度慢？又是如何知晓你网站投放了过多的垃圾广告呢？</p><p>Google网站管理员工具所提供的网站性能分析工具恰好能解决这个问题，百度必然也有类似的工具，只是没有对外公开罢了。</p><p>我们先来看下Google官方对网站性能分析工具的介绍：此工具&ldquo;会显示您网站的性能统计数据。您可以利用这些信息提高网站的速度，从而为您的用户提供更快的体验。&quot;也就是说，我们完全可以利用这个工具来作为提高自己网站性能的指导，以达到更好的SEO效果。</p><p>首先，我们看下该网站（测试的案例站为<a target="_blank" href="http://www.tingko.com">文秘资源网</a>，<a href="http://www.tingko.com">http://www.tingko.com</a>）在Google网站管理员工具后台的性能概况：</p><p>您网站的<span style="color: #ff0000">平均网页载入时间为 8.2 秒</span>（更新日期：2010-6-24）。 <span style="color: #ff0000">该网站比 90% 的网站慢</span>。这些估算值的准确度很低（少于 100 个数据点）。下图显示了您网站的平均网页载入时间在近几个月中的变化趋势。为方便您参考，它还显示了全体网站的 20% 分界线，以区别共慢速和快速载入时间。</p><p>&nbsp;<img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2010/6/wangzhanxingneng-chart.png" /></p><p>如果我是搜索引擎，那么我已经可以判断出，这个网站的打开速度很慢，当然，我不会因此对它进行全面惩罚，因为毕竟这只是一个因素而已，但是起码在累积的权重分上已经失掉了应得的分数了。</p><p>接下来，Google的站长工具提供了解决的办法，如下图：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2010/6/wangzhanxingneng-2.jpg" /></p><p>我们逐一来研究一下。</p><p>首先，看下第一项：启用gzip压缩，在这里，我们看到了许多js、css、以及广告js链接，尤其是css中的page.css占据了18.1K，完全可以进行精简，进而提高网站性能：</p><p>&nbsp;<img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2010/6/wangzhanxingneng-3.jpg" /></p><p>其次，合并外部JS文件，这些文件是网站的广告文件，太过的广告明显将影响到网站的性能，建议适量投放广告：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2010/6/wangzhanxingneng-4.jpg" /></p><p>第三，尽量减少DNS查询次数：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2010/6/wangzhanxingneng-5.jpg" /></p><p>这些广告代码其实都是封装在上面&ldquo;合并外部JS&rdquo;中的4个广告JS中的。不知道你看到上句话有何感想？敏感的人可能已经猜测出来了，是的，看到这个图，你应该知道其实Google对于JS的抓取能力已经改善了非常之多了，JS作弊的时代已经过去了，JS里面封装的代码Google的蜘蛛已经能够进行识别并且进行正确归类了。简单点说，只要Google建立一个广告库，将所有广告联盟或相关特征码录入，那么很容易判断你这些js就是广告，比如1133.cc，pds，union之类的特征码；甚至它还可以知道你用什么统计代码，比如51.la。这样子，如果你投放了一些垃圾联盟，或者色情sp之类的联盟，等待你的命运是什么？</p><p>总之，一句话，什么是垃圾站，什么是正规站，我相信通过类似这样的判断，Google多少通过这个自动化的程序是能够知道一些的，并不需要人工认定你的垃圾站是属于正规站还是垃圾站点的。</p><p>第四，再看&ldquo;合并外部CSS&rdquo;，我们完全可以将几个css合并起来，然后进行精简，不要的代码删除掉：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2010/6/wangzhanxingneng-6.jpg" /></p><p>最后，&ldquo;尽量减少重定向&rdquo;：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2010/6/wangzhanxingneng-7.jpg" /></p><p>当然，网站性能还有一些方面可以进行优化，比如更换性能更好的服务器之类。相信在经过了这些处理之后，网站的总体性能将得到较大的提升，在搜索引擎的SEO表现也将更加优秀。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/wangzhan-xingneng.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=237</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=237&amp;key=a3516c86</trackback:ping></item><item><title>SEO两百个秘密：Google的迷你全站链接(Mini Sitelinks)</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/google-mini-sitelinks.html</link><pubDate>Mon, 21 Sep 2009 17:35:14 +0800</pubDate><guid>http://www.dugutianjiao.com/post/google-mini-sitelinks.html</guid><description><![CDATA[<p>上一篇帖子讲到了SEO研究院在独孤天骄的有意控制下，<a target="_blank" href="http://www.dugutianjiao.com/post/seoblog-sitelinks.html">生成了Sitelinks</a>。其实在搜索&ldquo;独孤天骄&rdquo;等关键词的时候，已经同时生成了Mini Sitelinks，这点倒是意料之外。因此本文主要就讲讲Google的迷你全站链接！</p><p>Mini Sitelinks是Google的迷你全站链接，也叫One Line SiteLinks，这种迷你全站链接只有一行，根据Zac的报道，这种迷你网站链接从今年4月份开始出现在各个国家。如下图所示，这是SEO研究院生成的一个Mini Sitelinks：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/9/seoblog-mini-sitelinks.gif" /></p><p><a target="_blank" href="http://www.googlechinawebmaster.com/2009/03/blog-post_31.html">谷歌中文网站管理员博客</a>发布了《单行网站链接》的帖子正式回应了Mini Sitelinks，他们称这种链接为<a href="http://googlewebmastercentral.blogspot.com/2009/04/one-line-sitelinks.html">One-line sitelinks</a>，是一种网站链接扩展：不在搜索结果第一位、以前不会显示网站链接的搜索结果，现在也有机会拥有单行的网站链接。这意味着对于某一特定查询词，现在有可能有多个结果拥有网站链接。在新的形式下，最多四个网站链接可以成一单行出现在某一搜索结果URL之上，而不是只有第一个搜索结果拥有两列多行的网站链接。Google开发这个新功能旨在希望这项功能能增加搜索结果网站的展示率和流量，并同时进一步改善用户体验。</p><p><strong>Google新形式的迷你全站链接(Mini Sitelinks)特点：</strong></p><p>1，跟Sitelinks不同，Mini Sitelinks不一定排名第一才能获取，甚至第二页也有可能出现Mini Sitelinks。比如Zac的博客在关键词排名第三的情况下，依然显示了迷你链接：</p><p><img alt="" width="400" src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2009/04/mini-sitelinks-2.gif" /></p><p>2，同一个搜索结果页面可能不止出现一次Mini Sitelinks。比如下图中的前三个搜索结果全部都出现了Mini Sitelinks：</p><p><img alt="" border="0" src="http://www.googlechinawebmaster.com/uploaded_images/nutrition-777008.jpg" /></p><p>3，迷你全站链接更多的是与网站的整站权重相关，而非针对特定关键词。比如搜索意义性不大的关键词&ldquo;独孤天骄&rdquo;，我的博客就出现了Mini Sitelinks。</p><p>4，目前在Google.cn已经可以看到这种Mini Sitelinks的结果页，不过和Sitelinks不一样，目前的单行网站链接暂时无法通过网站管理员工具进行控制。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/google-mini-sitelinks.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=225</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=225&amp;key=bb8e0cb8</trackback:ping></item><item><title>SEO两百个秘密：网站改版及其对SEO的影响</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/site-gaiban-seo.html</link><pubDate>Fri, 07 Aug 2009 23:39:13 +0800</pubDate><guid>http://www.dugutianjiao.com/post/site-gaiban-seo.html</guid><description><![CDATA[<p>许多网站，尤其是企业站，喜欢频繁改版，并没有意识到网站改版对<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>带来的连锁影响，因此本文独孤天骄想就这个问题来详细说说网站改版与SEO的关系，并提出一些针对希望进行网站改版的SEO方面的建议。</p><p><strong>一、网站改版的利弊分析：</strong></p><p>首先，我们分析下网站改版的利弊。</p><p>一些企业网站由于粗制滥造，在SEOer接手之后进行符合搜索引擎友好性的改造，这个时候的网站改版就会显现出极大的好处，比如提高了美观程度，给用户带来全新的视觉感，借此提高了访客的忠诚度，乃至最终提高了成交量等。</p><p>但是，不正确的网站改版，很多时候往往会产生反效果，甚至影响到网站的现有排名，可能由此带来流量的损失、销售量的锐减等巨大问题。</p><p><strong>二、SEO改版需要注意到什么？</strong></p><p>网站改版如果没有处理好来自搜索引擎的问题，势必会影响到网站的正常访问和流量，进而导致注册会员或销售额的损失，那么，如何将这个损失降到最低呢？作为SEOer，我们应该如何消除网站改版带来的不良影响呢？</p><p>以下是独孤天骄给出的几个<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>方面的建议：</p><p><strong>1、域名更换。</strong>如果确实由于某种原因，需要改变域名，那么在使用新域名的同时，应该保持旧域名在线，通过设置301永久重定向页面到新站，以留住以前的忠诚用户和稳定访问群。</p><p><strong>2、尽量可能不去改变网站结构、尤其是链接。</strong></p><p>首先，不要随意更换网站的URL规则，这会导致搜索引擎已经收录的网页地址全部失效。这是网站改版的重中之重。</p><p>其次，除非站点原本在搜索引擎的表现不佳，否则轻易不要改变网站结构。网站结构，比如内部导航结构的任何改动，都有可能对搜索引擎产生影响，比如散失掉导航之间链接PR传递等。网站架构是网站的根本，如果没有必要，一般不要改动。网站改版的同时，对网站的文件结构以及目录都尽量不要做修改，尽量使用最优的关键词用在导航及网站地图中。</p><p><strong>3、对于网站拥有较好排名的页面，不要随便更改或删除，应该暂时保留或者301重定向到新页面。</strong>那么，旧网页以前的链接广度以及PR值才会逐渐的转移到新的网页上。</p><p><strong>4、新版网站发布之前，应该保留旧版的网站数据共存一段时间。</strong>记得适当设置301转向到新页面以及404错误页面以加强用户体验度等，另外要通过SEO的手段引导搜索引擎蜘蛛对新版网站的更新，比如增加高质量的外部链接，提交XML网站地图等。</p><p><strong>5、网站模板及关键词布局的改动都有可能造成排名的下滑，因此在改版的时候要尽可能保留住以前的优化结果。</strong>如果网站已经经过优化，现在要进行改版，不妨联系以前合作过的<a target="_blank" href="http://www.dugutianjiao.com">SEO团队</a>，请他们参与网站改版的整个进程，以保持SEO效果的最优化。网站尤其是企业类站点一定要慎用Flash文件。</p><p>&hellip;&hellip;</p><p>总之，网站改版不仅仅只是前台设计、功能模块和栏目等的稍微变动，而是应该针对一些对搜索引擎存在不友好的地方融合搜索引擎优化的思想进行整改，这样才能增加用户友好度和搜索引擎友好度，取得更好的发展。</p><p>在网站改版的过程中，我们一定要注意到改版与搜索引擎友好性的关系，这样才能减低网站改版对SEO搜寻引擎排名的危害。在架构网站的初期，不应该只对网站的功能设计、内容管理等的投入，还需要用SEO的思维来对网站进行完整的规划设计，优化网站的结构、页面设计、内容编排、关键词布局、URL命名等，避免下一次再次进行大规模的整改，不会因为多次改版导致页面收录减少，流量降低等。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/site-gaiban-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=215</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=215&amp;key=7bf9298e</trackback:ping></item><item><title>SEO两百个秘密：404错误页面的设置及其对SEO的影响</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/iis-404.html</link><pubDate>Tue, 04 Aug 2009 20:44:14 +0800</pubDate><guid>http://www.dugutianjiao.com/post/iis-404.html</guid><description><![CDATA[<p>我在前面已经具体讲述过网站<a target="_blank" href="http://www.dugutianjiao.com/post/iis-log-baiduspider.html">IIS日志的设置</a>与搜索引擎爬虫痕迹的分析，其实IIS里面还有一个非常重要的功能，那就是404错误页面的设置。</p><p><strong>一、404页面是什么？</strong></p><p>404 页面是指用户尝试访问网站不存在的网页（由于用户点击了损坏的链接、网页已被删除或用户输入了错误的网址）时看到的页面，当用户试图进入这类不存在的页面时，IIS网络服务器会默认返回一个404 HTTP 状态代码，表明该网页未找到。</p><p>404页面就是为了告诉访客其所请求的页面不存在或链接错误，同时引导用户使用网站其他页面而不是关闭窗口离开。</p><p><strong>二、404页面对<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>的影响</strong></p><p>正确设置自定义404错误页面可以增强用户体验、帮助用户找到所需要的其他信息或进一步引导用户浏览网站，但是如果设置不当，严重的甚至可以导致搜索引擎的降权处理。因此在具体的SEO应用过程中，应该注意到自定义的404页面对搜索引擎的影响，正确配置404页面，防止返回&ldquo;200&rdquo;状态码，或者使用Meta Refresh转向而导致返回&ldquo;302&rdquo;状态码。</p><p>对用户而言，返回什么Http状态码，不管是&ldquo;404&rdquo;抑或&ldquo;200&rdquo;，并没有什么大区别，但对搜索引擎则完全不一样。</p><p>搜索引擎通过HTTP状态码来识别网页的状态。当搜索引擎蜘蛛在抓取某个URL时获取&ldquo;404&rdquo;状态码后，便会知道该URL已经失效而放弃对该链接的索引，一段时间之后会逐步将该类网页从索引数据库中删除；而当返回200或302状态码时，搜索引擎就会为该链接建立索引，这样就会导致许多不同的URL具有完全相同的复制内容，从而被搜索引擎降权处理。</p><p><strong>三、如何正确设置404页面？</strong></p><p>设置静态404错误页面的方法并不复杂，但是很容易出错。</p><p>首先，如果是IIS服务器的话，那么在IIS管理器中右键单击要管理的网站，打开&ldquo;属性&rdquo;&mdash;&ldquo;自定义错误信息&rdquo;&mdash;选择&ldquo;404&rdquo;&mdash;编辑自定义错误属性即可。</p><p><span style="color: #ff0000">特别需要注意的是，在&ldquo;消息类型&rdquo;中一定要选择&ldquo;文件&rdquo;或&ldquo;默认值&rdquo;，而不要选择&ldquo;URL&rdquo;，否则将会导致返回&ldquo;200&rdquo;状态码。</span></p><p>其次，如果是Apache服务器的话，要建立404页面则在.htaccess 文件中加入代码： ErrorDocument 404 /Error.html （注意这里的/Error.html 前面不要带主域名，否则返回的状态码是302或200状态码），然后写一个html作为404页面，命名为Error.html，将这个Error.html文件放置在网站根目录即可。</p><p>最后，404错误页面设置完成后，一定要检查一下状态码，输入一个没有的网页，通过<a target="_blank" href="http://seo.g2soft.net/online-tools/server_status_checker.php">http状态检查工具</a>，查看其返回值，如果返回值为404则是正确的，如果是200则不正确。注意不要将404错误直接转向到网站首页，这将导致首页不被收录；正确的做法应该是做一个错误404页面，在错误页上有个链接是指向首页。</p><p>Google网站管理员工具中有一个&ldquo;增强型 404 页面&rdquo; 工具，大家不妨拿来使用。</p><p><strong>四、如何优化404页面？</strong></p><p>404页面该达到怎么样的效果才符合SEO要求？</p><p>一个网站上的404 错误是服务器在请求资源找不到的时候发生的，并非用户主动来访问我们这个404页面，不管这个错误是由我们或者用户自行造成，我们都应该在这个404页面里面表示诚意的道歉，并且提供一个搜索框，让用户寻找所需要的正确URL，或者直接展示给用户一些可能有用的链接，比如链接向首页或者其他一些重要页面。</p><p>另外，一个设计合理或者富有创意的的404错误页面不仅仅是网站完整性的一部分，还是网站可用性的重要体现。如我们前面所说，正确设置自定义404错误页面可以增强用户体验、帮助用户找到所需要的其他信息或进一步引导用户浏览网站，因此在设计上面，应该给404错误页面指定一个模板，最好和网站保持一致。</p><p>在错误请求很多的时候，404页面显然会浪费很多流量，因此尽可能保持这个404错误页面的文件体积不要太大，这也是网站可用性的一个体现。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/iis-404.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=214</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=214&amp;key=4d8ab216</trackback:ping></item><item><title>SEO两百个秘密：导出链接的数量</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/outlink-number.html</link><pubDate>Sat, 25 Jul 2009 11:38:23 +0800</pubDate><guid>http://www.dugutianjiao.com/post/outlink-number.html</guid><description><![CDATA[<p>独孤天骄在SEO两百个秘密系列中写过&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/seo-outbound-links.html">导出链接在SEO中的秘密</a>&rdquo;，在文中我提到，追溯链接的根源与本质，导出链接主要起到一个不增加你自己网站内容的情况下给访问者提供更多信息源的作用。从理论上来说，导出链接不会影响到本网页的PR值。其次，导出链接有极强的用户体验度，相关性高的导出链接能够帮助你的网站访问者找到更多他感兴趣的内容。</p><p>但是事实上，在目前的环境下，导出链接几乎全部都是跟网站主之间的交换链接，很少有为了这个目的而导出&ldquo;更多信息源&rdquo;的，更不可能考虑用户的体验一说了。</p><p>随便访问一个网站，截图如下：</p><p>&nbsp;<img alt="liying...net...cn" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/7/outlink-number.jpg" /></p><p>这是一个很典型的错误导出链接案例。</p><p>我曾经说到，&ldquo;导出链接的数量应该小于100个。Google认为一个页面的最大导出链接数量不应超过100个。&rdquo;这里的100个链接我觉得不仅包括外部的链接，同时还包括了自己网站的内部链接。因此，在我自己给客户网站进行SEO的时候，对导出到外部的链接，我一般都控制在20个左右。由于这个数量比较小，因此对链接的质量，即使是通过交换得来的，我们也就容易控制，相关性极高，所起到的SEO作用，绝对不比上图数百个链接起到的作用低。</p><p>我们看上图的链接，不管什么样的网站类型都包括了，导出链接不仅数量多得吓人，而且可以说没丝毫的相关性，简直就是毫无逻辑，杂乱无章；更不用奢谈链接的质量问题了，这其中还包括了不少有问题的垃圾网站的链接。</p><p>链接确实很多，通过雅虎的站长工具，我们可以查询到这个网站的外部链接达到了4555个，PR也达到了4。但是这样的网站排名如何呢？我随便用SEO伴侣查了下，百度仅收录其95个页面；Google多点，有120个页面，网站所做的核心关键词在百度和Google上几乎没有排名。</p><p>希望广大SEO引以为戒。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/outlink-number.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=211</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=211&amp;key=3664a991</trackback:ping></item><item><title>SEO两百个秘密：搜索引擎排名的人工干预</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/rengong-ganyu.html</link><pubDate>Tue, 07 Jul 2009 23:23:20 +0800</pubDate><guid>http://www.dugutianjiao.com/post/rengong-ganyu.html</guid><description><![CDATA[<p>从搜索引擎的公平性来说，我也不喜欢其进行人工干预，只有用机器算法来衡量所有的网站才会公平。<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>有时候是不敢接一些关键词的<a target="_blank" href="http://www.dugutianjiao.com/post/baidu-youhua.html">百度优化</a>单子的，因为虽然可以做上去，但是人工干预搜索结果太大，将排名做上去的难度和代价也就要大得多。</p><p><strong>一、什么是搜索引擎的人工干预？</strong></p><p>搜索引擎的人工干预是指搜索引擎运营商对搜索引擎反馈给用户的排名结果进行人为调整，说白点就是人工审核。</p><p><strong>二、搜索引擎人工干预是否真正存在？</strong></p><p><a href="http://www.dugutianjiao.com/">搜索引擎排名技术</a>虽然一直在提高，但是任何一家搜索引擎都存在人工干预的情况，即使是号称从不&ldquo;作恶&rdquo;的Google也绝不例外。</p><p>2008年4月份的时候，谷歌全球副总裁、大中华区总裁李开复公开声明：&ldquo;谷歌绝不用人工调整搜索结果的顺序。我们不是法官，明明知道是大家感兴趣的，为什么要隐藏起来不给大家看？&rdquo;并表示谷歌也能搜到自己的负面报道。Google搜索算法技术团队首席工程师阿米特&middot;辛格尔(Amit Singhal)也在博客中称，Google搜索排名一直遵循着三项原则，其中一条就是坚决反对人工干预搜索结果。</p><p>但是事实真的如此吗？对德国BMW网站的处理，便是Google典型的人工干预；有时候一些比较特殊的情况，比如对阿里巴巴的降权，Google采取的也是人工干预。</p><p>而另外的某些搜索引擎在强大的利益面前，人工干预甚至沦为搜索领域的潜规则，其公正性日益受到人们的质疑。</p><p>SEO业界盛传百度将自然搜索结果和商业信息混淆、屏蔽负面新闻和网站以推动其竞价排名的推广，获取巨额利益的现象早已众人皆知。类似于2008年的《三鹿集团公关解决方案建议》的帖子声称，三鹿应&ldquo;与百度合作，拿到新闻话语权，在此事（毒奶粉）还未大肆曝光的特殊时期，尽快与百度签订300万元的框架协议，小网站的恶意报道均可被删除&rdquo;，同时也暴露了蒙牛、伊利、汇源等每年享受起点为500万元的广告投放保护费的内幕，得百度再次陷入人工干预极度危机；凤凰论坛网民&ldquo;大嘴猴&rdquo;也曾发帖公布了&ldquo;百度广告销售部总监董安民&rdquo;的关于&ldquo;负面处理的原则和注意事项&rdquo;邮件，爆出对于受公关保护的大客户，百度删除网页结果的出价是1万元/条；还有类似天空搜索和天极网的事件都属于人工干预这一类型。</p><p>不过，我想百度高层的决策绝对是力求公正，只是下面的销售部门迫于业绩的压力，不得不采取一些违规的手段而已。而百度公司又没有像Google那样可以跟站长交流的社区或工具，导致部分不实信息被无限夸大。</p><p><strong>三、搜索引擎人工干预的过程</strong></p><p>谷歌中文网站管理员博客发了一篇《我们怎样处理垃圾网站举报？》，详细讲述了如何进行人工干预的过程：</p><p>首先，Google会有专门的人工干预工作人员对用户所提交的垃圾网站进行评估，看是否符合网站管理员指南，确定是否赞同或不赞同用户的举报。</p><p>然后，Google会对确认的垃圾网站进行人工干预性的惩罚。这个&ldquo;人工干预性&rdquo;的意思是Google将改进反垃圾网站算法，然后大量测试新代码，确保对所举报的某一网站举报可能改进对所有类似垃圾网站的处理算法。正因为如此，用户刚举报的即使被马上确认为垃圾网站的，也很有可能不会马上被惩罚，而是等待反作弊组给出，或者将会给出一个算法上的处理。Google也承认会马上人工处理一个确认了的垃圾网站，但由于这并非一个健全的方法，所以更愿意使用算法改善其搜索质量。</p><p>在这个过程中，如果Google发现一个被举报的垃圾站点可能无意中违反了谷歌网站管理员指南，Google会试图联络网站管理员以纠正他们的错误，如果这个网站注册了Google的网站管理员工具，Google则会通过信息中心传递这个信息。</p><p>而百度则不同，它更倾向于直接采取屏蔽或封站的举措，这也是为SEO所诟病的地方。不过乱世用重典，在严厉的惩罚之下，中文作弊网站确实有所缓和确是不争的事实。</p><p><strong>四、SEO如何应对百度等搜索引擎的人工干预？</strong></p><p>SEOer应该如何正确对待百度或者Google等搜索引擎的人工干预？</p><p>首先，我们完全没有必要听到搜索引擎人工干预就神经紧张，独孤天骄虽然也痛恨某些搜索引擎的人工干预，但是也并非一概排斥！毕竟对搜索引擎而言，合理的人工干预是对算法的有效补充，当然，这个补充应该局限于为搜索用户提供符合体验、真正有价值内容的基础上，即搜索引擎的人工干预主要目的应该是过滤Spam手段和作弊方法，只能作为在算法无法正确区分出违规优化手法的时候用之，而不应该被过分拔高。保持搜索结果的公正性是搜索引擎人工干预的一个重要原则。更进一步说，人工干预是为了提高算法在查找和排除极少数较难被算法自动识别的spam与作弊技术&mdash;&mdash;人工干预算法是为了以后尽可能不进行人工干预，而不能充满商业目的。百度在这点上面则做得远远不够。人工干预也大大的降低了百度的舆论口碑。网上出现一篇批评百度的文章，很少有人会说作者是谷歌的枪手，但如果网上出现一篇批评谷歌的文章，可能会有不少人将作者指为谷歌的枪手。</p><p>Zac在&ldquo;SEO每天一贴&rdquo;里面也谈到了搜索引擎人工干预的问题，&ldquo;针对某个特定网站的调整，无法避免人的偏见和不公平性。人是最能腐败的动物，而算法不会。&rdquo;对人工干预也是持反对的态度。</p><p>其次，搜索引擎对一小部分违反相关政策的网站，如违法、含有儿童色情内容、存在恶意软件的网站等采取人工干预，作为SEOer，我们表示欢迎，&ldquo;清除垃圾，SEO有责&rdquo;。人工干预搜索结果肯定是有其好处的，人永远比机器要更加智能化、人性化，比如搜索算法和蜘蛛都无法像&ldquo;先进&rdquo;的&ldquo;绿坝软件&rdquo;那样居然能够判断图片是否是色情的性质，所以人工干预能够及时清除一些搜索引擎照常抓取的违法色情信息，这无疑是好的。搜索引擎人工干预原本的目的是为了让搜索结果更为精准，提高用户的搜索体验，从这个意义上说，百度人工干预的背后是良好的用户体验和百度对网民的责任。</p><p>另外，完全没有必要网站排名一下降就在那破口大骂这是搜索引擎的人工干预。说实在话，要被百度人工干预，一般的站点还达不到这个标准。有时候一个没有任何影响力的网站排名下降了，站长就在那边大喊，这是百度对其进行的人工惩罚，我总觉得很好笑。惩罚估计是真的，但是哪来的那么多&ldquo;人工&rdquo;，百度公司就是拥有1万个人工干预者，也没有那么多的时间天天去人工审核你的站点。在论坛，如果问是哪个站点被百度给人工干预了，一般站长都不愿意说，这其实就足以说明问题了。</p><p>如果每个网站都要人工审核，百度就不叫百度，而叫信息产业部了，只有信息产业部才会要求每个网站需要进行备案审核。</p><p>最后，如果遭遇搜素引擎的&ldquo;人工干预&rdquo;，不妨多从自身网站寻找原因，前一段时间，SEO研究院所有关键词的排名全面下滑，我也是静心研究，找出问题关键，最终得以解决，并且让排名得到一定程度的提高。你的网站排名下降了，一定是违反了百度的标准，比如过度优化了。</p><p>互联网每天都有成千上万个新网站出现，被人工干预的站点毕竟是少数，与其抱怨人工干预，还不如踏踏实实地作站，做好自己网站内容是最有效的方法！</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/rengong-ganyu.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=201</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=201&amp;key=448e2d16</trackback:ping></item><item><title>SEO两百个秘密：什么是Google Dance</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/what-is-google-dance.html</link><pubDate>Mon, 06 Jul 2009 23:58:55 +0800</pubDate><guid>http://www.dugutianjiao.com/post/what-is-google-dance.html</guid><description><![CDATA[<p>如果有一天你突然发现自己的网站排名在Google上突然后退许多，甚至无法找到排名&mdash;&mdash;无须太过担心，也许这是Google正在翩翩起舞。</p><p><strong>1，什么是Google Dance？</strong></p><p>Google Dance这个名词通常用于描述Google搜索引擎数据库每月一次的大规模升级，定期更新其索引的活动。简单的说，Google Dance其实就是指Google重新安排它的搜索结果的排名的过程。</p><p>Google Dance又称Google幽灵现象，顾名思义就是关键词排名一会有一会又没有了。由于Google一般每个月对其搜索数据库进行一次更新，在三到五天的Google Dance时期，Google的搜索结果会有大幅度的波动，几乎每一分钟都会有变化。反应在排名结果上，就是搜索结果时上时下，有的网站排名一夜消失，有的网站名列首位，有的网站则一会在首页一会跑到第二页，就像是跳舞一样，因此称之为Google Dance。（查看Google对其<a target="_blank" href="http://www.google.com/googledance2002">Google Dance所下的非常有意思的定义</a>）</p><p><strong>2，如何确定Google正在Dance？</strong></p><p>如果在Google的不同服务器（www.google.com，www2.google.com，www3.google.com，这是Google的三个主要服务器）查询同样的关键词，却获得不同特别是较大差距的查询结果数量，一般就可以断定Google正在更新中。当搜索结果数量和排名顺序都相同的话，就表明Google的更新过程已经完成。</p><p><strong>3，Google Dance的原理</strong></p><p>当然这种不稳定是暂时的。在Google Dance这一升级过程中，Google会重新遍历所有已被收录网站，Google所储存的索引都被重新进行更新，新的网页被加入，无效网页被删除，收录网站被全面深度检索，外部链接的价值被重新计算，站点和页面的PageRank值被重新得出，同时Google也可能在这期间调整算法，去旧迎新，以符合用户搜索的最佳体验。这个变化是实时进行的，几乎每一分钟都存在。因此，在这大更新中，Google的排名结果会有剧烈的排名波动。&nbsp;&nbsp;</p><p>在更新过程中，搜索引擎不可能通过关闭服务器来进行维护，它有点类似我们小时候投掷石头在湖上所泛起的涟漪，只能一圈一圈荡漾开去，最终所有的服务器都接受新的索引，但是并非一次性全盘接受，毕竟Google拥有8 个数据中心，共享着成千上万个网络服务器。因此在这个期间（Dance一般持续三五天的时间，Google Dance通常在月末的那周开始，新结果在月初几天可以看到，大概是每36天一次或者一年10次。Dance结束后，Google搜索结果和网站外部链接数量趋于稳定，直至下一个周期的Google dance到来），如果用户在Google上进行关键词查询，他们可能在这一分钟得到的查询结果来自一个其全部或部分数据尚未得到更新的数据中心，而在几分钟后又会从另外一个数据中心得到更新后的数据。反应在排名结果上，就是搜索结果时上时下，有的网站排名一夜消失，有的网站名列首位，就像是跳舞一样。</p><p><strong>4，Google Dance存在的<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>意义</strong></p><p>首先，在Google Dance期间，SERF排名时刻在产生变化。很多客户在这一时期经常致电给SEO服务提供商，咨询其站点为何在Google上找不到或者排名大幅倒退，甚至找不到自己的网页了，由此经常引起不必要的恐慌。</p><p>其次，Google Dance更新期间，有时候也伴随着Google算法的改变或调整。我们知道Google一直为反作弊而努力，一直在不断改进自己的算法。在Google Dance 结束后，站长应该针对排名升降结果和竞争对手的排名情况调整自己的优化策略，作弊并无法取得长久效果，只有认真对待网站优化的每个细节，正规合理地优化，才能无惧于Google每次的Dance调整，才能长期从Google那获得较好的排名。</p><p>最后，对于SEO而言，在Google Dance期间，新网站被收录的机会大大增加，SEOer在此期间完全可以考虑提交新的网站以及加大网站的更新力度，以促使网站获得更好的排名做好准备。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/what-is-google-dance.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=191</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=191&amp;key=2b739b24</trackback:ping></item><item><title>SEO两百个秘密：搜索引擎的联想词搜索功能</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/lianxiangci-sousuo.html</link><pubDate>Sun, 05 Jul 2009 23:52:12 +0800</pubDate><guid>http://www.dugutianjiao.com/post/lianxiangci-sousuo.html</guid><description><![CDATA[<p>几乎所有的搜索引擎都提供联想词搜索也即是以前我们所说的相关提示功能，不过目前中文的Google由于&ldquo;违反中国法律散布色情信息&rdquo;，在6月18日已经暂时被关停国际网页搜索和联想词检索服务。因此这篇文章，独孤天骄主要讲述下中文百度的联想词搜索功能，善于利用这一功能，对于<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>有很大帮助。</p><p><strong>一、什么是联想词搜索</strong></p><p>所谓联想词搜索或相关提示功能，即对于用户提交的查询进行分析，然后根据其它用户相似的查询给予用户提示，比如在百度上搜索&ldquo;本田&rdquo;，下拉框里会提示如下内容：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/7/lianxiangci-bentiansiyu.gif" /></p><p>这些类似&ldquo;本田思域&rdquo;、&ldquo;本田雅阁&rdquo;等关键词都是相关的用户查询，称之为搜索引擎的联想词搜索。</p><p>独孤天骄提示，如果还想使用Google的联想词功能，可以使用其不同的语言版本，比如<a href="http://www.google.com.hk/">http://www.google.com.hk/</a>，或者<a href="http://sb.google.com/">http://sb.google.com/</a>。</p><p><strong>二、搜索引擎如何提示相关用户的联想词</strong></p><p>有观点表明所谓的联想词都是由网民&ldquo;投票&rdquo;产生的，网民搜索次数越多，这个关键词就会被投越多&ldquo;票&rdquo;，从而出现在相关的联想关键词里面。这也是为什么Google被停止联想词业务之后，网友持反对态度的人居多的原因，因为Google本身并不提供这些&ldquo;联想词&rdquo;，这些是网友搜索趋势的反应，Google只是告诉大家网民最经常搜索什么而已。从技术上看，这是搜索引擎公正性的一种表现。从SEO的角度看，Google的联想词搜索被停止，对网民搜索习惯的研究也是损失巨大。</p><p>那么搜索引擎到底是根据什么原则来实现这个联想词检索的呢？</p><p>目前我们只能建议大家看下<a target="_blank" href="http://top.baidu.com/">百度的搜索风云榜</a>，独孤天骄判断百度肯定拥有用户查询的独特日志文件以及专门负责海量数据存储和挖掘的工程师（由百度风云榜具体分类为&ldquo;娱乐&rdquo;榜、&ldquo;金融&rdquo;榜、&ldquo;IT&quot;榜等得出）， 每一个用户每一次提交的查询在这个日志上都会得到反映和记录，当然鉴于这个日志会非常之庞大，也许百度会按照时段进行保存（由百度风云榜中的&ldquo;一周热点&rdquo;、&ldquo;热门搜索&rdquo;和&ldquo;今日上升最快&rdquo;得出）。</p><p>那么现在就简单了，我们以百度为例来进行说明。</p><p>1，百度会获取用户的查询信息和查询次数。假设说我要显示10个联想词，那么只要输出访问数量前十名的关键词即可。百度估计在这里还对关键词做了过滤，Google因为没有过滤是导致这次被处罚的最大原因。</p><p>2，判断相关联想词。在这里，到底哪十个关键词可以被输出，主要得看这些关键词是否和用户所搜索的关键词是否相关。百度会在对用户查询词进行分词的基础上，计算关键词的相关性。同时， 计算用户查询和历史用户查询的相似性，相似性计算是通过两者重复关键词的权重之和得出。</p><p>3，判断联想词的输出顺序。十个关键词是完全按照流量排序呢，还是按照其他规则进行排序？</p><p>如果用户查询只是一个不可再分词的关键词就相对比较简单，只要调出跟这个关键词相关的查询字符，并且按照查询次数排序即可。而对于可以再进行分词运算的关键词查询则复杂得多，假设这个查询词可以切分为A、B、C三个最小单位的关键词，百度在提取相关关键词进行排序的时候，会有一个匹配关键词的权重过程，这里会运用到搜索引擎的一个特殊算法IDF公式，每个关键词的权重用关键词的IDF来计算，大的排序原则根据这个权重进行排序输出，如果两个历史查询包含相同的重复词汇集合，那么查询权重相同，则按照用户查询次数有高到低排序输出。</p><p><strong>三、 针对搜索引擎的关键词联想功能网站优化需要注意什么？</strong></p><p>关键字联想功能将对网民搜索习惯带来影响，更多的用户将使用更少的字去搜索自己所需要的信息。对用户搜索习惯的研究将会变得更加重要。</p><p>对于一些热度非常高的词（比如本田)，只要键入主关键词，搜索引擎就会给出更多提示，查询用户可以选择更加描述更为准确的关键词；而原本需要输入&ldquo;本田思域&rdquo;、&ldquo;本田雅阁&rdquo;、&ldquo;本田飞度&rdquo;等词才能进行查询的用户完全可以通过仅仅输入&ldquo;本田&rdquo;即可达到搜索的目的，因此&nbsp;各色各样的关键词会变得比较单一，关键词组合搜索的人数将会降低。</p><p>也就是说，对于SEO来说，字数更多的关键词组合将会受到部分影响。SEOer在选择关键词以及进行布局的时候要注意考虑搜索引擎的关键词联想功能，比如选择搜索框里面有提供联想词的这些关键词进行优化，这样用户在搜索的时候将有可能同时关注到你所优化的这个关键词，进而点击访问。如果你的SEO技术更加高超，甚至可以像刷百度的相关搜索那样，刷出搜索引擎的相关联想词，进而提高自己所优化关键词的点击率。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/lianxiangci-sousuo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=198</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=198&amp;key=c051ecb3</trackback:ping></item><item><title>SEO两百个秘密：百度的分词算法</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/baidu-fenci.html</link><pubDate>Fri, 03 Jul 2009 18:03:43 +0800</pubDate><guid>http://www.dugutianjiao.com/post/baidu-fenci.html</guid><description><![CDATA[<p>这篇文章主要参考中科院软件所张俊林先生在2005年11月写作的《搜索引擎设计实用教程》的分词部分，提供的查询关键词范例也源于该文。</p><p>搜索引擎本身并不提供信息，因此用户需要在搜索引擎的搜索框键入关键词进行查询以获取信息，然而由于中文信息检索存在的自身特点，比如中文语词之间没有空格，中文的语法分析和语义理解与英语相比更为困难。因此搜索引擎在信息索引前都要对用户所查询的语词进行切分。</p><p>并非任何一个查询词百度都会进行切分，如果关键词组仅仅包含小于等于3个中文字符就保留不进行切分，大于4个中文字符的时候，百度的分词程序便会开始运行，这时候才是百度分词的真正时机。当然，如果是完全匹配的话，不管几个词，一般情况看起来都似乎没有进行切分，这是因为百度拥有一个全世界最庞大的中文分词词库，这个词库不断增加用户最新的查询词，比如&ldquo;我是谁的谁&rdquo;，这个原本要进行分词，但是因为词库中存在，百度就知道这是黄征的一首歌，于是就不予切分，但其实仍然是有进行切分的，只是百度将切分后的结果当做一个短语进行查询，看到的效果就跟没有切分是一样的。</p><p>分词算法也有简单难易之分，比如正向最大匹配、反向最大匹配、双向最大匹配、语言模型方法、最短路径算法等等。</p><p>张俊林先生假设百度因为考虑到速度问题，不会采取比较复杂的算法，因此判断百度采用的是双向最大匹配算法。他提交了一个查询&ldquo;毛泽东北京华烟云&rdquo;以测试百度的分词是如何消歧以及是否有词典未登录词的识别功能。我们知道这个查询如果是正向最大匹配算法的话，那么应该输出为&ldquo;毛泽东/北京/华/烟云&rdquo;，反向最大匹配算法的话，则会输出&ldquo;毛/泽/东北/京华烟云&rdquo;，百度分词结果却是&ldquo;毛泽东/北/京华烟云&rdquo;，因此有可能是双向最大匹配算法。</p><p>这个分词结果还告诉我们百度分词可以识别人名，也可以识别&ldquo;京华烟云&rdquo;这种词典未登录词的功能。</p><p><a target="_blank" href="http://www.dugutianjiao.com">SEO</a>绝对应该熟习百度的分词技术，我们一起来看下具体的百度分词过程：</p><p>1，先查找内部的特殊分词词典，专用词典先切分，剩余关键词再交由普通词典来切分。</p><p>百度的这个词典应该包含了一些独有的人名、部分地名以及一些普通词典没有的新词。按照这样的方法，&ldquo;毛泽东&rdquo;被首先解析出来，剩下&ldquo;北京华烟云&rdquo;，通过反向最大匹配的分词结果，再次分为&ldquo;北/京华烟云&rdquo;。为了证明这时候百度分词采用了反向最大匹配，作者再次提交查询了&ldquo;发毛泽东北&rdquo;，百度没有输出正向最大匹配的&ldquo;发毛,泽,东北&rdquo;，而是输出&ldquo;发,毛泽东,北&rdquo;。而有时候比如查询&ldquo;古巴比伦理&rdquo;，则输出为正向最大匹配的结果&ldquo;古巴比伦,理&rdquo;，而非反向最大匹配的&ldquo;古巴,比,伦理&rdquo;，因此我们判断百度可能采用双向最大匹配分词算法。</p><p>这里附加说下，根据张俊林先生后来写的补充文章，结论应该是百度采取了正向最大匹配算法。例子说明见下：</p><p>从例子&ldquo;山东京城&rdquo;百度切分为&ldquo;山东,京城&rdquo;说明&ldquo;东京&rdquo;是在普通词典里，再次查询&ldquo;陈晓东京华烟云&rdquo;，这两个词汇都在专有词典里面，因此百度切分为&ldquo;陈晓东,京华烟云&rdquo;。</p><p>说明对于专有词典词汇，百度分词算法采取正向最大匹配或者双向最大匹配。</p><p>查询&ldquo;陈晓东方不败&rdquo;，关键词&ldquo;陈晓东&rdquo;&ldquo;东方不败&rdquo;都在专有词典，正向切分应为&ldquo;陈晓东,方,不败&rdquo;，反向切分则应为&ldquo;陈,晓,东方不败&rdquo;，百度切分结果是第一种，说明还是采用正向最大匹配。</p><p>SEO研究院独孤天骄严正声明：此处文章中出现的敏感词&ldquo;毛泽东&rdquo;不做屏蔽处理，仅是为了技术范例说明需要，并无任何政治倾向。</p><p>2，当正向和反向匹配分词结果一致时，百度直接输出切词结果，不一致的则采用最短路径方法，即切分的片断越少越好，比如&ldquo;古巴,比,伦理&rdquo;和&ldquo;古巴比伦,理&rdquo;相比选择后者，&ldquo;北京,华,烟云&rdquo;和&ldquo;北,京华烟云&rdquo;相比选择后者。</p><p>3，当正向反向匹配分词不一致，并且最短路径也相同时，比如提交查询&ldquo;遥远古古巴比伦&rdquo;，这个查询被百度切分为&ldquo;遥远,古古,巴比伦&rdquo;，说明词典里面有&ldquo;巴比伦&rdquo;，但是否有&ldquo;古巴比伦&rdquo;这个词汇不确定，此时看不出是正向切分还是反向切分得出的结果。换查询&ldquo;遥远古巴比伦&rdquo;，此时被切分为&ldquo;遥远/古巴比伦&rdquo;，说明词典里面有&ldquo;古巴比伦&rdquo;这个词汇，这说明&ldquo;遥远古古巴比伦&rdquo;是正向最大匹配的结果。为什么&ldquo;遥远古古巴比伦&rdquo;不会被反向切分为&ldquo;遥/远古/古巴比伦&rdquo;呢？百度在这种情况下，可能选择单字少的那组切分结果。</p><p>4，当切分后单字也一样多，比如查询&ldquo;王强大小&rdquo;，百度的分词结果是&ldquo;王/强大/小&rdquo;，是正向切分的结果，而非反向的&ldquo;王/强/大小&rdquo;，这说明有歧义而且单字也相同则选择正向切分结果。</p><p>我们来看下张俊林先生对百度分词算法的总结：<strong>首先查询专用词典(人名、部分地名等)，将专有名称切出，剩下的部分采取双向分词策略。如果两者切分结果相同，说明没有歧义，直接输出分词结果；如果不一致，则输出最短路径的那个结果；如果长度相同，则选择单字词少的那一组切分结果；如果单字也相同，则选择正向分词结果。</strong></p><p>如果百度是采用正向匹配的话，那么我们应该重新归纳一下百度的分词系统：首先用专有词典采用最大正向匹配分词，切分出部分结果；剩余没有切分交给普通词典，同样采取正向最大匹配分词，最后输出结果。这样更为简单，不过文章中的观点距离现在已经有4年多，目前百度的分词算法我们应该通过自己的SEO实践重新得出。</p><p>判断一个分词系统好不好，关键看两点：一个是消除歧义能力；一个是词典未登录词的识别，比如人名、地名、机构名等。百度的分词算法仍然未能非常好地消除歧义，不过其庞大的分词词典在业内确是没有任何一家搜索引擎能够领先，虽然从第一来看百度的分词算法似乎并不像其在宣传中的&ldquo;你不知道我知道&rdquo;的高深莫测，但由于其拥有的庞大分词词典，我们仍然可以说百度的分词算法是目前所有搜索引擎最为成熟的。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/baidu-fenci.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=200</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=200&amp;key=4c72aa2a</trackback:ping></item><item><title>SEO两百个秘密：搜索引擎如何对关键词进行查询处理</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/guanjianci-jiansuo.html</link><pubDate>Thu, 02 Jul 2009 23:24:12 +0800</pubDate><guid>http://www.dugutianjiao.com/post/guanjianci-jiansuo.html</guid><description><![CDATA[<p>搜索引擎并非门户，本身不提供信息，用户需要在搜索引擎的搜索框键入关键词进行查询才能获取所需要的信息。作为SEOer，适当了解搜索引擎查询运算这一幕后工作对自己的SEO技术提升是有很大帮助的。</p><p>我们在提交关键词查询的时候，中文搜索引擎需要进行查询处理与分词，这是一个必不可少的步骤。这篇文章，独孤天骄主要讲解下查询处理的过程，下一篇文章我们再来更加具体地讲解下分词技术。</p><p><strong>第一种情况：搜索引擎根据分隔符或分词词典进行切分。</strong></p><p>用户在键入关键词进行查询之后，搜索引擎首先要做的是如果有分隔符就根据诸如空格、标点符号等将查询的关键词组再次分解成更小单位的关键字，如果没有分隔符则按照自己的分词字典进行切分。</p><p>举个例子，比如我们百度搜索引擎上查询了&ldquo;独孤天骄seo&rdquo;这个词，点击排名第一的&ldquo;<a target="_blank" href="http://www.dugutianjiao.com">SEO研究院</a>&rdquo;的百度快照，搜索引擎对我们所查询的关键词进行不同的颜色标注，每种颜色就是搜索引擎切分的一个关键词，如下图所示：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/7/dugutianjiao-seo.jpg" /></p><p>本例的查询就被分解成了&ldquo;独孤天骄&rdquo;和&ldquo;seo&rdquo;两个关键词，也就是说，通过&ldquo;独孤天骄 seo&rdquo;或者&ldquo;独孤天骄,seo&rdquo;这样的形式进行查询，都将会得到同样的结果。注意一下，关键词查询的时候中间的&ldquo;,&rdquo;是英文的半角符号，这也是为什么我建议在标题写作的时候，如果有多个关键词，需要用半角英文逗号隔开的原因，因为这样就不需要搜索引擎进行二次解析。</p><p>不过这是个非常简单的例子，由于中文信息检索存在的自身特点，比如中文语词之间没有空格，中文的语法分析和语义理解与英语相比更为困难，以及用户查询习惯的不同，所以搜索引擎的信息索引和查询不像我们想象中的这么简单。</p><p><strong>第二种情况：查询关键词有重复内容的情况。</strong></p><p>假设提交的查询有重复内容，搜索引擎怎么处理呢？</p><p>我们举例子来说明，在百度查询&ldquo;独孤天骄 seo seo&rdquo;，得到什么结果？从这个结果我们知道，百度对此的处理是将重复的关键词进行消重直接忽视，因为百度搜索返回的页面结果数量是一样的，并且首页返回结果排序也完全不变。大家在Google查询下这个词组，不仅返回的查询结果数量变了，首页的排序结果也起了变化，说明Google似乎对重复的关键词加强了权重进行处理。</p><p>在百度再次查询&ldquo;seo 独孤天骄 seo&rdquo;，发现结果跟上例仍然一致，得出百度对用户所查询的关键词出现的先后顺序也是直接忽视的，但是在Google进行查询，结果却是不一样的，说明Google会对用户所查询的关键词顺序进行考量。</p><p><strong>第三种情况：查询关键词包含英文单词的情况。</strong></p><p>如果关键词包含英文字符的，这个英文字符会被当做一个词来进行切分，以这个英文字符为界，前后再细分为次级的关键词。</p><p>举个例子，比如我们搜索&ldquo;微软xbox价格&rdquo;，就会被搜索引擎切分成&ldquo;微软,xbox,价格&rdquo;，这个英文词语会被当作一整个关键词单独保留，不管这个词语在英文语法里面是否真正存在。</p><p>我们不妨再次查询下&ldquo;微软xboxlala价格&rdquo;试试。如果查询里面包含数字，也是如此处理，如&ldquo;微软xbox360价格&rdquo;。注意，这个英语词语不管是一个还是两个，只要没有隔开，都会被当做单个词组，比如查询&ldquo;独孤天骄seoseo&rdquo;，大家看下百度快照，&ldquo;seoseo&rdquo;虽然我们在语义分析知道是两个词，但是百度还是将它当做一个词语来处理的。</p><p>总结一下，我们以百度搜索引擎为例，它首先根据分隔符号将查询分开，然后查看是否有重复的关键词，如果有的话，就忽略或删除重复的关键词，接着判断是否有英文或者数字，如果有的话，就将英文或数字当作一个整体保留并把前后的中文切开。</p><p><em><strong>百度的分词字典真的很强大！</strong></em></p><p><strong>第四种情况：查询扩展处理以提高信息检索的召回率。</strong></p><p>搜索引擎还会根据同义词典和潜在语义进行拓展查询检索项。比如，搜索引擎会将&ldquo;公安&rdquo;和&ldquo;警察&rdquo;，&ldquo;计算机&rdquo;和&ldquo;电脑&rdquo;，&ldquo;人民&rdquo;和&ldquo;百姓&rdquo;当做同一个概念进行处理。另外，搜索引擎在查询的时候，还会根据主题来进行归类，比如当我们查询&ldquo;SEO&rdquo;的时候，系统会自动将&ldquo;网络营销&rdquo;、&ldquo;搜索引擎优化&rdquo;、&ldquo;网站优化&rdquo;之类的都归为一个主题来处理。</p><p>当用户在搜索引擎进行查询的时候，如果用户在搜索框输入一个关键词，当索引中有这样一个完全匹配的结果的时候，就会显示出来。对于英文来说，相对就比较简单了些，只要对英文的单复数，时态、词根、组合词等进行分析即可。不过对于中文，则一定要进行分词。然后对关键词进行向量计算，得出哪个网站的哪个关键词的权重比较高，就显示在索引中。</p><p>OK，下一篇我们具体讲解分词的问题。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/guanjianci-jiansuo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=182</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=182&amp;key=448eb451</trackback:ping></item><item><title>SEO两百个秘密：成为搜索引擎新闻源</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/baidu-xinwenyuan.html</link><pubDate>Sun, 28 Jun 2009 14:14:34 +0800</pubDate><guid>http://www.dugutianjiao.com/post/baidu-xinwenyuan.html</guid><description><![CDATA[<p><strong>一、什么是搜索引擎新闻源？</strong></p><p>搜索引擎新闻源，是指搜索引擎的新闻来源，它是搜索引擎经常光顾，采集新闻和相关行业信息的地方。这些站点就像专业报刊一样，都具有一定的权威性，他们消息来源具有准确、实时、可靠等特点，所以搜索引擎将其当做新闻来源。</p><p><strong>二、成为搜索引擎新闻源有什么好处？</strong></p><p>目前百度的新闻源是公开的，所以独孤天骄以百度新闻源为例，成为百度的新闻源对于网站在百度搜索引擎中的整体发展以及在提高网站权重、增加网站流量都是极端重要的一个步骤。</p><p>首先，这些新闻源自有的博客、论坛、目录等资源与其他站点相比具有更明显的权重优势。搜索引擎爬虫索引这些站点的频率非常频繁，几乎每个小时都实时进行更新。</p><p>其次，这些新闻源本身就具备更加专业性的特点，如果熟悉和掌握这些新闻源，SEOer也就掌握了第一手的信息资源。</p><p>第三，在这些地方能够认识更多的业内人士，是技术交流和学习的好去处。经常在这里写博客也可以提高自己在行业的知名度和影响力。</p><p>最后，作为<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>，知道哪个网站是百度的新闻源，在上面发布有质量的软文，可以有效提高自己的链接流行度，进而提高网站权重。查看网站是否是百度新闻源，只要在百度新闻搜索框内输入&ldquo;site:网站域名&rdquo;查看收录来自该网站的新闻信息即可。</p><p><strong>三、如何申请收录成为百度新闻源？</strong></p><p>百度新闻源收录标准：</p><ul>    <li>百度新闻搜索收录的新闻源网站必须符合及严格遵守国家《互联网新闻信息服务管理规定》，并在新闻发布和转载过程中尊重创作人和源网站的著作权。</li>    <li>百度希望新闻源多样化，鼓励原创新闻内容，收录的新闻源网站应正规、合法、有媒体影响力，具有大量有价值的新闻内容，并能及时更新，且网站服务器稳定、高速。</li>    <li>百度新闻搜索收录的网站类型包括专业新闻网站和资讯门户、地方信息港、报刊杂志及广播电视媒体、专业及行业网站、政府及组织网站，不适合收录的网站类型包括论坛、博客、公司网站、个人网站等其它非新闻资讯类网站，以及非中文网站。另外，百度特别申明，请不要加入广告、幽默笑话、情感故事、诗歌、情色、写真、剧照、明星档案、食谱、下载、多媒体等内容。</li>    <li>您应对提供的全部内容承担一切法律责任，保证您提供内容的真实性、合法性，并不得侵犯任何第三方的权益。</li></ul><p>如果您的网站符合《百度新闻源收录标准》，请将网站信息发送邮件到 <a href="mailto:news@baidu.com">news@baidu.com</a>，百度的工作人员将会在7个工作日内对网站进行审核，审核通过后会邮件通知。一般来说，只要网站在业界有一定的知名度和影响力，能够及时提供丰富而且有价值的行业资讯和评论就有可能被百度审核通过。</p><p>具体制作xml文件的标准，以及如何提交给搜索引擎，大家可以看互联网新闻开放协议地址：<a href="http://news.baidu.com/newsop.html">http://news.baidu.com/newsop.html</a>。</p><p><strong>四、如何确定百度的新闻源</strong></p><p>百度的部分新闻源是公开的，Google新闻源则未公布。百度新闻源的部分地址：<a href="http://www.baidu.com/search/resources.html">http://www.baidu.com/search/resources.html</a>，包括<a href="http://www.baidu.com/search/resources.html#n1">专业新闻网站和地方信息港</a>、<a href="http://www.baidu.com/search/resources.html#n2">专业及行业网站</a>、<a href="http://www.baidu.com/search/resources.html#n3">政府及组织网站</a>、<a href="http://www.baidu.com/search/resources.html#n4">报刊杂志及广播电视媒体</a>，不过这些列表最后更新时间2005年12月30日，未包括百度新闻全部新闻源，根据统计，&nbsp;百度RSS新闻来自百度1000多个新闻源，即至少有超过1000个以上的新闻源。&nbsp;</p><p>&nbsp;当然还有些新闻源是新增的，百度并没有即时公布，但是这些新闻源只要长期观察，很容易总结出来，比如我要寻找跟&ldquo;SEO&rdquo;相关的新闻源，那么可以<!--ecomend-->在<a target="_blank" href="http://news.baidu.com">百度新闻</a>页面，选择&ldquo;新闻标题&rdquo;，搜索&ldquo;<a target="_blank" href="http://news.baidu.com/ns?word=seo&amp;tn=newstitle&amp;from=news&amp;ie=gb2312&amp;bs=seo&amp;sr=0&amp;cl=2&amp;rn=20&amp;ct=0&amp;prevct=1">SEO</a>&rdquo;，会显示如下页面：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/6/baidu-xinwenyuan.gif" /></p><p>这些新闻所属的网站就是百度的&ldquo;新闻源&rdquo;，然后选择这些站点跟&ldquo;网站建设&rdquo;、&ldquo;搜索引擎&rdquo;、&ldquo;IT&rdquo;等跟&ldquo;站长&rdquo;相关类别的站点收藏整理起来即可。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/baidu-xinwenyuan.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=193</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=193&amp;key=8542dceb</trackback:ping></item><item><title>SEO两百个秘密：精简代码的终极杀手锏</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/delete-enter-space.html</link><pubDate>Sat, 27 Jun 2009 13:14:45 +0800</pubDate><guid>http://www.dugutianjiao.com/post/delete-enter-space.html</guid><description><![CDATA[<p>我们谈论过合理精简代码，给网页减肥对网站优化和用户体验的重要性，在SEO两百个秘密系列中的&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/page-size-seo.html">页面代码体积大小与SEO的关系</a>&rdquo;这篇文章，独孤天骄也讲了好几个精简代码的方法，简单归纳一下有：</p><p>1、利用DIV+CSS重构网页，尽可能不使用嵌套表格等，精简代码；</p><p>2、封装JS、CSS文件，不把JS和CSS的代码直接写在页面源代码上；</p><p>3、慎用Flash、mp3等多媒体文件；</p><p>4、优化图片文件，减少页面体积&hellip;&hellip;</p><p>在这里，我特别提到了如何减少冗余html代码的问题，如对页面中的font、bgcolor之类的格式化控制代码加于精简，尤其推荐使用<strong>网页编辑超级工具箱</strong>清除word夹带的格式代码。</p><p>完全这样操作之后，有人可能就很自豪地说，&ldquo;是的，我的页面已经最精简了，没有任何冗余代码了！&rdquo;</p><p>其实这句话并不完全正确，应该说现在的页面是几乎没有冗余代码，但是并非完全没有。</p><p>作为讲究细节的SEOer，我们完全还可以挖掘出更加精简的方法，在这里我主要讲代码中空格和回车的问题，这是不考虑代码可读性的极端代码优化手法。</p><p>空格字符是网页中最常见的垃圾代码。部分在段落开头或结尾处无意加入的&ldquo;&amp;nbsp;&rdquo;代码，以及在代码编辑环境下敲击键盘空格键所产生的字符，都可以进行删除。</p><p>我随便举三个例子。</p><p><strong>第一张图：</strong></p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/6/shanchudaima-1.jpg" /><br />大家看这张图片，在浏览器的显示是非常正常的，但是切换到源代码模式，我们看到还大有优化的空间。</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/6/shanchudaima-2.jpg" /><br />删除不必要的代码之后，页面精简了许多。</p><p><strong>第二张图：</strong></p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/6/shanchudaima-3.jpg" /><br />貌似很正常，但切换到代码模式下，我们仍然可以发现问题，前面的&ldquo;&amp;nbsp;&rdquo;代码是多余的，不小心敲击出来的，完全可以删除：<br /><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/6/shanchudaima-4.jpg" />&nbsp;</p><p><strong>第三张图：</strong></p><p><strong><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/6/shanchudaima-5.jpg" /></strong></p><p>上面这张图也是，看起来完全没有任何问题，但是大家看源代码状态下：<br /><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/6/shanchudaima-6.jpg" /><br />有好几个冗余的代码。</p><p>删除所有类似这样的空格代码，将使文件体积得到很大下降。</p><p><strong>可供参考文献：</strong></p><p>SEO两百个秘密：页面代码体积大小与SEO的关系：<a href="http://www.dugutianjiao.com/post/page-size-seo.html">http://www.dugutianjiao.com/post/page-size-seo.html</a></p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/delete-enter-space.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=196</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=196&amp;key=67c21c69</trackback:ping></item><item><title>SEO两百个秘密：关键词布局</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/keywords-layout.html</link><pubDate>Mon, 22 Jun 2009 14:22:23 +0800</pubDate><guid>http://www.dugutianjiao.com/post/keywords-layout.html</guid><description><![CDATA[<p>很多人往往忽视了网站布局，尤其是关键词布局的重要性。其实在我们的外链跟对手差不多强劲，内容差不多有吸引力的情况下，甚至连网站权重都差不多时，排名却大相径庭的原因很可能就是因为对方网站的关键词布局起了很大的促进作用。不一样的关键词布局，对排名的提升或下滑是有很大作用的。</p><p>因此，这篇文章，独孤天骄将讲解一下如何对网站的关键词进行布局，以及具体内容页面的关键词布局应该如何进行的相关技巧。</p><p><strong>一、什么是关键词布局</strong></p><p>关键词布局，简单的说，就是如何具体将关键词一一布置在页面上。关键词做得成功与否直接影响着网站流量的提升，所以做好关键词的布局是<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>当中至关重要的一点，良好的关键词布局是排名迅速提升的一个关键。</p><p>&nbsp;<strong>二、关键词布局需要遵循什么原则</strong></p><p>关键词的整体布局应该遵循什么样的规则，什么样的布局方式才是比较合理的？</p><p><strong>1，利益最大化原则。</strong></p><p>当有多个关键词的时候，在网站中就需要合理布局。排名难度最大的安排在首页，中等难度的安排在栏目页，长尾关键词则安排在文章或产品内容页。</p><p><strong>2，位置最优化原则。</strong></p><p>通过对搜索引擎爬虫的研究，我们知道搜索引擎抓取网站内容的顺序是<u>从上到下，从左到右，无处不在</u>。按照这样的抓取顺序，让布局思路跟着蜘蛛抓取顺序走，我们可以在页面位置的顶部、左上、底部位置集中出现关键词，其他地方均匀出现关键词，这样有利于爬虫的抓取，这也是关键词布局最好的位置，得到了众多SEO较为一致的肯定。</p><p>或者你也可以这样来布局，让你的关键词随着你的眼球轨迹而布置，在你最经常采用的浏览方式的顺序依次布置上关键词即可。这个轨迹如果连起来，应该是英文大写的E。</p><p><strong>三、如何具体布局关键词</strong></p><p><strong>1，首页关键词布局。</strong></p><p>SEO优化应该先从首页布局开始。</p><p>要对首页进行关键词分析，视网站的权重而定，看首页能够承载多少个主关键词，每个关键词的具体密度是多少。上线时间不长，权重不够的站点，要避免过度优化。</p><p>网站首页的布局跟栏目页和内容页都不大一样，因为网站的首页同时还承载着其他任务，比如引导用户访问栏目页、内容页，以及展示站点形象的作用等。简单的说，网站首页布局关键词的原则应该是主题唯一，核心关键词合理有效地突出主题。你关键词布局得再好，没有考虑任何用户体验，人家一看，马上关闭页面走人，那也是白搭。</p><p>网页顶部、左侧及底部，在这几个地方合理的分布你的主关键词，适当运用强调标签，并在网页主体内容中不断强化写作。在顶部和底部布局关键词的时候，可适当做下长尾和相关的关键词，但是一定要不要刻意堆积，自然出现最为重要。你可以想想，如果百度人工审核你的网站，看你网站的页眉部分和页脚部分都用关键词堆砌了一句描述你自己站点的话，那样明显的优化痕迹意味着什么？</p><p>在尽可能突出网站主题的前提下，要降低导航的次数，让访客尽可能少的点击就可以看到尽可能多的内容。</p><p><strong>2，栏目页关键词布局。</strong></p><p>栏目页对关键词的布局很难像内容页那样集中。但是，栏目页也有其独有的好处，那就是聚合了跟该栏目相关的所有关键词。我们要保证栏目页的导航条对该核心关键词进行强化，内容页的标题列表应该只有跟关键词相关的才做推荐，其他的尽量不出现在列表中，以免稀释了关键词的密度，造成主题的偏移。</p><p><strong>3，内容页关键词布局。</strong></p><p>内容页由于模板的一致，所以应该集中精力在文本内容的写作中，让文案符合SEO规范。</p><p>另外，大部分的搜索引擎真正处理的只是文本内容，因此在内容页的模板上，对&ldquo;噪音信息&rdquo;要进行人工消噪，过滤一些脚本JS，广告代码，删除不必要的冗余代码等，无关的信息尽可能不要包含，比如版权说明，完全可以链接到一个专门的页面，而不需要在页面的底部对齐上百字的版权申明。代码越简单，关键词就越容易被搜索引擎抓取到。</p><p><strong>四、布局关键词时需要注意哪些事项</strong></p><p>虽然我们知道搜索引擎喜欢你的关键词&ldquo;无处不在&rdquo;，但是它要的是你布局关键词而非堆砌关键词。有些初级SEO靠在title标签中堆砌关键词的做法来提高排名，这不仅对用户体验是一个很大的伤害，对自己排名的提升也无法获得实质的理想效果，万一不幸再遇见百度的人工审核，估计难逃一劫。</p><p>甚至有的SEO错误理解了&ldquo;无处不在&rdquo;这个策略，认为只要是文章里面出现关键词就应该对它进行加粗加斜或划下划线之类，甚至每个关键词都给它上链接。比如只要出现&ldquo;SEO&rdquo;这个关键词，就给它加上内链，指向<a href="http://www.dugutianjiao.com/">http://www.dugutianjiao.com</a>。其实加粗关键词一定程度上确实对SEO有好处，但是将所有的关键词都加粗，就等于什么都没有加粗，对排名只有伤害而非促进了。</p><p>还有一些人在页眉或页脚罗列关键词，生怕搜索引擎不知道自己所要优化的关键词是什么，有很多初级SEO在页面底部的版权位置会增加一行&ldquo;本站关键词&rdquo;，然后罗列出所有的关键词并加上内部链接。 这是非常明显的优化痕迹，百度并非傻子，请自己仔细衡量利弊。</p><p>关键词布局具体还要靠自己在SEO实践中不断把握，我们可以多研究排名靠前的网站，观察他们的布局方法，然后通过自己的不断试验，就能得出符合自己方式的最优化和最有效的结果。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/keywords-layout.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=181</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=181&amp;key=be17873c</trackback:ping></item><item><title>SEO两百个秘密：Google Hilltop算法</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/hilltop-seo.html</link><pubDate>Sat, 20 Jun 2009 15:55:04 +0800</pubDate><guid>http://www.dugutianjiao.com/post/hilltop-seo.html</guid><description><![CDATA[<p><strong>一、Hilltop算法的由来</strong></p><p>Hilltop算法同PageRank算法同样是搜索引擎结果排序的一项专利。</p><p>PageRank页面级别系统单纯根据网页上的外部链接站点的数量，质量及页面等级决定该网页的&ldquo;重要性&rdquo;，但却忽略了链接页面对查询条件的主题相关性，导致一些网页即使主题与该查询条件并无关系，但也由于偶而提及该查询关键词而在搜索结果中得到很好的排名。从而影响了搜索结果的相关性与精准性。 早在2000年，美国加州多伦多大学计算机系的Krishna Bharat意识到基于页面等级的PR排名系统中存在瑕玼，于是提出了&ldquo;Hilltop&rdquo;新算法，并于次年1月份申请了Hilltop专利权，Google成为受让方。</p><p>吴泽欣有一篇关于Google基于HillTop算法更新的中文翻译，不过<a target="_blank" href="http://www.chedong.com/blog/archives/000034.html">车东</a>谈到其和Bharat写的关于HillTop算法的论文原文相比，还是有些出入，建议阅读<a href="http://www.cs.toronto.edu/csri/reports.html">&ldquo;HILLTOP: A&nbsp;search engine&nbsp;based&nbsp;on expert documents&rdquo; </a>，大家也可以看SEO研究院为大家整理的<a target="_blank" href="http://www.dugutianjiao.com/UPLOAD/docs/hilltop.rar">Hilltop文档打包下载</a>，如果您只需要简单了解这一算法，那么只要参阅以下文字即可。</p><p>SEO Rank公司的CEOAtul Gupta在文章中说，&ldquo;Hilltop算法在11月16号的更新(号称佛罗里达更新)中起到了不可轻视的作用。&rdquo;在Google后来的更新中，不但运用了Google自身的页面等级和相关性算法，而且还结合使用了Hilltop算法用于精工调整页面等级的效果。</p><p><strong>二、HillTop算法是什么？</strong></p><p>Hilltop 算法的定义到底是什么？</p><p>简单的来说，来自描述相同主题的相关文档（专家文档）的链接对于搜索者的价值会更大，即相同主题网站之间的链接比不相关网站的链接价值要更大，这样的算法叫Hilltop算法。</p><p><strong>三、HillTop算法的工作原理</strong></p><p>Goole在最初使用PageRank算法来决定一个网站的重要程度及排名，一定程度上，反向链接越多，排名越好；或者说，高质量的反向链接导入越多，排名越好。这里的高质量链接指的是对方站点的质量，并没有考虑其和自身站点的相关性。</p><p>HillTop算法的指导思想和PageRank是一致的，也都是通过反向链接的数量和质量来确定搜索结果的排序权重，不过HillTop算法认为<u>来自相同主题的相关文档链接对于搜索者的价值会更大</u>。</p><p>与PageRank结合HillTop算法确定网页与搜索关键词的匹配程度的基本排序过程取代了过分依靠PageRank的值去寻找那些权威页面的方法。这对于两个具有同样主题而且PR相近的网页排序过程中：HillTop算法就显得非常的重要了。&nbsp;</p><p>Google不但要考虑满足查询结果的网页上的外部链接页的重要性(页面等级)，还要考虑这些链接页对查询主题的相关性，HillTop算法要求如果有两个以上相关主题的网站链接到你的网站，那么你的网站在搜索结果中出现的机会会更大，如果HillTop算法不查找到最少两个相关性的网站，那么搜索返回的结果的机会绝对是0。Hilltop算法实际上是拒绝那些通过任意链接的方法来扰乱Google的排名规则而得到较好排名的做法，一定程度上避免了非相关主题的、高PR值的站点的反向链接对排名造成的巨大影响，使排名更趋向搜索关键词的匹配。</p><p><strong>四、Hilltop新算法的意义</strong></p><p>Hilltop新算法加大了offline优化的分数比值，更好地避免了作弊，毕竟来自相关网站的高质量链接并非那么容易，不可能唾手可得。</p><p>直接对页面进行的SEO优化很容易作弊，比如早期的Meta标签作弊，关键词堆砌作弊等等，而在新算法中，根据资料，各排名因素所占权重分别如下：</p><p>&nbsp;总&ldquo;排名&rdquo;得分由三部分组成：页面相关性得分( RelevancyScore，页面因素)，页面等级得分(非页面因素)和行业得分(非页面因素)，其中相关性得分(RS)= 20%，页面等级值(PR) = 40%，行业得分(HillTop得分，LS) = 40%。</p><p>我们知道，RS (相关性得分：页面相关度)，这是通过SEO内部优化能够得到的效果；PR (页面等级得分：外部链接度)，通过不断地建立高质量的反向链接也能得到这个效果；而LS (行业得分：专家文件链接度)则需要来自专家文件的链接的转换结果；这一点更难获取。</p><p>而作为优化专家，对于排名的控制权将渐渐减弱，页面内部优化的得分只占到了20%，外部的优化则占据了80%这样高的比重，这样将加大作弊的难度。因此Hilltop算法的运用，提高了搜索结果的相关性和质量，有效降低了人工操纵排名的可能性。不过，由于Hilltop算法需要提取&ldquo;专家文档&rdquo;，但是这些&ldquo;专家文档&rdquo;的公正性，质量性无法得到完全保证，而且为了保证Hilltop算法所需的处理能力，该算法只能周期性运行，从而无法保证随时向用户提供&ldquo;最新、最好&rdquo;的查询结果，新站点对热门查询词的排名的难度也将加剧。</p><p><strong>五、Hilltop算法对<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>的指导意义</strong></p><p>1，我们知道来自相关主题的链接的权重加大，那么在建立链接的时候就必须注意网页的相关性，不能单纯考虑对方PR，而是应该注意对方站点或页面是否和自己的站点或页面主题相关，相同主题的网站链接较之非相关网站具有更高价值，要尽可能避免低质量的链接，尤其是Spam性质的链接。</p><p>2，在建立链接时，应该加强与&ldquo;专家站点&rdquo;的链接。比如一些相关网上目录（Dmoz等），黄页；以及相关主题站点的链接等。</p><p>3，根据独孤天骄的理解，Google首先给予edu、gov类站点于很高的优先级，甚至将它们视为&ldquo;专家文档&rdquo;，如果这些站点或页面的主题跟你的站点或页面的主题相关，那么两个以上来自这样站点的链接，将会带给你极大的权重。其次，来自热门词，也就是网友高频率搜索的关键词，包括突然间爆发的关键词，这样的站点会得到Google较快的、优先的更新频率，因为在&ldquo;爆发&rdquo;的过程中，这些关键词的主题网站有一部分将被Google列为&ldquo;专家文档&rdquo;，与类似主题的网站交换链接会临时获得较高的权重。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/hilltop-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=179</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=179&amp;key=4ff8dc4a</trackback:ping></item><item><title>SEO两百个秘密：Google的类似网页</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/similar-pages.html</link><pubDate>Wed, 17 Jun 2009 15:47:31 +0800</pubDate><guid>http://www.dugutianjiao.com/post/similar-pages.html</guid><description><![CDATA[<p>在Google搜索任何一个关键词，所显示的结果都会在底部标示&ldquo;网页快照&rdquo;（Cached）和&ldquo;类似网页&rdquo;（Similar pages）两个选择：：</p><p><img title="" alt="类似网页" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/6/leisiwangye.jpg" /></p><p>在以前，Google搜索结果中除了列出网页的&ldquo;网页快照&rdquo;、&ldquo;类似网页&rdquo;之外，有时候还会把网页标志为&ldquo;补充材料&rdquo;，不过后来Google去除了所有补充材料的标识。</p><p>网页快照我们讲过较多，本贴就不再赘述了。那么，Google的类似网页是什么意思呢？</p><p><strong>一、什么是Google的类似网页？</strong></p><p>顾名思义，类似网页就是一些主题跟你相关的类似网站的网址集合。但是事实上并非如此，Google的类似网页里，有些内容的相关性相距甚远，对用户有一定帮助作用，但还不完善。</p><p><strong>二、Google的类似网页的算法</strong></p><p>我们先来看一张很有代表性的类似网页的网址图（related:www.tj66.net/表示查询网站<a href="http://www.tj66.net">www.tj66.net</a>的类似网页）：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/6/leisiwangye-2.gif" /></p><p>这里面有三个链接：第一个链接是我朋友的一个站，是指向天骄网的单向外部链接，图酷网的主题是&ldquo;壁纸&rdquo;，跟天骄网的&ldquo;教育&rdquo;完全不相关；第二个链接是以前我的一个导出链接，友情帮朋友的网站引导蜘蛛用的；第三个链接是交换链接。</p><p>类似网页根据什么条件或算法得出呢？Google没有明言，根据实验，有以下几种情况网址会被列到类似网页当中：</p><p>1，对方网站有你的反向链接。</p><p>2，你导出了链接指向对方网站。</p><p>3，你自己的网站被第三者所共同引用的其他网站。举个例子，A网站链接了B网站，同时链接了C网站，那么B和C网站就有可能成为&ldquo;类似网站&rdquo;，被列入类似网页中。不过这个时候，B和C网站的相关性值得怀疑，两个网站可能一点都不类似。不过如果不是被友情链接共同引用，而是被网址目录，比如Dmoz，所共同引用在一个目录下，那么就可能具有极大的相关性。</p><p>我有个想法，通过类似网页是否有可能观测到站群？因为类似网页可以让你从A站转移到B站，继而转移到C站，到D站&hellip;&hellip;如果是站群的话，互相链接是否有可能被搜索引擎一窝端？</p><p>根据许多类似的SEO实验，我观察出类似网页主要和导出、导入链接相关，有时候也和网站主题有关，但更多情况是与链接相关，就是说Google主要通过网站的导出链接和反向链接来判断其类似网页。</p><p><strong>三、类似网页算法对SEO的影响</strong></p><p>一定程度上，通过Google的类似网页，我们可以&ldquo;判定&rdquo;一个网站的相关主题，比如从上例中的23个类似网页大量为&ldquo;教育&rdquo;类网站，我们可以初步判断出天骄语文网是&ldquo;教育&rdquo;类的主题网站。反过来我们思考，如果这些大量的网站都是跟&ldquo;壁纸&rdquo;相关的话，那么我们站点的主题也许就要被削弱，甚至偏离。</p><p>因此，懂得类似网页的算法，我们在交换链接的时候，要特别注意对方网站的导出链接都指向什么类别的网站，因为他所指向的网站也很有可能成为你共同的主题。如果对方都是指向一些跟你不相关主题的网站，那么得慎换链接。</p><p>举个例子，比如网友在搜索&ldquo;教育&rdquo;相关的关键词，而因为你的网站主题被偏离了，不具有主题的&ldquo;相关性&rdquo;，那么有可能你的网站就无法被搜索到，或者无法获得高排名；当网友搜索&ldquo;壁纸&rdquo;相关的主题的时候，你的网站又因为站内内容不具有&ldquo;相关性&rdquo;，再次无法获得高排名，也根本无法被搜索到。当然，这是比较极端的例子，搜索引擎的排名算法非常复杂，不是就单纯靠这个相关性来判断的。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/similar-pages.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=175</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=175&amp;key=64a80c7b</trackback:ping></item><item><title>SEO两百个秘密：Stop Words(停用词) </title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/stopwords.html</link><pubDate>Tue, 16 Jun 2009 11:11:09 +0800</pubDate><guid>http://www.dugutianjiao.com/post/stopwords.html</guid><description><![CDATA[<p><strong>一、什么是停用词？</strong></p><p><strong>停用词(Stop Words) </strong>，词典译为&ldquo;电脑检索中的虚字、非检索用字&rdquo;。在<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>中，为节省存储空间和提高搜索效率，搜索引擎在索引页面或处理搜索请求时会自动忽略某些字或词，这些字或词即被称为Stop Words(停用词)。</p><p>我举个例子，比如在百度上面搜索&ldquo;<a target="_blank" href="http://www.baidu.com/s?wd=%B6%C0%B9%C2%CC%EC%BD%BE%B5%C4SEO%B2%A9%BF%CD">独孤天骄的SEO博客</a>&rdquo;，你会发现搜索结果中的&ldquo;独孤天骄&rdquo;和&ldquo;SEO博客&rdquo;都被突出显示，但是&ldquo;的&rdquo;虽然符合并且匹配我们的搜索条件，却并未被突出显示，说明&ldquo;的&rdquo;字被忽略掉了，这个&ldquo;的&rdquo;字就属于停用词：&nbsp;</p><p><img title="" alt="停用词的示例搜索图" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/6/stop-words-seoboke.jpg" /></p><p>如果有文字完全匹配我们的搜索，则这整个词组会被突出显示：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/6/stop-words-seoboke-2.jpg" /></p><p>但这并不意味着&ldquo;的&rdquo;是有用的搜索关键词，去掉&ldquo;的&rdquo;字重新用&ldquo;独孤天骄 SEO博客&rdquo;进行搜索，我们能得到完全一致的搜索结果，说明搜索引擎完全忽略了我们查询中&ldquo;的&rdquo;这一关键词，即&ldquo;的&rdquo;仍然属于一个停用词：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/6/stop-words-seoboke-3.jpg" /></p><p>停用词一定程度上相当于过滤词(Filter Words)，不过过滤词的范围更大一些，包含黄色、政治等敏感信息的关键词都会被视做过滤词加以处理，停用词本身则没有这个限制。通常意义上，<strong>停用词(Stop Words)</strong>大致可分为如下两类：</p><p>1、使用十分广泛，甚至是过于频繁的一些单词。比如英文的&ldquo;i&rdquo;、&ldquo;is&rdquo;、&ldquo;what&rdquo;，中文的&ldquo;我&rdquo;、&ldquo;就&rdquo;之类词几乎在每个文档上均会出现，查询这样的词搜索引擎就无法保证能够给出真正相关的搜索结果，难于缩小搜索范围提高搜索结果的准确性，同时还会降低搜索的效率。因此，在真正的工作中，Google和百度等搜索引擎会忽略掉特定的常用词，在搜索的时候，如果我们使用了太多的停用词，也同样有可能无法得到非常精确的结果，甚至是可能大量毫不相关的搜索结果。</p><p>2、文本中出现频率很高，但实际意义又不大的词。这一类主要包括了语气助词、副词、介词、连词等，通常自身并无明确意义，只有将其放入一个完整的句子中才有一定作用的词语。如常见的&ldquo;的&rdquo;、&ldquo;在&rdquo;、&ldquo;和&rdquo;、&ldquo;接着&rdquo;之类，比如&ldquo;SEO研究院是原创的SEO博客&rdquo;这句话中的&ldquo;是&rdquo;、&ldquo;的&rdquo;就是两个停用词。</p><p><strong>二、Stop Words对SEO的影响</strong></p><p>文档中如果大量使用Stop words容易<a target="_blank" href="http://www.dugutianjiao.com/post/page-signal-to-noise-ratio.html">对页面中的有效信息造成噪音干扰</a>，所以搜索引擎在运算之前都要对所索引的信息进行消除噪音的处理。了解了Stop Words，在网页内容中适当地减少停用词出现的频率，可以有效地帮助我们提高关键词密度，在网页标题标签中避免出现停用词能够让所优化的关键词更集中、更突出。</p><p><strong>三、常见停用词表下载</strong></p><p>停用词的识别常常需要<strong>停用词表</strong>，中文停用词表的自动选取现有的方法是基于统计的停用词选取方法，不过目前的科学研究已提出了一种新的停用词选取方法，用该方法分别计算词条在语料库中各个句子内发生的概率和包含该词条的句子在语料库中的概率，在此基础上计算它们的联合熵，依据联合熵选取停用词，该方法比传统方法更适用于文本分类的预处理。</p><p>点击这里的链接进行<a target="_blank" href="http://www.dugutianjiao.com/UPLOAD/docs/stop-words-list.rar">停用词表下载</a>，该表包括部分中文停用词表和英文停用词表。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/stopwords.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=173</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=173&amp;key=0ed7dc93</trackback:ping></item><item><title>SEO两百个秘密：网页信噪比</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/page-signal-to-noise-ratio.html</link><pubDate>Mon, 15 Jun 2009 10:54:07 +0800</pubDate><guid>http://www.dugutianjiao.com/post/page-signal-to-noise-ratio.html</guid><description><![CDATA[<p><strong>网页信噪比</strong>，即SNR（Signal to Noise Ratio），<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>中的网页信噪比概念是指和目标关键词相关的内容占总网站内容的比例。不过这个概念应该不是很完善，甚至可能跟搜索引擎真正的信噪比概念相距甚远。下面我们所说的应该更接近于网页的相关度，因为减少干扰性的噪音信息，最终目的还是为了提高核心关键词与网站主题的关联度。</p><p>SEO两百个秘密系列中的<a target="_blank" href="http://www.dugutianjiao.com/post/page-keywords-relevance-2.html">搜索引擎如何判断关键词与网页内容的相关性</a>讲过卢亮的信噪比与相关度的计算，是结合潜在语义来分析页面主题相关性的好办法。</p><p>在SEO优化中，搜索引擎主要抓取用以排名计算的，一般都是除去html标签后的文本内容，其他部分则被认为是干扰性的&ldquo;噪音&rdquo;内容。因此，网页信噪比简单意义上的计算可以等于网页中的文本内容部分与所有html标签代码的比值。因此，减少网页中干扰性的图片、多媒体信息、css、js等，能大幅度提高网页信噪比，网页信噪比越高，说明页面中纯文本内容相对越多，更有利于搜索引擎抓取页面。</p><p>在这里，我们要注意到搜索引擎并不一定认为除文本信息之外的都是&ldquo;噪音&rdquo;，有些html代码仍然会起到作用。</p><p>举个例子，对文案的写作而进行的强调性标签，如heading标签、加粗斜体等标签也是html代码，但是却有助于搜索引擎正确理解主题内容，因此应该不算&ldquo;噪音&rdquo;。独孤天骄认为，所谓的&ldquo;噪音&rdquo;应该是干扰性的，比如模板中重复的页眉页脚，js广告信息等才算，对广义的网页信噪比的定义应该是网页的有用内容信息与干扰性内容信息的比值。</p><p><font size="2">正常情况下，搜索引擎会自动识别网页的干扰信息，假设说独孤天骄的这个<a target="_blank" href="http://www.dugutianjiao.com">SEO博客</a>每篇文章都在标题末尾加上&ldquo;&mdash;SEO研究院&rdquo;，如本文&ldquo;SEO两百个秘密：网页信噪比&mdash;SEO研究院&rdquo;。</font></p><p><font size="2">首先，由于每篇文章都存在这一信息，搜索引擎应该能够判定出这篇文章的标题是&ldquo;SEO两百个秘密：网页信噪比&rdquo;，并且明白&ldquo;&mdash;SEO研究院&rdquo;中的SEO研究院仅是博客名称，并非标题，也跟该页主题无关。</font></p><p>其次，虽然作为读者，我们都能很清楚判断出<font size="2">这个标题的核心内容其实应该是&ldquo;网页信噪比&rdquo;，这也是该文的主题，而非&ldquo;SEO两百个秘密&rdquo;。在这里，我将二者结合在一起有其他的考虑，一则让读者知道这是一个系列文章，二则有利于转载和传播，三则是希望通过这样的方式来保护文章的版权。</font></p><p>但是这些意图搜索引擎很难得知，也无从得知，毕竟这只是作者的想法而已，所以<font size="2">搜索引擎较难判断出</font><font size="2">&ldquo;SEO两百个秘密&rdquo;与标题的联系，它很有可能将&ldquo;SEO两百个秘密：网页信噪比&rdquo;视为该页的核心主题内容，这里的干扰信息&ldquo;SEO两百个秘密&rdquo;就成了&ldquo;有用信息&rdquo;。</font></p><p>通过以上的实际例子解说，我们应该知道，对网页信噪比的优化，首先要做的是让搜索引擎正确识别核心关键词和页面内容主题，其次则是人为尽量减少干扰信息，比如在这个案例中，如果没有其他的考虑，完全可以将文章的标题写作&ldquo;网页信噪比&rdquo;，这对SEO来讲，可能效果更好。当然，这样写作缺少了可读性。</p><p><font size="2">最重要的一点，在具体的SEO优化过程中，需要提高核心关键词的网页信噪比，突出核心关键词，呼应核心关键词，尽力保证这些内容被搜索引擎列为有用信息，其他不相关的信息，不管是文本内容，还是html代码等，都应该尽量舍弃或修改使其相关。</font>一个网站，为了在后期的SEO竞争中获得好排名，在开始设计的时候就应该考虑网页信噪比的优化，尽可能避免大面积的图片和多媒体的使用，以及CSS、JS代码在页面的非封装使用，冗余代码应该及时进行删除优化。</p><p>我们在文章开头说了，以上的说法应该更接近于网页的相关度，卢亮在&ldquo;<strong>基于信息噪音模型的分类算法</strong>&rdquo;中对文本信息的噪音模型有这样的说明：假设文本是有两部分构成的，由信号和噪音的叠加构成。噪音的定义为不能对文本进行有效的分辨的内容，例如传统的停止词，极高频词。信号的定义为有差别于其它信息的特征内容，为不常见的关键词。这个定义跟我们所讲的还是有所区别的，在实际的SEO案例中，有许多例子也证明确实我们上述所讲的&ldquo;信噪比&rdquo;尚不够全面，比如很多获得排名的页面，不过单纯只有一张图片，如果这样算的话，该页的网页信噪比为零，从以上知识来看，本不应该获得任何排名的，起码排名不应该如此靠前。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/page-signal-to-noise-ratio.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=172</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=172&amp;key=ce234036</trackback:ping></item><item><title>SEO两百个秘密：链接流行度(Link Popularity)</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/link-popularity.html</link><pubDate>Sun, 14 Jun 2009 21:55:38 +0800</pubDate><guid>http://www.dugutianjiao.com/post/link-popularity.html</guid><description><![CDATA[<p><strong>一、什么是链接流行度？</strong></p><p><strong>链接流行度(Link popularity)</strong>，是SEO中的一个专业术语，也称为&ldquo;链接广度&rdquo;、&ldquo;链接广泛度&rdquo;，是用来衡量某个特定网站或网页被其他网站或网页链接的数量和质量，即反向链接数量和质量。在这里，我们要特别注意，链接流行度不单纯指反向链接的数量，还包含了对其质量的分析。</p><p><strong>二、链接流行度的重要作用</strong></p><p><strong>链接流行度(Link popularity)</strong>被搜索引擎用来衡量网页内容的好坏，是影响网站在搜索引擎中排名的一个非常重要的因素。假设两个页面优化程度相同，内容吸引力相同，那么在搜索引擎排名中谁的链接流行度胜出一筹谁就将获得领先排名。</p><p>三<strong>、链接流行度的分析和评估</strong></p><p><em>1，链接数量。</em></p><p>除非是垃圾网站给你的反向链接，否则链接自然是数量越多越好，链接数量较多的网站排名一般会比链接数量较少的网站好些。链接数量的查询命令为：link:www.dugutianjiao.com。另外，这个链接数量独孤天骄还觉得可以延伸到对方站点的导出链接数量，对方站点的导出链接数量越多，其所导出的链接占据的权威度就越低。</p><p><em>2，链接质量。</em></p><p>我们说链接数量较多的网站排名一般会比链接数量较少的网站好些，更真实的情况是一个优质的相关外部链接远远胜过你50个垃圾网站的链接，寻找并与优秀的网站交换链接才能获得真正的提升。这个道理就相当于一个顶尖武林高手随便就能将数十个流氓地痞混混撂倒，而你要学会绝技，也只能不断地跟这些高手交流。</p><p><em>3，链接相关性。</em></p><p>搜索引擎的链接分析系统中应该还包含着对链接的文本内容，各链接站点之间主题相似性等的控制。这个相关性，一方面是指对方站点反向链接的锚文本是否包含了你的主题内容，比如是否用&ldquo;SEO&rdquo;导到这个SEO博客来，搜索引擎会趋向于返回那些在文本链接中包含有搜索请求关键词的被链接网页；另外一方面如果对方刚好是一个SEO博客，那么这个导出链接的价值会升高。</p><p>在这里，我们知道链接流行度是基于反向链接的数量和质量的，尤其是质量。因此，在寻找反向链接时应该注意其质量的高低和内容相关性，观察这个页面是否是特定主题的权威网页，是否和自己的页面具有相关性，简单的说，就是看它的内容是否跟自己的内容是相似的。</p><p><strong>四、增加链接流行度的方法</strong></p><p>&nbsp;如何提高站点的链接流行度？<a target="_blank" href="http://www.andyhagans.com/">Andy Hagans</a> and <a target="_blank" href="http://www.seobook.com/">Aaron Wall</a>共同书写了&ldquo;<a target="_blank" href="http://www.seobook.com/archives/001792.shtml">增加链接流行度的101个方法</a>&rdquo;，Zac做了翻译，大家可以点击<a title="增加反向链接的101个方法" target="_self" href="http://www.dunsh.org/101.pdf">这里</a>进行下载。大家也可以参考独孤天骄写的<a target="_blank" href="http://www.dugutianjiao.com/post/seo-secret-index.html">SEO两百个秘密：反向链接的秘密</a>一文（<a href="http://www.dugutianjiao.com/post/seo-backlinks-secret.html">http://www.dugutianjiao.com/post/seo-backlinks-secret.html</a>）。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/link-popularity.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=169</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=169&amp;key=a18f896f</trackback:ping></item><item><title>SEO两百个秘密：Dmoz开放地址目录登陆</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/dmoz-odp-seo.html</link><pubDate>Sat, 13 Jun 2009 13:30:58 +0800</pubDate><guid>http://www.dugutianjiao.com/post/dmoz-odp-seo.html</guid><description><![CDATA[<p><strong>一、什么是DMOZ（开放地址目录）？</strong></p><p><a target="_blank" href="http://dmoz.org">DMOZ</a>，也叫ODP，英文全称为Open Directory Project，开放目录工程，也译作开放地址目录，DMOZ中文目录地址为<a target="_blank" href="http://dmoz.org/World/Chinese_Simplified/">http://dmoz.org/World/Chinese_Simplified/</a>，Dmoz.org可能需要通过代理访问。</p><p>Dmoz是一个由全球成千上万志愿者在维护和管理的非赢利性网站，在2008年初的时候，DMOZ拥有78999个志愿编辑，590000个目录和4591492个优秀质量的网站，不过中文网站被收录的数量相比这个庞大数据显得微不足道，据说仅有3万个网站左右被Dmoz收录。</p><p>二、<strong>加入Dmoz目录对SEO有什么影响？</strong></p><p><em><strong>1，加入Dmoz对SEO的重要性。</strong></em></p><p>为什么要加入DMOZ？登陆Dmoz到底有什么好处？</p><p>在以前，登陆Dmoz对SEO来说有不可替代的巨大作用，这是为什么SEOer对Dmoz趋之若鹜的原因之所在。</p><p>首先，Dmoz被认为是互联网上最重要的网站目录导航。</p><p>谷歌曾把Dmoz当作是网站收录的重要参考，在以前，Google的前三名排名位置更倾向于留给同时加入Dmoz的网站。<a target="_blank" href="http://www.google.com/dirhp?hl=zh-CN">Google网页目录</a>的数据甚至全部来自Dmoz，再经过自己的运算法则重新排序后按照网页级别显示这些结果。Google在以前倾向于使用Dmoz的描述作为某个网站搜索结果的描述，百度搜索引擎一度也采用DMOZ的标题或描述。</p><p>其次，加入DMOZ会带给你的网站许多高质量外部链接，这些链接来自其他的目录或搜索引擎。许多著名的搜索引擎，及上百较小的搜索引擎和目录索引同时使用Dmoz的数据，搜索引擎认为，Dmoz是最有信用的目录站，能够被收录到Dmoz的分类中，将大大提升这个网站在搜索引擎相关网站分类中的地位。所以登陆Dmoz会获得更高的链接广泛度，这个意义远远超过登陆Dmoz本身。</p><p>再次，Dmoz开放地址目录本身就是一个高质量的反向链接。这个链接对你的网站而言，远远超过你登陆数十个甚至上百个垃圾链接或目录。</p><p>最后，由于DMOZ是一个义务编辑员的制度，人工审核及其严格，能够登录Dmoz是对网站的肯定，有助于网站主&ldquo;地位&rdquo;的提升，这在与其他站长交换连接的时候将体现得淋漓尽致。</p><p><strong><em>2，DMOZ在SEO中的重要性越来越低</em></strong></p><p>当然，也有人认为Dmoz的作用已经降低！Dmoz对SEO是否仍旧有效已经开始被质疑，很多人认为Dmoz的辉煌已经是过去时了，甚至认为Dmoz对网站排名已经完全不起作用。</p><p>其实这就跟认为加入Dmoz足以完全影响搜索引擎的排名神话一样，两种想法都陷入了极端。</p><p>确实，Dmoz的作用在搜索引擎中正逐渐降低。也许Google开始意识到了Dmoz尤其是中文分类目录的弊端所在，许多编辑霸占编辑员职位，用来推广自己或者客户的网站，摈弃竞争对手，这一点跟DMOZ原本的宗旨有所违背。在现在，查询反向链接的时候，Dmoz分类目录的链接已经不被显示在Google上面了，Google在2005年的时候，甚至撤掉了Google分类目录的链接，这也许就是分类目录重要性降低的前兆。独孤天骄的<a target="_blank" href="http://www.dugutianjiao.com/post/dongyi-seo-zhenduan.html">动易网校曾经加入Dmoz</a>，根据我的长期观察，并不比未被收录的时候表现好。许多SEOer也有独孤天骄类似的感受。</p><p>那么，到底Dmoz对SEO还有用处吗？</p><p>我觉得有！最起码这是一个高质量的相关反向链接，如果你有一个高质量的网站，那么完全值得一试。当然，仅仅是一试而已，别太在意，因为互联网不止这个高质量链接，不值得浪费太多的时间去登陆。</p><p><strong>三、如何登陆Dmoz目录？</strong></p><p>具体如何登陆Dmoz呢？</p><p><strong><em>关于提交到Dmoz的几个建议：</em></strong></p><p>1，提交前的准备。由于Dmoz登陆采用的是人工编辑审核制，因此提交前你应该尽量保证你的站点内容是有价值的，并非垃圾网站，也绝对不要提交一个半成品网站，保证自己的站点没有坏链接、无效图片，保证自己的服务器稳定，在任何时间段都可以正常打开。</p><p>2，提交的站点要和所登录的目录相吻合，选择最适合的目录提交非常关键。好好研究下你所要提交的目录分类下的网站，比如你要提交到<a target="_blank" href="http://www.dugutianjiao.com">搜索引擎优化</a>这个分类（点选中文简体站点进入计算机-互联网络-网站设计与开发-网站推广-搜索引擎优化），那么就很有必要研究下被Dmoz收录的<a target="_blank" href="http://www.dmoz.org/World/Chinese_Simplified/%E8%AE%A1%E7%AE%97%E6%9C%BA/%E4%BA%92%E8%81%94%E7%BD%91%E7%BB%9C/%E7%BD%91%E7%AB%99%E8%AE%BE%E8%AE%A1%E4%B8%8E%E5%BC%80%E5%8F%91/%E7%BD%91%E7%AB%99%E6%8E%A8%E5%B9%BF/%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E4%BC%98%E5%8C%96/  ">16个</a>SEO站点，研究它们有利于自己的站点符合编辑标准，帮助自己的网站被收录。</p><p>3，半年之内不要重复登陆DMOZ。提交给Dmoz目录很简单，但是被收录不是一件易事。DMOZ收录一个站点，有时需要几个月，甚至半年。有一个说法是由于提交的网站是按照提交日期顺序进行存放处理的，如果因为等不及而向DMOZ重复提交，你只会把自己原来提交过的网站降到待处理队列的最后位置上，所以登陆一次之后，记下你提交的日期和目录，半年之内你要做的是丰富网站的内容，保持网站的更新和质量，不要反复提交。</p><p>4，提交的一个最关键秘密就是，向有活动编辑员的目录进行提交。该类别网页底部写着某个编辑员的名称就代表这里有活动的编辑，如果写着&ldquo;这个类别需要编辑员&rdquo;&ldquo;申请编辑该类别&rdquo;，那么你向这个目录提交被收录的机会就要小得多。我当时在做<a target="_blank" href="http://www.dugutianjiao.com/post/dongyi-seo.html">动易SEO</a>的时候，需要提交&ldquo;动易网校&rdquo;到DMOZ，有好几个跟网站建设相关的类别，我主要查询了有活动编辑员的类别，然后寻找这些类别编辑员的活动记录，后来发现一个类别的编辑员在近期有活动的迹象，于是便向该类别提交了网站，1周不到动易网校就被收录了。</p><p>好了，现在你就可以正式提交了，点击页面上面的&ldquo;登录网址&rdquo;进入申请页面，由于页面是中文的，所以只要你正确填写&ldquo;网址&rdquo;&ldquo;网站名称&rdquo;&ldquo;网站说明&rdquo;和&ldquo;联络电邮地址&rdquo;后，按最下面的&ldquo;送出类别编辑授权的申请&rdquo;按钮，即可完全申请登陆的操作。在这个步骤里面，对网站的描述应该做到简洁明了，可以参考同类别其他网站的描述，千万不要夸夸其谈，确保这里面的&ldquo;联络电邮地址&rdquo;跟所提交网站中包含具体联系信息是一致的，有的编辑对这个要非常严格，说在检查提交网站时，如果从中找不到可以联系的实际地址或电话号码，他就会认为这个网站不具备可信度。</p><p>特别注意：网站被收录之后，一定仍然需要保持长时间的更新和服务器稳定。动易网校由于长期关闭，最终被DMOZ的自动探测机制发现，被T出了收录，这实在是非常可惜的一件事情。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/dmoz-odp-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=167</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=167&amp;key=81ec8a15</trackback:ping></item><item><title>SEO两百个秘密：搜索引擎如何判断关键词与网页内容的相关性</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/page-keywords-relevance-2.html</link><pubDate>Thu, 11 Jun 2009 00:21:46 +0800</pubDate><guid>http://www.dugutianjiao.com/post/page-keywords-relevance-2.html</guid><description><![CDATA[<p>在SEO两百个秘密系列中，&ldquo;通过潜在语义分析判断关键词与网页内容的相关性&rdquo;（<a href="http://www.dugutianjiao.com/post/page-keywords-relevance.html">http://www.dugutianjiao.com/post/page-keywords-relevance.html</a>）这篇文章我们讲述了搜索引擎通过潜在的语义分析来判断关键词与网页内容相关性的一个重要方法。明白搜索引擎如何通过语义分析来判断关键词和网页内容的相关性，有助于文案内容创作符合SEO规范，算是内部的搜索引擎优化。</p><p>本文接着讲搜索引擎如何判断网页内容与关键词、关键词之间的相关性的其他方法。</p><p><strong>第一种方法，超链分析技术。</strong></p><p>这是外部对网页相关性的认可。百度和Google等搜索引擎都通过该技术来判断网页内容与关键词的相关性。以关键词为锚文本的外部链接越多，该网页就越重要，搜索引擎就越认可其重要，然后依这些重要程度的高低作为检索结果的相关度排序依据。在以前，PageRank起重要作用的时候，PR值越高就意味着该页面的相关性越高，排名也就越高。</p><p>举个例子，如果很多网站有链接指向<a href="http://www.dugutianjiao.com/post/page-keywords-relevance.html">http://www.dugutianjiao.com/post/page-keywords-relevance.html</a>，并且用&ldquo;通过潜在语义分析判断关键词与网页内容的相关性&rdquo;作为锚文本，那么在搜索这个主题的时候，搜索引擎就会将该页排到第一。当然，这是比较生冷的词语。热门的关键词需要更多的外部链接和锚文本。</p><p><strong>第二种方法，网页关键词权重分析。</strong></p><p>这是网页内部的自我&ldquo;认可&rdquo;技术。</p><p>搜索引擎通过对页面关键词权重的分析，判断出该页作者所要强调的主题，进而判断出关键词与该页内容的相关性。具体细节可以查阅<a target="_blank" href="http://www.dugutianjiao.com/post/page-weight-tips.html">SEO两百个秘密：页面关键词权重及其相关影响因素</a>（<a href="http://www.dugutianjiao.com/post/page-weight-tips.html">http://www.dugutianjiao.com/post/page-weight-tips.html</a>）。</p><p>这里面涉及到的东西就比较繁杂，比如搜索引擎会查看网页中是否出现关键词，这个关键词可以是直接的关键词，也可以是潜在语义相关的关键词。但是如果完全不相关的，则直接屏蔽。假设你要查询的是&ldquo;计算机&rdquo;，可是这个网页通篇都是&ldquo;自行车&rdquo;，那自然不能算是相关性了；不过如果页面出现&ldquo;CPU&rdquo;或者&ldquo;教程&rdquo;则都有可能是相关的关键词，因为到这一步，我们还无法判定该页的主题是销售计算机还是计算机学习。</p><p>搜索引擎在这个过程中，通过向量空间模型判断关键词本身在文档中的重要程度以及是否符合用户查询要求的接近程度来做出判断，关键词出现的频率和位置在此就起到重要作用。不过这是传统信息检索技术的方式，SEO人员通过对本身网页进行优化，很容易进行作弊。</p><p>同时，搜索引擎还可以通过网站内部链接和锚文本指向来判断主题的相关性。</p><p><strong>第三种方法，信噪比与相关度的计算。</strong></p><p>这种方法在<a target="_blank" href="http://www.wespoke.com/archives/001078.html">卢亮</a>的书中有介绍，是结合潜在语义来分析页面主题相关性的好办法，我一般用来计算两个相似或潜在含义有联系的关键词之间的相关度。</p><p>卢亮分析到，通常对于文本信息之间的相关性的计算都是采用向量的办法，然而对于文本信息更深层次的分析就不能单纯从字面上分析一篇文章的关键词，更重要的是它隐含的扩展的意义。传统的关于计算文本相关度和&ldquo;网页和查询的相关性&rdquo;的计算都是采用匹配的方式进行的，然而这只能是基于字面意义上的统计计算，更深入的需要采用关键词相关性扩展的做法从而得到更加精确的相关度计算。</p><p>举个例子，我们如何判断&ldquo;学校&rdquo;和&ldquo;学生&rdquo;之间的相关度是多少呢？</p><p>通过在Google搜索引擎查询这两个关键词，我们获得了相关数据：</p><p>约有91,700,000项符合学校的查询结果；<br />约有88,200,000项符合学生的查询结果；<br />约有48,900,000项符合学生 学校的查询结果；</p><p>那么通过公式，我们可以得出Corr{学校，学生}＝48,900,000/(91,700,000+88,200,000-48,900,000)=0.37。</p><p>百度的计算方法应该类似。</p><p>这个公式很简单，大家观察一下就能明白，也就是说，&ldquo;学校&rdquo;和&ldquo;学生&rdquo;之间的相关度这个系数是0.37，算是比较高的。大家可以通过这个方法来查询两个关键词之间的相关性。</p><p><strong>第四种方法，用户自由定义排序规则等。</strong></p><p>Google英文版的搜索就支持用户对搜索结果进行提升与删除操作，如果大量的用户都对排名第二的搜索结果进行了提升，搜索引擎即会将这个结果排到第一位。百度排名目前有个核心秘密，就是用户对搜索结果的点击会影响其排序，这个原理被用来开发了&ldquo;百度排名点击器&rdquo;，效果据说很好。</p><p>当然，还有许多我们所不知道的方式，即便是上面的方法，搜索引擎也是结合在一起进行运算的，而非单独运行。</p><p>以上这些方法是我们比较容易掌握，并且较为容易实施的方法。</p><p>明白了搜索引擎是如何判断关键词与网页内容的相关性之后，举个例子，比如网站主题的判断在明白了以上道理之后也简单多了。即在不同频道，不同内容页面谈论的话题之间的主题关键词语义相关或者潜在语义相关，比如一个网站谈的都是上述的学生&rdquo;、&ldquo;学校&rdquo;、&ldquo;教师&rdquo;、&ldquo;校园&rdquo;、&ldquo;语文&rdquo;、&ldquo;毕业&rdquo;、&ldquo;课程&rdquo;、&ldquo;本科&rdquo;、&ldquo;北大&rdquo;、&ldquo;中文&rdquo;、&ldquo;培训&rdquo;等这些关键词，搜索引擎就可以判定出这个网站的主题是跟教育相关的。</p><p>同样的，我们在进行文案写作的时候，如果要谈论的是一个&ldquo;教育&rdquo;的主题，不妨也用类似的关键词进行强化，以提升排名结果。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/page-keywords-relevance-2.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=165</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=165&amp;key=b268dc09</trackback:ping></item><item><title>SEO两百个秘密：通过潜在语义分析判断关键词与网页内容的相关性</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/page-keywords-relevance.html</link><pubDate>Wed, 10 Jun 2009 13:53:58 +0800</pubDate><guid>http://www.dugutianjiao.com/post/page-keywords-relevance.html</guid><description><![CDATA[<p>搜索引擎排名的基础之一，就是<strong>关键词与网页的相关性</strong>。接上文&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/tf-idf.html">SEO两百个秘密：如何确定网页和查询的相关性</a>&rdquo;，继续谈谈关键词与网页本身的相关性如何判定，简单的说，也就是搜索引擎怎样判断文章和关键词之间的相关性。</p><p>先举个例子，假设我们要买一台电脑，那么我们会进人电脑城的专卖店，而不是进入一家自行车商场。</p><p>原因何在？因为人们可以判断出所购物品和商店的相关性，同样的道理，人们也可以直接看得懂一篇文章是什么主题，也就是说，看得懂关键词和网页本身的相关性的关系。人们看得懂&ldquo;望梅止渴&rdquo;，而搜索引擎只是机器算法，没有&ldquo;止渴&rdquo;的直观的感觉，也没有感性的想象力。</p><p>所以我们可以一眼就判断出自行车商场（网页）跟电脑销售（关键词）是没有关系的，但是搜索引擎不行，它需要用<strong>语义分析</strong>来掌握关键词之间的关系。</p><p>据独孤天骄自己的理解，不一定准确，搜索引擎有个庞大无比的关键词库，分门别类，按照各种潜在的语义关系储存，并且可以读取最新&ldquo;创造&rdquo;出来的词语进行分析和索引，我们可以简单的将这个系统称之为搜索引擎的&ldquo;分词词典&rdquo;，这个词典同时列出了词汇之间的关系，同义词和近义词会被认为是语义相关，有联系的词语有可能被认为是潜在语义相关。</p><p>比如说，搜索引擎知道&ldquo;电脑&rdquo;和&ldquo;计算机&rdquo;是相关的，也知道&ldquo;自行车&rdquo;和&ldquo;脚踏车&rdquo;是相关的，还知道&ldquo;公安&rdquo;和&ldquo;警察&rdquo;是相关的，甚至知道&ldquo;学生&rdquo;、&ldquo;学校&rdquo;、&ldquo;教师&rdquo;、&ldquo;校园&rdquo;、&ldquo;语文&rdquo;、&ldquo;毕业&rdquo;、&ldquo;课程&rdquo;、&ldquo;本科&rdquo;、&ldquo;北大&rdquo;、&ldquo;中文&rdquo;、&ldquo;培训&rdquo;这些关键词是潜在语义相关的。</p><p>现在大家应该大致明白关键词与网页本身的相关性是如何判断了的吧？</p><p>所以好的<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>在进行文案写作的时候，一定会注意到语义分析，不局限于主关键词，而会通过包含与主关键词相关或潜在相关的词汇来支撑主关键词。</p><p>比如，我要写一篇跟&ldquo;鲜花&rdquo;主题相关的文章，我可以通过各种不同的花名，比如&ldquo;牡丹&rdquo;、&ldquo;月季&rdquo;这些并不含&ldquo;花&rdquo;字的关键词来支撑主关键词，更多的同义词、近义词、潜在语义相关的关键词的使用有助于主题的集中和突出，提高页面的关键词排名。</p><p>不过凡事有度，如果仅是单纯地大量去堆砌主关键词&ldquo;鲜花&rdquo;，缺少相关的关键词支撑，排名就往往并不理想。反之，通过各个相关词来强化主关键词，就可能取得好的优化效果，你在搜索一些关键词的时候，有时候搜索引擎呈现给你的页面并不含这个关键词，只是跟这个关键词语义相关或者潜在语义相关而已，就是这个道理。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/page-keywords-relevance.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=164</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=164&amp;key=1fbecc3e</trackback:ping></item><item><title>SEO两百个秘密：页面关键词权重及其相关影响因素</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/page-weight-tips.html</link><pubDate>Wed, 10 Jun 2009 00:00:16 +0800</pubDate><guid>http://www.dugutianjiao.com/post/page-weight-tips.html</guid><description><![CDATA[<p>要明白页面关键词的权重问题，我们必须首先明白搜索引擎是如何<a target="_blank" href="http://www.dugutianjiao.com/post/tf-idf.html">确定网页和查询关键词的相关性</a>之间的关系，大家可以先参阅<a href="http://www.dugutianjiao.com/post/tf-idf.html">http://www.dugutianjiao.com/post/tf-idf.html</a>一文。</p><p>决定页面关键词权重的因子有很多，想到什么就说什么吧，随时补充，如果您有其他的建议，不妨在帖子下面的评论跟出，我会一并整理进来，谢谢：</p><p>1，<a target="_blank" href="http://www.dugutianjiao.com/post/site-weight-tips.html">网站的整体权重</a>（详情参阅<a href="http://www.dugutianjiao.com/post/site-weight-tips.html">http://www.dugutianjiao.com/post/site-weight-tips.html</a>一文）会带给其子页面天生的排名优势。该站的整体权重在Google一定程度上可以参照其PR高低而定，子页面则视其整站PR的传递而定。</p><p>2，关键词在网页标题和全文中的布局。正确的布局关键词有助于该页主关键词的排名，包括<a target="_blank" href="http://www.dugutianjiao.com/post/seo-copywriting.html">文章的SEO规范化写作</a>同样是个重要因素，关键词如何在页面中得到强化本身就是一门很高深的学问。</p><p>3，关键词的密度是否符合要求，是否使用强化标签如加粗斜体下划线大字体等，是否使用Heading标签等，meta以及keywords标签中是否包含关键词等。不过，滥用标签会导致一些负面影响。Aaron Wall曾经就说过，&ldquo;如果H1标签中的关键词和你的页面标题以及锚链文字编排过分整齐，可能伤害你的排名。如果因模板问题导致你的网站中有大量重复区域，你的网站被索引的频率将降低&rdquo;，这一点似乎值得警惕。</p><p>4，该页核心关键词是否有以该关键词为锚文本的外部链接以及内部链接有多少数量的指向。</p><p>5，该页被索引到现在的时间长度。Google很重视因子，百度更重视新鲜的文章。</p><p>6，关键词在页面的位置不同，权重也不同。一般认为关键词在标题标签中最重要，Title 不仅是影响排名的最重要因素，也是影响用户在搜索结果页中点击的极大因素。页面顶部的关键词和文档主要文字内容首段的关键词也较为重要。</p><p>7，页面关键词的相似度，也有讲关键词的亲近度的，也是这个意思。比如上例<a target="_blank" href="http://www.dugutianjiao.com/post/keywords-weight-transfer.html">SEO两百个秘密：关键词的权重传递</a>里面我提过的&ldquo;如果同一个内容页面出现两个以上的关键词，那么我们要尽量使他们的接近程度也相似越好，比如说你要做&ldquo;白菊花&rdquo;这个关键词，它和&ldquo;甘菊&rdquo;、&ldquo;杭菊&rdquo;、&ldquo;杭白菊&rdquo;、&ldquo;茶菊&rdquo;、&ldquo;药菊&rdquo;都是一个概念的关键词，多次出现反而有利于强调&ldquo;白菊花&rdquo;这个关键词。&rdquo;同义词有利于页面关键词权重的提升。</p><p>8，URL中包含关键词也有一定作用。域名和关键词一致，说明网站主可能是这个主题或领域的领先者。域名中有太多横线会带来信任问题，包含两个以上横线的域名是不必要的。Jonah Stein说，&ldquo;如果你的域名已经注册了很多年，不带横线，而且包含你的重要关键词，有1/4的可能，你的网站排名前十。&rdquo;目前不管是百度还是Google，如果主域名包含关键词的拼音url对提升该关键词有很大作用，不过页面包含URL的作用低了很多。</p><p>9，网页内容与关键词的关联程度，即独孤天骄上次说的&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/site-topic-seo.html">网站主题的集中与搜索引擎排名</a>&rdquo;里面所讲的，页面同样也要注意主题的集中。页面如果经常变换主题，容易造成搜索引擎对该页面重新计算权重，如果更换主题内容较多，超过一定阈值，可能会触动搜索引擎的惩罚机制，导致页面降权甚至被K。这是为什么我们不当改变网站的Title会造成快照不更新或倒退，甚至排名下滑，乃至被K的原因。</p><p>10，图片的 Alt 或 Title 属性中的关键词使用对搜索引擎的图片搜索很重要，但对普通的搜索作用就很弱了。对非链接图片而言，Alt 属性只是可用性标签，不对SEO造成影响。</p><p>11，其他，请您补充&hellip;&hellip;</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/page-weight-tips.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=160</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=160&amp;key=15a8da88</trackback:ping></item><item><title>SEO两百个秘密：如何确定网页和查询的相关性</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/tf-idf.html</link><pubDate>Tue, 09 Jun 2009 20:05:23 +0800</pubDate><guid>http://www.dugutianjiao.com/post/tf-idf.html</guid><description><![CDATA[<p>Google的研究院吴军先生2006年6月27日在Google黑板报里发表了一篇《<a target="_blank" href="http://googlechinablog.com/2006/06/blog-post_27.html">如何确定网页和查询的相关性</a>》，详细描述了如何确定一个网页和某个查询的相关性这个过程，在这里独孤天骄结合自己所掌握的一些浅薄SEO知识，摘要叙述如下：</p><p><strong>首先，搜索引擎对关键词组进行分词操作。</strong></p><p>假设说我们要查询关于&ldquo;原子能的应用&rdquo;的网页，搜索引擎对这个关键词需要先进行分词为&ldquo;原子能&rdquo;、&ldquo;的&rdquo;、&ldquo;应用&rdquo;。具体搜索引擎如何进行分词的细节我们另文讲述。</p><p><strong>第二，搜索引擎在计算相关性的时候，会同时删除不相关的&ldquo;停用词&rdquo;。</strong></p><p>在计算相关性的过程中，搜索引擎还会对&ldquo;停用词&rdquo;（Stopwords，Google博文翻译成&ldquo;应删除词&rdquo;），比如这个例子中的关键词&ldquo;的&rdquo;占了总词频的80%以上，但它对确定网页的主题几乎没有用，所以在度量相关性是不应考虑它们的频率。也就是说，搜索引擎运算规则中，会将&ldquo;的&rdquo;这个词消噪。在汉语中，应删除词还有&ldquo;是&rdquo;、&ldquo;和&rdquo;、&ldquo;中&rdquo;、&ldquo;地&rdquo;、&ldquo;得&rdquo;等等几十个。</p><p><strong>第三，计算相关性过程中，为每个划分出来的关键词单独给予权重。</strong></p><p>在汉语中，&ldquo;应用&rdquo;是个很通用的词，而&ldquo;原子能&rdquo;是个很专业的词，后者在相关性排名中比前者重要。因此我们需要给汉语中的每一个词给一个权重，这个权重的设定必须满足下面两个条件：</p><p><em>1，一个词预测主题能力越强，权重就越大，反之，权重就越小。</em></p><p>在搜索引擎中，一个词能够概括这篇文章意思的能力越高，权重就越高，反之则降低。我们在网页中看到&ldquo;原子能&rdquo;这个词，或多或少地能了解网页的主题。我们看到&ldquo;应用&rdquo;一次，对主题基本上还是一无所知。因此，&ldquo;原子能&ldquo;的权重就应该比应用大。我再举个例子，比如&ldquo;吸烟的危害&rdquo;这个关键词组，&ldquo;吸烟&rdquo;是全文的核心关键词，&ldquo;危害&rdquo;则能表达很多种不单纯指香烟的危害。所以&ldquo;吸烟的危害&rdquo;这个页面中，我们要提升&ldquo;吸烟&rdquo;这个关键词的权重。由此我们要知道，做组合关键词的时候应该怎么去合理布局了。</p><p><em>2，应删除词的权重应该是零。</em></p><p><strong>&nbsp;第四，搜索引擎通过TF/IDF公式进行相关性计算。</strong></p><p>TF/IDF（term frequency/inverse document frequency) 的应用是搜索引擎量化关键词权重的方法，也是其排名基础之一。TF/IDF的概念被公认为信息检索中最重要的发明，在搜索、文献分类和其他相关领域有广泛的应用。现在的搜索引擎对 TF/IDF 进行了不少细微的优化，使得相关性的度量更加准确了。对一个简单的搜索引擎而言，给定一个查询，使用TF/IDF 结合网页排名(Page Rank)，就大致上可以等于有关网页综合排名了。</p><p>包含这三个词多的网页应该比包含它们少的网页更具备相关性。当然，由于网页长度不一，长网页包含的关键词会更多，但并非越长的网页越具备排名优势，因此搜索引擎需要根据网页的长度，对关键词的次数进行归一化，也就是用关键词的次数除以网页的总字数，这个商称为&ldquo;关键词的频率&rdquo;或&ldquo;单文本词汇频率&rdquo;（Term Frequency)，概括地讲，如果一个查询包含关键词 w1,w2,...,wN, 它们在一篇特定网页中的词频分别是: TF1, TF2, ..., TFN。 （TF: term frequency)。 那么，这个查询和该网页的相关性就是：TF1 + TF2 + ... + TFN。</p><p>举例说明，比如在某个共计有1000个词的网页中，&ldquo;原子能&rdquo;、&ldquo;的&rdquo;和&ldquo;应用&rdquo;分别出现了 2 次、35 次 和 5 次，那么它们的词频就分别是 0.002、0.035 和 0.005。 我们将这三个数相加，其和0.042 就是相应网页和查询&ldquo;原子能的应用&rdquo;相关性的一个简单的度量。</p><p>忽略不相关的应删除词后，上述网页的相似度就变成了0.007，其中&ldquo;原子能&rdquo;贡献了0.002，&ldquo;应用&rdquo;贡献了 0.005。</p><p>我们很容易发现，如果一个关键词只在很少的网页中出现，我们通过它就容易锁定搜索目标，它的权重也就应该大。反之如果一个词在大量网页中出现，我们看到它仍然不很清楚要找什么内容，因此它应该小。概括地讲，假定一个关键词 ｗ 在 Ｄｗ 个网页中出现过，那么 Ｄｗ 越大，ｗ 的权重越小，反之亦然。在信息检索中，使用最多的权重是&ldquo;逆文本频率指数&rdquo; （Inverse document frequency 缩写为ＩＤＦ），它的公式为ｌｏｇ（Ｄ／Ｄｗ）其中Ｄ是全部网页数。比如，我们假定中文网页数是Ｄ＝１０亿，应删除词&ldquo;的&rdquo;在所有的网页中都出现，即Ｄｗ＝１０亿，那么它的ＩＤＦ＝log(10亿/10亿）= log (1) = ０。假如专用词&ldquo;原子能&rdquo;在两百万个网页中出现，即Ｄｗ＝２００万，则它的权重ＩＤＦ＝log(500) =6.2。又假定通用词&ldquo;应用&rdquo;，出现在五亿个网页中，它的权重ＩＤＦ = log(2)则只有 0.7。也就只说，在网页中找到一个&ldquo;原子能&rdquo;的比配相当于找到九个&ldquo;应用&rdquo;的匹配。利用 IDF，上述相关性计算个公式就由词频的简单求和变成了加权求和，即 TF1*IDF1 +　TF2*IDF2 ＋... + TFN*IDFN。在上面的例子中，该网页和&ldquo;原子能的应用&rdquo;的相关性为 0.0161，其中&ldquo;原子能&rdquo;贡献了 0.0126，而&ldquo;应用&rdquo;只贡献了0.0035。这个比例和我们的直觉比较一致了。</p><p>知道了以上的计算方法后，我们基本就可以知道搜索引擎是如何工作的了，明白查询和网页的相关性是如何得出来的。在搜索引擎最简单的应用就是让<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>明白为什么大量堆砌主关键词，并无法提升关键词权重和搜索引擎优化排名。</p><p>以上我们讲的是关键词和查询的相关性，下一篇文章独孤天骄将接着讲述关键词与网页本身的相关性。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/tf-idf.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=162</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=162&amp;key=885465aa</trackback:ping></item><item><title>SEO两百个秘密：网站权重及其相关影响因素</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/site-weight-tips.html</link><pubDate>Mon, 08 Jun 2009 00:12:43 +0800</pubDate><guid>http://www.dugutianjiao.com/post/site-weight-tips.html</guid><description><![CDATA[<p>前文我们写过&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/keywords-weight-transfer.html">SEO两百个秘密：关键词的权重传递</a>&rdquo;（<a href="http://www.dugutianjiao.com/post/keywords-weight-transfer.html">http://www.dugutianjiao.com/post/keywords-weight-transfer.html</a>），主要是以单页面的排名为考量对象，现在我们要说的网站权重跟排名有本质的区别，并不以单页面为单位，是对网站本身一个整体的考量。</p><p><strong>一、什么是网站的权重</strong></p><p>虽然许多SEOer都在谈论网站权重，但是几乎没有定论。简单的说，网站权重就是站点在搜索引擎眼中的重视度、权威度，表现在<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>上就是综合所有的有力排名因素所带来的被搜索引擎认可的信任值。</p><p><strong>二、网站权重和SEO排名的关系</strong></p><p>网站权重一定程度上决定了网站的SEO排名，但是远非全部。网站权重只是搜索引擎排名算法中的一部分，SEO排名是个综合运算的过程。反过来，网站排名高对网站权重的亦有所影响，不过这个反作用会微弱些。好公司、好大学可以提升员工与学生的品牌价值，好的员工和学生也可以提高公司与学校的知名度。你曾经在百度工作过，别人在第一印象里面就会首先认可你；而你是个普通小公司顶尖的工程师，却需要相关的一些证明，人家才能认可。</p><p>可以这么理解：网站权重不能等同于SEO排名，但是对SEO排名有着极大影响，同时整站权重的提高也有利于内容页的排名。同时，站点单页面的排名提升也有利于网站权重的积累。</p><p><strong>三、影响网站权重的因素</strong></p><p>1、域名的存在时间和后缀。域名本身就值得SEO，这才有&ldquo;养玉米&rdquo;之说。首先，域名注册的时间越早，越早被搜索引擎索引，域名权重就越高。其次，域名包含.gov.edu后缀，代表了一般用户难于注册的政府和教育行业，天生具有域名权重优势。</p><p>2、网站存在的时间。一个域名注册下来之后如果没有开通做站，是不被计入网站权重之中的。一个新站从开始被索引之日起，到通过搜索引擎初期的考核即需要一段时间，对百度来说这个叫&ldquo;释放&rdquo;的过程，对Google而言即是逃离&ldquo;新站沙盒&rdquo;的过程。然后就是权重的逐步积累，网站从被搜索收录开始，每一天的存在都是价值的积累。</p><p>3、网站服务器的稳定性和安全性。网站的服务器稳定和安全有利于搜索引擎蜘蛛的抓取。</p><p>4、网站内容的相关性。搜索引擎的终极目的，是为了给搜索者提供最准确的高质量内容。内容永远是第一位的，<a target="_blank" href="http://www.dugutianjiao.com/post/site-topic-seo.html">网站主题的集中有利于搜索引擎排名</a>。 站长创造或者通过用户的原创来获取内容的Web2.0网站容易获得较好的排名，过多的转载和采集，只会降低一个网站的权重。</p><p>5、网站的更新速度和频率。经常不更新或者采集类的网站，权重会逐渐降低。企业站除外，因为搜索引擎可以识别企业站，它对企业站的更新比较慢。</p><p>6、网站的信任指数。包括关于我们页面、联系方式、版权信息、隐私保护、网站ICP备案许可等。具体大家可以查阅&ldquo;SEO两百个秘密：Google TrustRank及其影响因素分析&rdquo;（<a href="http://www.dugutianjiao.com/post/seo-trustrank-secret.html">http://www.dugutianjiao.com/post/seo-trustrank-secret.html</a> ）。</p><p>7、网站的链接。搜索引擎优化有两项内容是亘古不变的真理，那就是内容和链接的权重，有些SEO甚至将原创加外链视为百度权重提升的唯一秘诀。链接的价值就是为了提高自己网站的权重及权重的传递。权威开放式目录的收录与否，比如：DMOZ、yahoo目录等也有利于提升网站权重。</p><p>8、提高内页权重。内页的收录和排名同样重要，根据<a target="_blank" href="http://www.dugutianjiao.com/post/keywords-weight-transfer.html">关键词的权重传递原理</a>，内容页的更新和排名会促使首页和整站权重的提升。</p><p>9、网页代码及关键字优化。</p><p>10、网站规模。网站规模越大越好，只有一个页面的单页面站点，如何获得百度的绝对信任？</p><p>11、其他&hellip;&hellip;</p><p><strong>四、网站权重高的表现</strong></p><p>我们以百度为例，最基础的表现是百度快照每日更新，<a target="_blank" href="http://www.dugutianjiao.com/post/site-indexed-rate.html">站点收录率</a>越高越好，主关键词排名越高越好，政府机关、教育单位的网站具有天生的高权重。当然，这些只是衡量一个网站权重高低的表象指标。真正高权重的网站最大的特征独孤天骄认为是成为百度的新闻源，成为百度时时刻刻更新的网站，并且赋予最高级别信任度的网站，比如和讯的博客就经常被SEO滥用，原因之一就是因为它成为了百度的新闻源，一篇文章刚发布不长时间就会马上被收录。包括一些人工认定的网站，比如hao123虽然无法被纳入新闻源，但是在百度里面的权重绝对是无以伦比的。</p><p>百度的权重机制跟Google相比，有一个致命的&ldquo;优点&rdquo;，Google权重再高的网站，一般只有在跟相关关键词时候才会发挥效力，而百度只要一个站点被认为是高权重的网站，它就有可能在任何领域都具有权威性。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/site-weight-tips.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=161</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=161&amp;key=19fc0c7d</trackback:ping></item><item><title>SEO两百个秘密：关键词的权重传递</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/keywords-weight-transfer.html</link><pubDate>Sun, 07 Jun 2009 14:36:51 +0800</pubDate><guid>http://www.dugutianjiao.com/post/keywords-weight-transfer.html</guid><description><![CDATA[<p><strong>一、什么是关键词权重？</strong></p><p>权重就是网站或关键词在搜索引擎眼中的重要性、权威性。</p><p>权重有网站权重和关键词权重两个方面的内容。我们可以这样理解，网站的权重就相当于网站在搜索引擎眼中的知名度、品牌价值等；关键词权重就是这个关键词在搜索引擎的排名优先度，权重越高排名越高，反之亦然。</p><p><strong>二、关键词权重是如何传递的？</strong></p><p>我们先来举个例子，一个产品，客户最重视的是品牌。没有品牌的产品，客户在选购的时候总会犹豫不决。</p><p>假设现在独孤天骄要去购买一台笔记本电脑。在明确了硬件配置，对价格有了大致的心理底线之后首先也是看笔记本电脑的品牌。如果三鹿奶粉企业也生产电脑，配置跟我的要求一致，价格还低一倍，另外有超值赠品，即使这样我也不会去考虑选购它。首先这个企业不付责任给我留下了巨大的不良影响，害我到现在都对牛奶过敏；其次它并非是生产笔记本的专业厂家。因此，我必然接着看其他品牌电脑，最终可能选择了&ldquo;华硕&rdquo;，它坚若磐石的本质值得信赖，接下来我就查看哪个具体型号跟我的要求符合，如果价位合适，也许我就买下来了。这就是企业的&ldquo;信任传递&rdquo;。</p><p>关键词权重也是如此。搜索引擎首先会判断网站的权重，给以其相关关键词（注意，这里是相关，不相关的关键词优先权很小）排名优先权。网站如果没有权重，即使内容页被收录几十万，流量也将少得可能，甚至不超过100个ip；因为收录量如此巨大的数据反倒稀释掉了关键词的权重导致排名下降。一个名不见经传的小网站和新浪网同时发布&ldquo;神舟飞船&rdquo;的消息，当然新浪网的先天排名会更高点。</p><p>不过，在这里，我们要特别注意：高权重的网站，其底下的各个页面具有先天的排名优势，但是这不代表着网站权重高，其关键词排名一定就靠前，毕竟单一个页面的排名跟页面本身的优化，外部链接等都有很大的关系。如果这个小网站有许多的外部链接指向它的&ldquo;飞船&rdquo;页面，仍然很有可能超越新浪网。这跟搜索&ldquo;SEO&rdquo;，新浪网的排名超不过&ldquo;SEO研究院&rdquo;是一样的道理。</p><p>这里我们先排除网站的权重问题，将这个&ldquo;飞船&rdquo;专题小网站排到搜索引擎搜索结果的第一位。那么当&ldquo;飞船&rdquo;（核心关键词）这个品牌被搜索引擎所接受（就相当于用户接受了&ldquo;华硕&rdquo;品牌），&ldquo;神舟飞船&rdquo;（次级关键词）的排名也就容易排名上去了（相当于&ldquo;华硕笔记本&rdquo;更容易被客户所消费）。同样道理，&ldquo;神舟飞船登月舱&rdquo;（长尾关键词，不知道有没有这个东西，举例而已）自然也容易获得排名。反过来也是，如果这个网站跟&ldquo;神舟飞船&rdquo;相关的长尾关键词都有好的排名，那么这个二级关键词也就容易排上去；当类似于&ldquo;神舟飞船&rdquo;、&ldquo;宇宙飞船&rdquo;、&ldquo;登月飞船&rdquo;等等跟&ldquo;飞船&rdquo;相关的关键词都排名上去，那么&ldquo;飞船&rdquo;这个主关键词自然而然也就非常容易上去了。</p><p>以上是关键词权重传递的大致流程，真正的传递比这个要复杂得多。</p><p><strong>三、SEO要为关键词权重做些什么？</strong></p><p>因此，站长在做网站的时候，不能单纯注意首页的排名，期望通过首页的关键词权重来传递到各个次级页面、终极页面。独孤天骄建议应该反过来操作，这样就注重了整站优化，关键词权重上去了，首先将获得巨大流量，其次，传递的权重同时影响到首页的核心关键词排名，这样的排名将会非常稳定，即使每天数万上十万ip都不会被搜索引擎惩罚。</p><p>作为SEO，懂得了关键词权重是具有传递性的，那么就应该在以下两个方面做好工作：</p><p><strong><em>1，关键词布局。</em></strong></p><p>按照这个原理，我们来布局关键词。</p><p>我们在首页布置核心关键词，栏目页布置次级关键词，内容页布置长尾关键词。这三个层次的页面中所出现的关键词应该都<a target="_blank" href="http://www.dugutianjiao.com/post/site-topic-seo.html">同属于一个主题</a>，比如我在上文的&ldquo;SEO两百个秘密：网站主题的集中与搜索引擎排名&rdquo;（<a href="http://www.dugutianjiao.com/post/site-topic-seo.html">http://www.dugutianjiao.com/post/site-topic-seo.html</a>）里面所举的例子，首页布置关键词&ldquo;鲜花&rdquo;，栏目页布置&ldquo;菊花&rdquo;，内容页布置&ldquo;白菊花&rdquo;&ldquo;黄菊花&rdquo;等。</p><p>这样的关键词布局设计就会呈一个金字塔型，有利于关键词权重的传递。当你获得&ldquo;鲜花&rdquo;的排名之后，你栏目页面所布置的关键词也较为容易获得排名。这个很好理解，我们假设你这专卖店是销售&ldquo;华硕品牌&rdquo;的产品，如果用户认定你的&ldquo;华硕笔记本&rdquo;（相当于栏目页关键词）不错，那么当你推荐任何一种型号的笔记本（相当于内容页关键词），如果不考虑价格和性能因素，用户都是能够接受的。</p><p>如果同一个内容页面出现两个以上的关键词，那么我们要尽量使他们的接近程度也相似越好，比如说你要做&ldquo;白菊花&rdquo;这个关键词，它和<font size="2">&ldquo;甘菊&rdquo;、&ldquo;杭菊&rdquo;、&ldquo;杭白菊&rdquo;、&ldquo;茶菊&rdquo;、&ldquo;药菊&rdquo;</font>都是一个概念的关键词，多次出现反而有利于强调&ldquo;白菊花&rdquo;这个关键词。</p><p>&ldquo;金字塔&rdquo;布局的关键词权重是会互相传递的，众多内页会共同提高首页的权重，即如果底层的关键词表现良好，核心关键词也会有所提升。这个也很简单，假设任何华硕的产品在你这店铺里面销售都超级不错，那么估计这个地区的总代理就非你莫属了。</p><p><strong><em>2，内外部链接建设。</em></strong></p><p>比如独孤天骄曾经建议SEO在做反向链接的时候，不要单纯做核心关键词的外部链接，有些朋友不大理解，明白了这个关键词的传递原理，SEO中的许多困惑其实就简单得多了。也就是说，在你给&ldquo;鲜花&rdquo;网站做外部链接的时候，不一定都以&ldquo;鲜花&rdquo;为锚文本指向首页，也可以适当做些&ldquo;白菊花&rdquo;、&ldquo;牡丹花&rdquo;的锚文本指向二级栏目页等。</p><p>同时，内部链接我们要控制所有的内容页都有指向首页的链接，即&ldquo;返回鲜花首页&rdquo;的链接，这样内容页的关键词权重才有办法传递到首页；其次二级栏目页互指，并且统一有指向首页的链接。这些指向关系其实比较复杂，我们下一篇文章具体讲述这个链接结构。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/keywords-weight-transfer.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=159</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=159&amp;key=3349c727</trackback:ping></item><item><title>SEO两百个秘密：搜索引擎对复制网页的算法</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/duplicate-content-algorithm.html</link><pubDate>Sat, 06 Jun 2009 22:13:23 +0800</pubDate><guid>http://www.dugutianjiao.com/post/duplicate-content-algorithm.html</guid><description><![CDATA[<p><a target="_blank" href="http://www.dugutianjiao.com/post/duplicate-content-seo.html">上一篇文章</a>，我们讲述了重复内容即复制页面对SEO的影响以及可以采取的应付对策，现在我们来谈谈搜索引擎具体是如何判断复制网页这一基础算法。</p><p>以下我主要从<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>的角度来简单谈谈搜索引擎是如何判定复制网页的，如果想更深入地了解这一基本原理，可以参考《<a target="_blank" href="http://www.amazon.cn/mn/detailApp?prodid=zjbk170377&amp;source=hyb927">搜索引擎&mdash;&mdash;原理、技术与系统</a>》（李晓明等著）和 《<a target="_blank" href="http://www.amazon.cn/mn/detailApp?prodid=bkbk728363&amp;source=hyb927">搜索引擎原理、实践与应用</a>》（卢亮、张博文编著）这两本书。</p><p><strong>首先，搜索引擎对所索引的所有网页进行页面净化和内部消重。</strong></p><p>任何一家搜索引擎在尚未进行复制网页判断这一操作之前都定然会有个网页净化和内部消重的过程。搜索引擎首先要清除噪音内容，对网页内部的广告、版权信息、共同的页眉页脚部分等进行净化，然后提取出该页面的主题以及和主题相关的内容，用以排名工作，噪音内容是不计入排名权重之中的。消重也差不多是这个意思，搜索引擎对其所收集的网页集里面主题相同或极端相似的，比如同一模板之中多次出现的共同代码，将其作为冗余内容，进行消除。</p><p>我们可以这样理解，<em>最理想</em>的状态之下，一篇原创文章，搜索引擎仅将标题和内容计入排名之中，其他全部都消除。</p><p>DocView模型就是一个自动分类和消重的模型，当然，不是非常准确。大家可以简单了解一下，DocView模型包括网页表识、网页类型、内容类别、标题、关键词、摘要、正文、相关链接等要素，它通过提取DocView模型要素的方法应用在网页自动分类和网页消重之中。</p><p>通过了解以上内容，我们就能大致明白，同一篇文章，为什么放到两个完全不同模板的站点之上，搜索引擎仍然能够正确识别出这是一个复制页面的原因了吧。</p><p><strong>其次，搜索引擎对净化的页面进行重复内容的判断。</strong></p><p>那么搜索引擎具体是如何判断复制页面的呢？以下内容是北大天网搜索引擎的去重算法，大部分来自对《搜索引擎&mdash;&mdash;原理、技术与系统》相关知识的整理，大家可以自行参考相关文档。</p><p>现有方法大致可以分为以下三类：</p><p>1、利用内容计算相似<br />2、结合内容和链接关系计算相似<br />3、结合内容，链接关系以及url文字进行相似计算</p><p>现有绝大部分方法还是利用文本内容进行相似识别，其它两种利用链接关系以及URL文字的方法还不是很成熟，而且从效果看引入其它特征收效并不明显，所以从实际出发还是选择利用内容进行相似计算的算法。</p><p>搜索引擎判断复制网页一般都基于这么一个思想：为每个网页计算出一组信息指纹（信息指纹，英文是Fingerprint，就是把网页里面正文信息，提取一定的信息，可以是关键字、词、句子或者段落及其在网页里面的权重等，对它进行加密，如MD5加密，从而形成的一个字符串。信息指纹如同人的指纹，只要内容不相同，信息指纹就不一样。搜索引擎在对爬取的网页建立索引的时候需要对重复内容的网页进行识别和消重，这就要用到信息指纹），若两个网页有一定数量相同的信息指纹，则认为这两个网页的内容重叠性很高，也就是说两个网页是内容复制的。注意一点，算法提取的信息不是针对整张网页，而是把网站里面共同的部分如导航条、logo、版权等这些网页的噪音信息过滤掉后剩下的文本。</p><p>很多搜索引擎判断内容复制的方法都不太一样，主要是以下两点的不同：</p><p>1、计算信息指纹的算法；<br />2、判断信息指纹的相似程度的参数。</p><p><strong>部分算法简介：</strong></p><p><em><strong>1、分段签名算法</strong></em></p><p>这种算法是按照一定的规则把网页切成N段，对每一段进行签名，形成每一段的信息指纹。如果这N个信息指纹里面有M个相同时（m是系统定义的阙值），则认为两者是复制网页。这种算法对于小规模的判断复制网页是很好的一种算法，但是对于像Google这样海量的搜索引擎来说，算法的复杂度相当高。</p><p><em><strong>2、基于关键词的复制网页算法</strong></em></p><p>像Google这类搜索引擎，他在抓取网页的时候都会记下网页中出现的关键词（中文分词技术）以及每个关键词的权重（关键词密度）以及提取meta descrīption或者每个网页的512个字节的有效文字。</p><p>假设我们约定Pi表示第i个网页；该网页权重最高的N个关键词构成集合Ti={t1,t2,...tn}，其对应的权重为Wi={w1,w2,...wi}，摘要信息用Des(Pi)表示，前n个关键词拼成的字符串用Con(Ti)表示，对这n个关键词排序后形成的字符串用Sort(Ti)表示。</p><p>以上信息指纹都用MD5函数进行加密。</p><p>基于关键词的复制网页算法有以下5种：</p><ul>    <li><strong>1、MD5(Des(Pi))=MD5(Des(Pj)),就是说摘要信息完全一样，i和j两个网页就认为是复制网页；</strong></li>    <li><strong>2、MD5(Con(Ti))=MD5(Con(Tj)),两个网页前n个关键词及其权重的排序一样，就认为是复制网页；</strong></li>    <li><strong>3、MD5(Sort(Ti))=MD5(Sort(Tj)),两个网页前n个关键词一样，权重可以不一样，也认为是复制网页。</strong></li>    <li><strong>4、MD5(Con(Ti))=MD5(Con(Tj))并且Wi-Wj的平方除以Wi和Wj的平方之和小于某个阙值a，则认为两者是复制网页。</strong></li>    <li><strong>5、MD5(Sort(Ti))=MD5(Sort(Tj))并且Wi-Wj的平方除以Wi和Wj的平方之和小于某个阙值a，则认为两者是复制网页。</strong></li></ul><p>关于第4和第5的那个阙值a,主要是因为前一个判断条件下，还是会有很多网页被误伤，搜索引擎开发根据权重的分布比例进行调节，防止误伤。</p><p>以上5种算法运行的时候，算法的效果取决于N，就是关键词数目的选取。选的数量越多，判断就会越精确，但是计算速度也会越慢。所以必须考虑一个计算速度和去重准确率的平衡，根据试验结果，10个左右关键词最为恰当。</p><p>当然，以上算法只是给SEO一个思路而已，并非搜索引擎判断复制网页的全部算法。只要在SEO的过程中注意原创和&ldquo;伪原创&rdquo;，大可不必太在乎这个算法。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/duplicate-content-algorithm.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=156</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=156&amp;key=d2c81481</trackback:ping></item><item><title>SEO两百个秘密：重复内容对SEO的影响及对策</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/duplicate-content-seo.html</link><pubDate>Fri, 05 Jun 2009 13:11:49 +0800</pubDate><guid>http://www.dugutianjiao.com/post/duplicate-content-seo.html</guid><description><![CDATA[<p><strong>一、什么是重复内容？</strong></p><p>重复内容也叫复制网页，一般是指在不同域名间或同一个域名内存在大量的相同或相似的内容页面。</p><p>很多时候，重复内容是由于网站结构导致的，即网站本身的内容重复或者因为URL设置问题导致的内容重复，这并非站长本意，不带有恶意，但有时一些网站为了操纵<a target="_blank" href="http://www.dugutianjiao.com">搜索引擎排名</a>，获得更多流行或长尾关键词的访问量，大量地从其他网站复制内容，由于内容盗窃也就是我们所说的内容采集导致的重复内容应该说就是带有恶意的故意为之了。以上两种也是重复内容来源的主要途径。</p><p>不过，可以肯定的一点是，文章中对其他文章小部分的引用不会被搜索引擎认定为重复内容，这一点大家可以放心，没有必要杞人忧天。</p><p><strong>二、重复内容对SEO有什么影响？</strong></p><p>所有搜索引擎都旨在为用户提供独特而相关的内容，因此它们都喜欢原创、高质量的内容，搜索引擎在抓取网页和显示搜索结果时，一定会尽力去避免显示内容明显一样的重复结果。</p><p>搜索引擎对复制网页的做法深恶痛绝，百度明确说明&ldquo;如果你的站点上的网页，大量都是复制自互联网上的高度重复性的内容，那么，你的站点也有可能被百度丢弃。&rdquo;Google也明确规定&ldquo;请不要创建包含大量重复内容的多个网页&rdquo;。现阶段，重复内容所带来的效果仅仅是一时的，瞬间的，并不无助于排名的提升，甚至会对自己的网站排名带来影响。</p><p>不过，除非是恶意抄袭带来的内容重复，否则复制网页并不会带来惩罚！这一点可能很多SEO都不清楚。&nbsp;Yahoo曾经说不会轻易对复制网页降级，而是尽力判断谁是原始内容的网页，Matt Cutts说Google也是尽力发现复制网页中最原始的那个版本。Google在抓取网页和获得搜索结果时，重点放在过滤而不是排名调整上。</p><p>尽管Google和Yahoo都表示他们能够对原始网页和复制页面进行明确判断，但事实上并非如此。绝大部分情况之下搜索引擎确实能够判断文章的原始出处，但是也有很多例子表明如果一个内容页面被权重较高的网站转载，搜索引擎尤其是Google往往认定转载站是原始内容出处，真正的原创文章反倒被认为是复制网页。将SEO研究院的部分文章在搜索引擎里面进行搜索，独孤天骄发现，Google对原创的判断较好，绝大部分的文章该SEO博客都排在第一位，但是百度则不同，有些文章甚至排到了第三页之外。</p><p>因此，我们初步可以判定，重复内容会影响网站的<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>，尤其是非法的复制转载采集等容易影响到搜索引擎对原始网页的权威性判定，给网站的排名带来负面效应。</p><p><strong>三、SEO应该如何应对重复内容？</strong></p><p>如何才能确保原创文章在搜索引擎中排到复制内容的前面？</p><p>在搜索引擎的眼里，判断复制内容有很多办法，搜索引擎对于复制网页的识别和判断也做了大量努力，已经可以直接分析正文内容部分，以及通过分析网页内部和外部链接来判断该文是否原创；并且能够自动过滤绝大部分的重复内容。</p><p>首先，我们必须保证文章内容的独特性，避免与其他内容的类同性，从而保证该文不会直接被拉入&ldquo;重复内容&rdquo;的黑箱之中。复制网页的判断并没有一个比例，Google也说对其他文章小部分的引用不会被搜索引擎认定为重复内容，但到底多大的比例才不算呢？我想，超过50%应该足够让搜索引擎接受你的文章为&ldquo;原创&rdquo;了。</p><p>其次，正常情况下，第一时间发布文章的网站将被认定为原始网页，其他网站转载采集的就是&ldquo;重复内容&rdquo;或&ldquo;复制页面&rdquo;。因此，当确保自己的页面已经被主流搜索引擎收录之后，就可以允许其他站点的转载。但是，搜索引擎不会单纯看发布时间来确定&ldquo;原创&rdquo;，这对小网站来说是比较致命的，但权威网站转载你之后，由于其拥有巨大的反向链接资源，搜索引擎甚至往往将其视为原始网页，从而过滤掉你的原创页面。</p><p>如何解除这一过滤惩罚呢？鉴于搜索引擎很大一部分是通过页面的反向链接数来判断原始网页的出处，因此为自己的原创文章建立版权链接，让转载文章尽可能保留该文的版权说明，以文章标题为锚文字的返回链接指向你自己的原始网页，这样方便搜索引擎通过反向链接的数目来确定原始页面的权威性，从而将原始网页排到第一位。</p><p>第三，我们上文讲过内容采集导致的复制页面和网站结构导致的重复内容解决方法不尽相同。</p><p>前者的重复内容如果太多容易受到惩罚，后者虽然不会受到惩罚但是终究会影响到SEO的效果，导致流量不佳，因此，减少内容重复就是我们SEO的目的所在。</p><p>如果文章是转载的，尽量修改文章内容，为每个页面写上不同的独立的标题和meta标签(关键词标签和描述标签)，使之符合我们说将的&ldquo;伪原创原则&rdquo;。</p><p>如果是因为网站结构问题，那么尽可能通过robots.txt工具来适当阻止搜索引擎的访问，假设我们不想搜索引擎索引网站文章的打印版，便可在robots.txt 文件中写上正则表达式来禁止搜索引擎蜘蛛的抓取，假设说我们不让搜索引擎收录网站中含&ldquo;?&rdquo;的页面，我们可以在robots.txt写入如下代码：</p><p>Disallow: /*?*<br />Disallow: /*?</p><p>除以上内容，我们摘取其他一些帮助信息，来自Google官方博客提供的如何主动处理内容复制问题：</p><p>* 使用 301 重定向：如果你已经重构你的网站，请在你的原网站的 .htaccess 中使用 301 重定向(永久性重定向)来重定向你的用户、Google 爬虫以及其他搜索引擎蜘蛛等。<br />* 链接要一致：努力使你的内部链接保持一致， 不要既有 /page/ ，又有 /page 和 /page/index.htm 的内部链接。同时，如果你的网站程序既可实现动态也可实现静态，或者之前是静态现在变为动态等情况，出现一个网页有多个URL，这两种都是指向同一个网页，但却被搜索引擎以不同的URL抓取，这种情况下我们要尽量使用一种URL格式，减少多重URL的使用。<br />* 使用谷歌网站管理员工具的首选域功能：如果其他网站链接你的 URL时 既使用 www 版本又使用无 www 的版本，你可以用谷歌网站管理员工具让我们知道你想要哪种索引方式。<br />* 避免发布无内容页：用户不喜欢看到无实际内容的页面，要尽量避免空架页。<br />* 减少模板网页上的重复内容：拿版权声明来说，你有两种选择，一种是在你的每一个页面底部都有一个冗长的版权声明；另一种是设立一个专门的版权详细声明页，然后在每页底部写一个非常简短的总结，并链接到版权声明页。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/duplicate-content-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=154</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=154&amp;key=030f9b58</trackback:ping></item><item><title>SEO两百个秘密：网站地区差异化搜索</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/site-area-different.html</link><pubDate>Wed, 03 Jun 2009 21:18:23 +0800</pubDate><guid>http://www.dugutianjiao.com/post/site-area-different.html</guid><description><![CDATA[<p>你确实没看错标题！是的，网站服务器所在的地理位置本身和网站针对的用户所在地理位置都会对<a target="_blank" href="http://www.dugutianjiao.com">搜索引擎优化</a>排名造成影响。本文我将着重讲述网站本身面对客户的地区差异对SEO的影响，这是近一年来的SEO趋势之所在，百度也是最近阶段才真正开始尝试地区差异化搜索，目前已经渐渐趋于稳定，在百度搜索上，排名结果会根据搜索用户所在地区的差异而有所不同。</p><p><strong>一、什么是百度的地区差异搜索</strong></p><p>实例说明下什么是百度的地区差异搜索。</p><p>百度前一阶段已经开始在测试地区搜索，举个例子，我目前人在福建泉州，随便搜索几个关键词来说明这个现象，其他地区的朋友可以用以下关键词搜索看结果是否有所差异。</p><p>首先独孤天骄搜索最热门的&ldquo;<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>&rdquo;这一关键词在百度的排名结果，第六、第七、第九都是福建地区或者泉州本地的网站：<br />&nbsp;</p><p><img title="" alt="" src="http://www.dugutianjiao.com/upload/2009/6/diqu-serf-seo.jpg" onload="ResizeImage(this,520)" /></p><p>&nbsp;再搜索&ldquo;驾校&rdquo;这个关键词，第八名也是泉州地区的网站：</p><p><img title="" alt="" src="http://www.dugutianjiao.com/upload/2009/6/diqu-serf-jiaxiao.jpg" onload="ResizeImage(this,520)" /></p><p>接着搜索关键词&ldquo;美食网&rdquo;，第八名也是泉州地区的网站：</p><p><img title="" alt="" src="http://www.dugutianjiao.com/upload/2009/6/diqu-serf-meishiwang.jpg" onload="ResizeImage(this,520)" /></p><p>最后，搜索下&ldquo;学校&rdquo;这个关键词，第八名也还是泉州地区的网站：</p><p><img title="" alt="" src="http://www.dugutianjiao.com/upload/2009/6/diqu-serf-xuexiao.jpg" onload="ResizeImage(this,520)" /></p><p>由此可见，在目前百度的SERF中，一般都会有1-3个最多不超过4个的搜索结果留给搜索用户所在地区的网站。在这里，独孤天骄还注意到一个有趣的现象，如果只有一个本地网站的话，一般排名都在<strong>第八位</strong>。至于为什么是第八位，其实是有道理的，有兴趣的话我下次写篇文章来说说这个问题，<u>本文的读者也无妨在底下的评论说说您的想法</u>。</p><p><strong>二、百度的地区差异搜索如何判断本地化网站</strong></p><p>目前能够确定的是，当访客是泉州地区的ip，搜索引擎就会返回一个到三个泉州地区的网站作为搜索结果。但是，搜索引擎如何判断网站与地区的关系呢？</p><p>独孤天骄猜想，外链文字和网站标题可能是最为重要的参数。</p><p>首先，如果SEO研究院外部链接中绝大部分锚文本都是指向&ldquo;厦门SEO&rdquo;，那么百度就有可能将这个SEO博客当成是厦门地区的本地网站。</p><p>其次，网站标题出现地区名称。比如&ldquo;SEO研究院&mdash;&mdash;厦门地区最好的搜索引擎优化公司&rdquo;，如果这个博客的版权信息，联系信息之类都是厦门的，就更容易判断了。首页的标题标签包含地区名称应该最为重要。</p><p>其他有可能参考的信息，比如网站备案信息，但是这个不是很准，比如我备案信息是闽ICP，是福建省的信息，但是我如果做一个面向广东省的网站，其实也是完全可以的；至于百度人工审核我觉得更难，毕竟关键词组不可胜数，百度就是拥有成千上万个审核专员也是审核不过来的。</p><p><strong>三、百度的地区差异搜索对SEO的影响及应对策略</strong></p><p>对SEO来说，地域的差异化搜索似乎不是什么好事。</p><p>因为当你费尽心力做了一个高流量的词，很容易被百度的地区差异搜索给分流了流量。在今后的<a target="_blank" href="http://www.dugutianjiao.com/post/baidu-youhua.html">百度优化</a>中，你必须保证你的排名在前三，至少是前七位，这无疑给排名优化加深了难度。</p><p>不过，凡事有利必有弊。</p><p>当你做了一个本地化的网站之后，百度的这个差异搜索就将带给你巨大的甜头，给你导引过来的流量一部分绝对是很有价值的目标流量。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/site-area-different.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=153</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=153&amp;key=021a3fad</trackback:ping></item><item><title>SEO两百个秘密：网站主题的集中与搜索引擎排名</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/site-topic-seo.html</link><pubDate>Tue, 02 Jun 2009 18:36:49 +0800</pubDate><guid>http://www.dugutianjiao.com/post/site-topic-seo.html</guid><description><![CDATA[<p>　　很多<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>致力于创造&ldquo;内容&rdquo;，但如何处理这些&ldquo;内容&rdquo;之间的关系则不甚明了，造成搜索引擎排名无法持续提高。今天SEO研究院便带大家理顺一下&ldquo;内容&rdquo;与&ldquo;主题&rdquo;之间的关系。</p><p>　　<strong>一、什么是网站主题？</strong></p><p>　　网站主题，就是一个网站主要讨论的话题，也就是网站内容所聚焦的点之所在。搜索引擎在计算一个网页主题的时候，是通过页面内容中的文本信息计算出你的网页在谈论什么，这个&ldquo;什么&rdquo;即网站的主题，也就是说当我们在搜索引擎当中输入什么关键词到达这个页面，这个关键词就是该页面的主题。&nbsp;举个例子，比如这个页面<a href="http://www.dugutianjiao.com/post/baidupaimingdianjiqi.html">http://www.dugutianjiao.com/post/baidupaimingdianjiqi.html</a>，通过搜索&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/baidupaimingdianjiqi.html">百度排名点击器</a>&rdquo;能够到达，我们则认为这个页面的主题是&ldquo;百度排名点击器&rdquo;，同时也说明这个页面所谈论的主题比较集中，没有偏离。</p><p>　　<strong>二、网站主题集中的重要性</strong></p><p>　　有些站长寄希望于自己能够建立类似于新浪搜狐网易或阿里巴巴淘宝之类的门户站，这是很不现实的，具体我们不进行讨论。从用户的角度出发，我们线下买东西的时候，更信赖专卖店，同样的，当我们阅读文章的时候，我们更喜欢阅读那些观点明晰，主题鲜明，最好只针对一个主题深入进行剖析而非泛泛而谈。由此可见，一个网站也需要有个相对集中的主题，否则，就无法成为搜索引擎眼中好网站。</p><p>　　为什么主题非常重要？因为搜索引擎根据相关性来决定网站的质量，并根据相关性来返回用户搜索结果。搜索引擎断然不希望在你搜索&ldquo;鲜花&rdquo;的时候，显示出&ldquo;拖拉机&rdquo;的页面给你。</p><p>　　那么搜索引擎如何判断你的网站是关于&ldquo;鲜花&rdquo;的内容，而非&ldquo;拖拉机&rdquo;呢？最简单的就是你&ldquo;主题集中&rdquo;，网站的内容全部都是谈论&ldquo;鲜花&rdquo;，只字不提&ldquo;拖拉机&rdquo;，那么在没有外部优化的情况下，比如外部锚文本为&ldquo;拖拉机&rdquo;的强力导向（类似于Google炸弹），搜索引擎定然将你的网站归类为&ldquo;鲜花&rdquo;相关。而相关性强的网站，将被搜索引擎优先展示给搜索者，这将体现在搜索引擎的高排名上。</p><p>　　当然，要一个网站完全聚焦在一个主题上，有些不大可能，比如SEO研究院谈论的是搜索引擎优化的技术，但是也有极少数几篇讲到了个人的私事，跟SEO似乎并不完全相关了。大网站要专注一个主题更是难上加难。所以我们说网站主题要相对集中，当然这个相对值越高越好，独孤天骄认为最好要超过50%以上。比如，跟数百篇SEO文章相比，区区数篇不相关的个人感想并不会分散网站的主题，使之偏离。SEO研究院起码95%以上的文章是跟SEO相关的，搜索引擎自然而然会认为这是一个谈论SEO的博客。当一个网站的内容相对<u>集中</u>在一个主题的时候，搜索引擎会认为，既然该网站如此重视这个主题，那么其所讨论的内容应该是有一定价值的。如果外部链接足够强大，搜索引擎认为外部网站也认可这个网站的主题，那么自然而然就会赋予这个网站高排名。</p><p>　　当我们只围绕一个主题关键词来做站的时候，虽然不容易做大，但是很容易将这个网站做强。搜索引擎会根据各个网页所使用的关键词、<a target="_blank" href="http://www.dugutianjiao.com/post/seo-internal-links.html">内部链接</a>和<a target="_blank" href="http://www.dugutianjiao.com/post/seo-backlinks-secret.html">反向链接</a>所指向的关键词这些因素来判断网站的相关性是否足够强。当你围绕一个关键词进行内容创作的时候，就很容易提高相关性。比如SEO研究院，几乎每一篇文章都围绕&ldquo;SEO&rdquo;这个关键词在进行写作，长期下去，在这个关键词上必将获得较好的排名。而如果一个网站有数十数百，甚至成千上万个关键词，那么很难会有统一的相关性，搜索引擎也将漫无边际，摸不着头脑，更不可能赋予其高排名。</p><p>&nbsp;　　不过，网站主题的相对集中也并非限定每个网站只能谈论一个关键词，我的意思是必须围绕一个最主要的核心关键词进行主题的集中。我们仍然以上面的&ldquo;鲜花&rdquo;为例，你其实可以谈论的东西很多，可以谈论梅花，也可以谈论菊花，谈论牡丹、月季、兰花，甚至打破碗碗花也成。搜索引擎知道这些都是&ldquo;鲜花&rdquo;。虽然各种花的名称、特性不尽一样，但是主题都属于&ldquo;鲜花&rdquo;。你的网站谈论的是各种各样的花，那么搜索引擎自然不会在你搜索&ldquo;鲜花&rdquo;的时候，返回&ldquo;拖拉机&rdquo;给用户了。</p><p>　　<strong>三、如何选择网站主题内容？</strong></p><p>　　保持主题的一致性和针对性才能使搜索引擎优化发挥最大作用，越&ldquo;简单&rdquo;的网站越容易获得成功。这似乎也可以用来解释为什么&ldquo;单页面&rdquo;优化能获取高排名的原因之所在。那么，我们应该怎样选择网站的主题呢？</p><p>　　首先，选择主题网站内容要单一。</p><p>　　&ldquo;大而全&rdquo;的网站是很难取得成功的，精准的专业网站更容易获得访问者和搜索引擎的青睐。</p><p>　　网站主题具有强烈的针对性，针对访问者就限定得更专业、更精准；从用户心理来看，他们也会觉得网站主题越集中，网站长在该主题下所提供的内容就会越丰富越专业。跟什么都会的博学家相比，&ldquo;专家&rdquo;总是更值得信赖一些。搜索引擎也同样相信这一点，主题的单一性更容易让搜索引擎明白网站的类别。</p><p>　　大家可以思考，你在学习SEO的时候，会到新浪网去吗？SEO研究院的相关文章或许比新浪这样的门户站在谈论SEO时，都会来得更专业点。在搜索SEO的相关关键词时，SEO研究院就更有可能比新浪获得高排名。</p><p>　　其次，多主题的网站应该合理组织。</p><p>　　如果网站内容覆盖范围很广，而且确实又需要保留众多的主题应该怎么办？其实主题集中的原则仍然适用。只要我们将网站信息分门别类进行合理的组织，自然就会形成一个个相对集中的主题，同样有可能在搜索引擎上面获得高排名。</p><p>　　最后，谈谈独孤天骄在选择网站主题时的一些技巧。</p><p>　　我们的目标是获得高排名，所以选择一个网站主题的时候一定要想下该主题的可行性，首先你能创造的内容是否足够丰富、专业，其次这些内容你是否有能力排名到搜索引擎前面。因此一些门户网站已经做多做烂的坚决不做；有搜索引擎自家产品包括在搜索引擎上投放有推广竞价过多的也不做；排在首页上的网站拥有大量资源、经过高度优化的也不做。希望对大家在选择网站主题的时候有所帮助。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/site-topic-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=150</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=150&amp;key=ca0a0d43</trackback:ping></item><item><title>SEO两百个秘密：浏览器兼容验证对SEO的影响</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/w3c-seo.html</link><pubDate>Sun, 31 May 2009 16:12:10 +0800</pubDate><guid>http://www.dugutianjiao.com/post/w3c-seo.html</guid><description><![CDATA[<p><a target="_blank" href="http://www.dugutianjiao.com">SEO</a>和搜索引擎的最终目的其实是一致的，都是要面向终极客户。因此网站在设计的时候，基于SEO的目的，就必须考虑到页面在不同浏览器之间的兼容性，确保在IE、Netscape、Firefox和Opera等主流浏览器中有同样的显示。一个网站，如果对用户有着比较好的体验度，在<a target="_blank" href="http://www.dugutianjiao.com">搜索引擎排名</a>上同样会比较有竞争力。</p><p><strong>一、SEO需要考虑浏览器的兼容性</strong></p><p>网站设计考虑了各个浏览器之间的兼容性，其实就就是考虑了搜索引擎之间的兼容性。这句话看起来难理解，但事实上很简单，当你的网站在任何浏览器上都是同样的显示的时候，那么任何一家搜索引擎看你也会是同样的显示，它将有助于你的网站在不同的搜索引擎之间保持高排名，而非独占一家。也就是说，针对多家搜索引擎的优化，更加需要考虑到兼容性的问题。</p><p><strong>二、W3C 浏览器兼容验证对SEO有哪些影响</strong></p><p>虽然许多网站没有遵循W3C标准也同样获得高排名，但是经过验证之后，能保证访客访问你的网站在不同的浏览器都与你设计出来的完全一致。</p><p>遵守W3C协议的好处有很多，独孤天骄不是网页设计师，不一一进行说明，仅仅从SEO角度来阐述。</p><p><u>从实战上分析，对于Yahoo而言，有些业内人士认为，代码符合标准，SEO就成功了一半。Google也较为重视代码的标准性。当然，并非所有的搜索引擎都是这样，比如百度对代码标准性所占的权重赋予的并不是很高，但是代码标准化的页面对百度优化同样也会逐渐具备优势的，这是趋势所向。</u></p><p><strong>三、如何验证SEO的兼容性</strong></p><p>网页是由HTML或XML语言写成的，HTML的标准由<a target="_blank" href="http://www.w3c.org">World Wide Web Consortium</a>制定。因此，我们在编写页面代码的时候，就必须遵循W3C标准，尽量使用DIV+CSS架构，这样才能在不同的浏览器之间达到几乎完全一致的效果。</p><p>页面代码的最首端可以加入一行来告诉你的访问者、浏览器、验证机制和搜索引擎的蜘蛛机器人你是遵循W3C标准的：&lt;!DOCTYPE html PUBLIC &quot;-//W3C//DTD XHTML 1.0 Transitional//EN&quot; &quot;http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd&quot;&gt;</p><p>验证的方法是到<a href="http://validator.w3.org/"><strong>http://validator.w3.org</strong></a>，输入网址，一些不匹配的错误就将得到反馈。对网站设计者来说要达到浏览器之间的兼容性最好的方法就是将自己的网页在大多数主要的浏览器内容进行测试。</p><p>验证同时也是保证搜索引擎不会因为网页中的语法错误导致不能理解网页内容，或者无法理解网页中之重要内容所在。</p><p><strong>四、SEO必用的测试工具</strong></p><p>没有站长可以保证自己的网页代码完全正确没有任何错误，特别是是否符合W3C标准，因此做SEO，我们必须拥有一整套的工具，包括网页代码测试工具、网页设计的兼容性测试等，通过这些测试工具来检查网站代码是否正确。不过独孤天骄毕竟不是专业的网页设计人员，以下工具并未常用，内容主要来源于网络数据，部分未经验证效果，大家可以选择尝试。</p><p>网站代码测试工具：</p><p>1 . <a href="http://www.htmlhelp.com/tools/validator/">WDG HTML Validator</a> 一个能找出网站语法错误的地方并标注出来，也可选择对网站上单独的每一页进行单页分析。（ 强烈推荐 ）</p><p>2 . <a href="http://validator.w3.org/">W3C Markup Validation Service</a> 对 HTML 和 XHTML 都能进行代码测试，自称是互联网络上第一个（也是使用者最多的）的 HTML 验证工具。</p><p>除了对网页代码进行测试之外，我们同样还要重视网页设计的兼容性测试，减少访问者的浏览难度。</p><p>1&nbsp;. <a href="http://webxact.watchfire.com/">Watchfire WebXACT</a> 所有严谨的设计师和开发者都必须使用的工具，它会生成一个非常详尽的报告书，包括：网站质量，易用性和隐私等。（ 强烈推荐 ）</p><p>2. <a href="http://www.wave.webaim.org/wave/index.jsp">WAVE 3.0 Web Accessibility Tool</a> 高度可定制的工具，它采用了图形化模型展示网站兼容性问题（ WCAG 1.0 and section 508 ）。（ 强烈推荐 ）</p><p>在验证修改完之后，我们可以通过浏览器模拟工具来进行进一步的验证。通过下列工具，你可以了解你得网站在各种浏览器上的显示效果：</p><p>1&nbsp;. <a href="http://browsershots.org/">Browsershots</a> 能给出你的网站在不同浏览器下显示效果的截图，包括：Firefox 和 Internet Explorer （ Windows ）、Firefox 和 Safari （ Mac OS X ）、Iceweasal 和 Konqueror （ Linux ），但是结果要在 1 - 3 小时后才能出来。</p><p>2 . <a href="http://www.seo-browser.com/">SEO-Browser</a> 可以让你看到在搜索引擎眼里一样的网站。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/w3c-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=149</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=149&amp;key=a6f1ee7d</trackback:ping></item><item><title>SEO两百个秘密：strong标签的用法及SEO意义所在</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/how-to-use-strong.html</link><pubDate>Sat, 30 May 2009 23:54:38 +0800</pubDate><guid>http://www.dugutianjiao.com/post/how-to-use-strong.html</guid><description><![CDATA[<p>作为<a target="_blank" href="http://www.dugutianjiao.com">SEOer</a>，大家理应都知道&lt;h1&gt;&lt;h2&gt;&lt;h3&gt;标签和&lt;strong&gt;标签对于搜索引擎优化的重要性。独孤天骄在&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/how-to-use-heading.html ">SEO两百个秘密：如何正确使用Heading标签</a>&rdquo;这篇文章中，曾经讲述过heading 标签的使用，尤其针对H1、H2、H3进行了强调，说道&ldquo;多种渐变大小的heading一开始主要为网页的内容创建分层结构，便于用户直观地浏览网站。&rdquo;同样的，strong标签也是为了让内容条理清晰，重点突出，让搜索引擎更容易读明白页面内容的关键所在。但是内容页面上怎么布局&lt;strong&gt;标签标签，以及这个标签本身如何使用则是许多SEO新手经常问到的问题。</p><p><strong>一、什么是strong标签</strong></p><p>&lt;h1&gt;&lt;h2&gt;&lt;h3&gt;主要是控制页面的样式需要，间或被用在最重要标题和列表上面进行强调，而&lt;strong&gt;标签，在网页中是用来给关键词加粗的，我认为更多是为了强调内容本身，尤其是个别关键词的作用。</p><p><strong>二、strong标签有什么作用</strong></p><p>因为strong标签在页面中表示强调，从用户体验来说，人眼更容易注意到加粗加亮等视觉强调的区域，因此搜索引擎可能同样也会对强调的内容更感兴趣一些，事实上也正是如此！strong标签和heading标签在网页中的作用都是用来强调文章段落内容的，网站优化中合理的使用标签布局对提高网站排名有非常重要的作用。</p><p><strong>三、如何使用strong标签</strong></p><p>目前SEO届普遍将heading 标签作为丰富文字形式的手段，我给使用heading标签的建议是&ldquo;一般来说，一个页面，只允许有一个H1标签，H2标签适当可以提高到2个，H3标签可以提高到3个左右。过度地使用heading标签并没有任何好处。&rdquo;&lt;strong&gt;标签在数量上的控制则较为宽松，当然，主要还得以不影响用户体验为主，总不能将所有要优化的主关键词都进行强调吧？strong标签是强调关键词，但是如果使用太多，过犹不及，反而会&ldquo;冲淡&rdquo;关键词，甚至使搜索引擎判断为作弊。</p><p>SEO研究院目前网站首页标题和内容页标题使用h1标签，列表页的标题使用h2标签，导航栏目以及侧边栏标题等使用h3标签；strong标签主要用于内容页的小标题，偶尔被用来强调一两个需要特别强调的关键词。h1、h2、h3 和 strong 都对当前网页的内容起强调作用，作用由高到低：<strong>h1 &gt; h2 &gt; h3 &gt; strong。</strong>在本文的写作中，小标题部分则使用了&lt;strong&gt;标签，上一句话里面，我们特别用这个标签强调了次这四个关键词。</p><p>当然，这不是固定不变的，大家应该根据实际情况而定。</p><p>strong标签和Heading标签一样，同样不能过度使用，布局必须合理，过分地使用&lt;strong&gt;标签仍然会造成严重问题，我曾经举了自己的<a target="_blank" href="http://www.dugutianjiao.com">SEO博客</a>为例，该博客一度被<a target="_blank" href="http://www.dugutianjiao.com/post/baidu-noindex-seo.html">百度K掉首页</a>，并且造成了主关键词排名下滑。由于博客绝大部分都是原创文章，并且没做什么外部优化，因此我着力从本身内部优化的SEO痕迹入手，其中清除SEO痕迹的一项工作即是逐步清除H1标签，减少加粗标签使用次数等。经过操作之后，目前SEO研究院的首页已经成功恢复。具体大家可以查看：<a href="http://www.dugutianjiao.com/post/baidu-noindex-seo.html">http://www.dugutianjiao.com/post/baidu-noindex-seo.html</a> 。</p><p><strong>四、SEO用B标签还是Strong标签？</strong></p><p>B标签与Strong标签都是视觉效果加粗。但是B标签本身不具备HTML语义，Strong标签在HTML语义为强调，表示语气上的强调、加重。资料显示，当盲人使用屏幕阅读器上时能够明显能体现出B与Strong的不同。遇到B时与处理一般词语一样进行阅读，遇到Strong时会加重与停顿。从WEB标准上来说，不提倡使用B标签，不过Google的matt曾经说b标签更具有微小的优势，虽然后来修正为和strong标签优势一样。</p><p>因此，独孤天骄认为，搜索引擎以用户为主，当我们无法判断那个更具有优势的时候，不妨从用户的角度入手。从这一点出发，我想搜索引擎更有可能赋予strong标签较大的权重，大家完全可以做下SEO实验，做两个内容一样的页面，通过B标签和strong标签来对标题或者关键词进行强调，等待收录之后，在各大搜索引擎搜索这个关键词，看那个标签包裹的页面排名更具有优先级别。&nbsp;也确实有可能两个标签的权重完全一样。</p><p>甚至&lt;strong&gt;关键词a 关键词b 关键词c&lt;/strong&gt;和&lt;strong&gt;关键词a&lt;/strong&gt; &lt;strong&gt;关键词b&lt;/strong&gt; &lt;strong&gt;关键词c&lt;/strong&gt;的效果是否一样，有兴趣的朋友也可以通过SEO实验来论证！</p><p><strong>五、使用strong标签需要注意什么？</strong></p><p>要尤其注意一点，这个&lt;strong&gt;标签不能放在css里面调用，而应该直接体现在页面代码上面，否则对<a target="_blank" href="http://www.dugutianjiao.com">搜索引擎排名</a>是没有帮助的。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/how-to-use-strong.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=148</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=148&amp;key=bb3b07ac</trackback:ping></item><item><title>SEO两百个秘密：站点规模与搜索引擎排名</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/site-size-seo.html</link><pubDate>Thu, 28 May 2009 13:00:33 +0800</pubDate><guid>http://www.dugutianjiao.com/post/site-size-seo.html</guid><description><![CDATA[<p><a target="_blank" href="http://www.dugutianjiao.com">搜索引擎排名</a>里有一部分内容是跟网站因素相关的，其中网站的信任度直接影响着SEO排名。</p><p>网站信任度其实有两方面的内容，一方面是指浏览者对于站点的信任程度；另一方面是指搜索引擎对于网站的信任值，也就是我们以前论述过的TrustRank。</p><p>那么，搜索引擎对于网站的信任度都包括什么内容呢？独孤天骄认为，这个范畴非常大，网站的年龄、域名的类型、原创的程度、更新的频率、页面存在时间与网站成立时间比，许多因素共同构成了搜索引擎的信任度。其中，有一种因素可能很多<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>会忽视，那就是网站的规模大小也影响着搜索引擎信任度。</p><p>简单的说，网站的规模越大越好！</p><p>这里也有需要注意的，网站的规模越大越好，指的仍然是正规网站的规模大小，而非采集转载为主的垃圾站。单纯采集为主的垃圾站，即使站点页面达到数十万数百万，也许还比不过一个经过SEO的单页面网站的排名和流量，这个趋势目前已经越来越明显。</p><p>这个有什么凭据呢？很简单，不知道大家有没有原创的文章被转载的经历？我自己写作的一些原创文章，经常在刚发布不久，就有大站点的编辑潜伏给转载过去，结果在百度搜索中，第一名便显示的是他们网站的文章，而SEO研究院的排名只能第二甚至更低。甚至我做过实验，发布完文章并在被百度已经收录的前提下，转载到大型站点上。结果在搜索中，我的原创文章也仅能屈居第二甚至更低，这就是大站点和小站点的区别。</p><p>搜索引擎尤其是百度更加信任大站点，它对原创的判定有一个因素我想就是判断站点的规模大小，从而&ldquo;思索&rdquo;大规模的站点更有可能具备&ldquo;原创能力&rdquo;，从而成为这篇文章的原创者。</p><p>大家不妨在百度搜索下&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/seo-secret.html">SEO两百个秘密</a>&rdquo;、&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/seo-case.html">SEO七十二案例</a>&rdquo;、&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/seo-plot.html">SEO三十六计</a>&rdquo;。这三个系列的所有文章都是由独孤天骄所写作的，但是这三个系列的题目包括其中的308篇文章，在各大搜索引擎的排名都各不相同。从下图我们可以初步判定，百度对原创的识别能力输于Google和Yahoo两大搜索引擎：</p><p><img alt="站点规模大小" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/5/zhandianguimo.jpg" /></p><p>在<a target="_blank" href="http://www.dugutianjiao.com/post/baidu-youhua.html">百度优化</a>的时候，尤其要注意到这一点。&nbsp;</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/site-size-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=147</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=147&amp;key=2d4ac1ea</trackback:ping></item><item><title>SEO两百个秘密：站点收录率</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/site-indexed-rate.html</link><pubDate>Wed, 27 May 2009 12:30:05 +0800</pubDate><guid>http://www.dugutianjiao.com/post/site-indexed-rate.html</guid><description><![CDATA[<p>首先明确下什么是站点收录率这个概念，<strong>站点收录率</strong>是指网站被搜索引擎收录的总页面数占据整个网站所有页面的百分比率，它等于网站被收录的网页总数量/网站整站页面数量。举个例子，比如通过site命令查找到你的网站被百度收录了180页，而你的整个站点一共有200个有效页面，那么你的站点收录率（百度）就是90%，不过大多数网站的收录率远远低于这个比例。</p><p>对<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>而言，网站收录率的提高，是网站获取搜索引擎流量的重要因素之一，一个网页如果没有被收录，就谈不上排名，更不可能从搜索引擎导入任何流量。因此，作为SEOer，我们仍然需要关注如何提高网站收录率的问题。</p><p><strong>一、如何测定站点收录率</strong></p><p><strong>1、测定站点网页总数</strong></p><p>为了计算收录率，你必须知道整个网站一共存在多少个有效页面。这里的有效页面是指你准备呈现给搜索引擎索引的页面，被robots.txt禁止、孤岛页面、密码保护页面、特意隐蔽的页面等等都不在此例。</p><p>现在网站所使用的CMS系统一般都自带有这个统计功能，如果你本身就是站长，很容易获取这个数据。</p><p><strong>2、检查网页被搜索引擎收录数量</strong></p><p>检查多少页面被搜索引擎收录，主要通过site命令来进行查询。要查被百度收录多少页面，便可在百度搜索框中输入&ldquo;site:yoursite.com&rdquo;，记住，不要带http://。例如，准备在百度上查找SEO研究院被收录的页面总数，可以输入：site:www.dugutianjiao.com，其他搜索引擎类似。</p><p>然后我们将这两个数量相除，乘以100%，即可得出站点被收录率。</p><p><strong>二、理想的收录率是多少</strong></p><p>一般来说，只要你全站的内容被收录达到50%左右，你的站点收录率就是良好的，无须担心，超过70%以上独孤天骄觉得可以算是较为优秀的了。当然，如果所有的页面都被收录，那绝对是值得恭喜的一件事情。</p><p>有时候，一个网站的<strong>收录率</strong>超过100%。这倒不值得庆贺了，因为这种情况有可能是因为你的站点存在许多重复页面；另外也有可能是搜索引擎的&ldquo;虚假&rdquo;收录数量。</p><p>搜索引擎收录的数量一般都是含有水分的。百度近期在site命令之下，多了一个&ldquo;提示：找到的相关网页数是估算值，不代表真实结果数，仅供参考。&rdquo;</p><p><img alt="百度收录率提示" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/5/baidu-site.jpg" /></p><p>确实也是如此，我们以SEO研究院被收录的数量作为例子，通过site：<a href="http://www.dugutianjiao.com/">www.dugutianjiao.com</a>命令，我们查询到该站一共被搜索引擎收录173篇（2009年5月27日数据）：</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/5/baidu-site-173.jpg" /></p><p>但是当我们点到最后一页，我们会看到&ldquo;提示：为了提供最相关的结果，我们省略了一些内容相似的条目，<a href="http://www.baidu.com/s?lm=0&amp;si=&amp;rn=10&amp;ie=gb2312&amp;ct=0&amp;wd=site%3Awww%2Edugutianjiao%2Ecom&amp;cl=0">点击这里</a>可以看到所有搜索结果。&rdquo;点击进入，SEO研究院被百度收录的真实数量应该是160篇：</p><p><img alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/5/baidu-site-160.jpg" /></p><p>因此，在计算站点收录率的时候，对搜素引擎索引的页面数量应该缩减水分后再相除得出结果。</p><p><strong>三、如何提高网站收录率</strong></p><p>怎样能使更多的网页被收录呢？我们首先明确下影响收录率提高的几个不利因素，以下列举的是较为常见的三大因素，并非全部因素：</p><p>首先，大量重复的采集转载内容、涉及违法信息内容等都是搜索引擎所厌烦的。</p><p>其次，站点结构不利于蜘蛛正常爬行读取，比如过多的框架、调用等，乃至全站的Flash化之类的毛病都有很大的可能导致搜索引擎少收录甚至不收录站点页面。</p><p>最后，网站或所在服务器不稳定乃至正遭受惩罚，搜索引擎自然就不会收录你站点页面了。</p><p>针对这几个不利因素，我们对症下药，提高网站收录率就应该：</p><p>首先，网站内容的原创性和持续更新性，直接影响了搜索引擎的页面收录数量。</p><p>其次，合理的网站内部结构、导航结构、链接通畅，甚至是服务器稳定等，都能提高搜索引擎蜘蛛的爬行效率，进而提升收录率。</p><p>最后，网站的权威度高会吸引搜索引擎蜘蛛的高效关注，提升收录率，收录率的提升又进一步作用于网站的权威度，从而形成良性循环。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/site-indexed-rate.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=145</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=145&amp;key=a892c073</trackback:ping></item><item><title>SEO两百个秘密：页面代码体积大小与SEO的关系</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/page-size-seo.html</link><pubDate>Mon, 25 May 2009 13:51:51 +0800</pubDate><guid>http://www.dugutianjiao.com/post/page-size-seo.html</guid><description><![CDATA[<p>网页体积大小是一项常见的SEO指标，同样影响着SEO效果，只是并非特别明显，不过在进行SEO诊断分析中仍然要把这一点考虑在内。</p><p>简单的说，优化页面体积，可以提高网页的打开速度，从而提升用户的访问体验；同时对<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>来说，还可以提高蜘蛛的访问速度，有助于搜索引擎对网站的索引体验。我们知道，蜘蛛同样和用户不会用太多的时间去打开、抓取、索引如此大体积的页面，虽然随着网络带宽的增加，网页体积的大小将会越来越不重要。SEO也是与时俱进的，当网络带宽增加到不是按M来算，而是用G计的时候，网页体积的大小将根本不重要，自然也不会对SEO造成太大的影响了。但是在目前状况之下，我们还是要尽可能避免大体积的页面。</p><p>那么一个页面的代码体积应该控制在多大之内呢？</p><p>这个似乎没有定论。我以前的建议是35K左右，有些人甚至提出保持在15K之内，当然也有人提出控制在100K左右即可。其实，页面的代码体积应该控制在一个什么样的范围之内，主要要看搜索引擎能够索引多大体积的页面。</p><p>首先，我们先来澄清下这里的页面体积是一个什么样的概念。有些SEO新手可能会问，如果我的页面Html源代码有30K，其中页面上还有两张图片，分别为100K和80K，还有一个外部引用的CSS文件，有15K大小，该页面上还放着一个2M的音频文件，那么这个页面体积有多大？答案是这个页面是30K大。页面大小其实是指页面的源文件大小，是经过服务器解释而输出的HTML 文档，不包括未经过解释的PHP语言、ASP等语言，也不包括Flash、图片、音频、视频文件等，同样也不包括外部调用（如果直接写在页面源代码之内不在此范畴）的CSS、JS文件等。</p><p>其次，搜索引擎的蜘蛛究竟能索引和收录的页面体积有多大？以前较为公认的一个数据是搜索引擎只会搜索页面100K以内的内容。不过现在经过简单的SEO实验，证明目前百度至少能够读取并收录的网页大小不低于125K，Google则更高一点，能达到650K左右。</p><p>我们选择中国最为冗长的新浪网新闻频道页面作为说明：</p><p>&nbsp;<img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/5/sina-wangyetijidaxiao-google.jpg" /></p><p>&nbsp;<img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/5/sina-wangyetijidaxiao-baidu.jpg" /></p><p>这两个图中，Google搜索引擎对新浪网新闻频道主页的索引体积达到了597K，而百度仅仅索引了125K，超过这个大小的代码百度可能做了截断处理，因此是否会收录和索引就值得怀疑了，也就是说，新闻频道最下部的链接对百度SEO来说，是否真正有效值得怀疑。有兴趣的同学可以做一个超过125K的页面，放一个全新的孤岛页面链接，看百度是否会收录。</p><p>因此，鉴于搜索引擎的索引效果，以及用户的访问体验，独孤天骄仍然维持尽可能控制一个页面大小在35K左右的建议！</p><p>同时，在目前阶段，尤其是针对<a target="_blank" href="http://www.dugutianjiao.com/post/baidu-youhua.html">百度优化</a>，我们还是应该尽可能减少冗余代码，减轻Spider的爬行负担。</p><p>具体减小网页体积主要从两方面入手：减少网页源代码体积和网页其他元素的整体体积。</p><p>首先，减小网页html体积。比如将网站改成DIV+CSS结构，减少冗余html代码（如页面中的font、bgcolor之类的格式化控制代码，尤其推荐使用网页编辑超级工具箱清除word夹带的格式代码），加速页面显示，缩小页面体积；采用table布局则注意和css有机结合，减少嵌套表格的使用以减小网页html体积。同时分离css和js到外部调用文件，Html代码尽可能只用来显示文字内容，对于特别长的文章，注意合理的分段和分页。</p><p>其次，缩减网页其他元素体积。优化了网页源文件的大小之后，还应该考虑对网页的整体体积进行减负，即对页面所包括的图片，视频，音频，外部CSS文件、JS，Flash动画等文件进行优化。这一点我们就不展开了。</p><p>&nbsp;不过，尤其要注意一点，SEO不要太在乎技术上的细节，而忽视了内容本身，毕竟内容才是真正第一位，是真正意义上的SEO。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/page-size-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=143</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=143&amp;key=6996fe53</trackback:ping></item><item><title>SEO两百个秘密：隐藏文本与链接</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/hidden-text-link.html</link><pubDate>Mon, 18 May 2009 21:01:12 +0800</pubDate><guid>http://www.dugutianjiao.com/post/hidden-text-link.html</guid><description><![CDATA[<p>隐藏文本和链接是早期<a target="_blank" href="http://www.dugutianjiao.com/post/blackhat-seo.html">黑帽SEO</a>应用得比较普遍的手法。在搜索引擎发展的初期，这种方法非常具有实效性，曾经取得相当不错的效果，因此一度被SEO滥用。但时过境迁，隐藏文本和隐藏链接是否仍然一如往昔具有&ldquo;杀伤力&rdquo;呢？许多SEO看过很多资料，都了解到搜索引擎目前对这种作弊手法已经具有免疫力，觉得隐藏文本和链接毫无用处。其实善加利用的话，尤其是对<a target="_blank" href="http://www.dugutianjiao.com/post/baidu-youhua.html">百度SEO</a>，一样具有巨大的作用。本文并不公布具体的、目前尚有效果的操作手法，部分公布的SEO作弊手法，也主要是基于技术研究和分析之用，绝非鼓励作弊，请勿用于指导实战！</p><p><strong>一、隐藏文本和链接的定义及表现：</strong></p><p>Google网站管理员支持中心的质量指南，对于隐藏文字和隐藏链接做了详细的<a href="http://www.google.com/support/webmasters/bin/answer.py?answer=66353">解释</a>。简单的说，隐藏文本和链接是指采用隐藏的手段在网页上放置许多文本和链接，通过对文本内容进行一些处理，使得一些文本内容或链接让网站浏览者看不到而搜索引擎却能检索到。</p><p>隐藏链接和隐藏链接都是为了能让Googlebot 可抓取到，但人眼无法识别，浏览者看不到隐藏文本和链接，而搜索引擎可以爬取到，从而欺骗搜索引擎对网页关键词的判断，以及提升网页的链接权重，最终改善搜索引擎排名。</p><p>这些手段包括：</p><ul>    <li>将需要隐藏的文字或链接的颜色与背景色设为一致，比如说都设为白色；</li>    <li>将文本堆积在图片后；</li>    <li>使用 CSS 隐藏文本，如：字体大小设置为0；</li>    <li>通过 CSS 隐藏链接，CSS 已用来制作只有一个像素高的小链接；</li>    <li>把链接隐藏在某个不起眼的小字符里，如：逗号、段落中间的一个连字符等。</li></ul><p>目前较为有效的，主要是通过CSS标签来控制隐藏文本和链接。其实隐藏不隐藏，搜索引擎都会抓取得到，既然是黑帽，因为不需要去考虑用户体验，自己控制的站点就犯不着隐藏。目前SEO业界的隐藏链接和文本主要都是做在别人网站之上了，我在《<a target="_blank" href="http://www.dugutianjiao.com/post/black-seo-hidden-link.html">SEO，请不要拿客户的网站来开玩笑</a>》列举过相关的SEO作弊手法。从这个角度来看，隐藏文本现在已经很少用了，因为在对方站点做隐藏文本除非是为了报复清除对方的搜索结果，在自己的网站做隐藏文本，有点常识的SEO一般都不会轻易尝试。而隐藏链接则仍然是一种常态，黑帽SEO或者说是黑客SEO往往是入侵一些疏于管理的网站，而投放进去的链接。为了防止被人发现，自然需要隐藏。这是隐藏链接和以前的隐藏手法的本质区别。</p><p><strong>二、隐藏链接和隐藏文本的具体方法：</strong></p><p>黑帽SEO主要是通过CSS标签控制隐藏文本和链接，最常见有CSS的display:none&nbsp;、visibility: hidden&nbsp;和overflow:hidden三种设置。就目前的搜索引擎规则而言，隐藏文本是不被认可的，但是并非说只要采用这些手法就一定会受到惩罚。事实上，目前许多大型网站都采用了如display:none标签进行一些特殊效果处理，搜索引擎并未对这些行为进行惩罚。当然，小型站点的权重无法与之相提并论，如果是简单的隐藏行为基本上都会被判成SEO作弊，受到惩罚的概率是很高的，不过通过CSS标签进行隐藏控制则没有这么严厉。确切的说，尤其是百度的SEO，很大程度上还管用！</p><p>方法一：CSS的display:none设置。通过display:none的设置把后面&ldquo;SEO研究院是独孤天骄的原创SEO博客。&rdquo;的这段文字给隐藏掉了，前面没有定义过的div则正常显示。这个代码不仅可以控制隐藏文本，其实也可以控制隐藏链接，在黑帽SEO中最为经常见到。</p><p>如：&lt;style type=&quot;text/css&quot;&gt;<br />#n{display:none;}<br />&lt;/style&gt;<br />&lt;/head&gt;<br />&lt;body&gt;<br />&lt;div&gt;&lt;a href=&quot;http://www.dugutianjiao.com&quot;&gt;SEO研究院&lt;/a&gt;&lt;/div&gt;<br />&lt;div id=&quot;n&quot;&gt;SEO研究院是独孤天骄的原创SEO博客。&lt;/div&gt;</p><p>方法二：visibility: hidden设置。将可见性设置为隐藏。</p><p>如： &lt;style type=&quot;text/css&quot;&gt;<br />#n{visibility: hidden;}<br />&lt;/style&gt;<br />&lt;/head&gt;<br />&lt;body&gt;<br />&lt;div&gt;&lt;a href=&quot;http://www.dugutianjiao.com&quot;&gt;SEO研究院&lt;/a&gt;&lt;/div&gt;<br />&nbsp;&lt;div id=&quot;n&quot;&gt;SEO研究院是独孤天骄的原创SEO博客。&lt;/div&gt;&nbsp;</p><p>方法三：overflow:hidden设置。overflow是检索或设置当对象的内容超过其指定高度及宽度时如何管理内容，这也是黑帽SEO较为常用的一种方式。</p><p>如：&lt;style type=&quot;text/css&quot;&gt;<br />#n{overflow:hidden;<br />width:0px;<br />height:0px;}<br />&lt;/style&gt;<br />&lt;/head&gt;<br />&lt;body&gt;<br />&lt;div&gt;&lt;a href=&quot;http://www.dugutianjiao.com&quot;&gt;SEO研究院&lt;/a&gt;&lt;/div&gt;<br />&nbsp;&lt;div id=&quot;n&quot;&gt;SEO研究院是独孤天骄的原创SEO博客。&lt;/div&gt;&nbsp;</p><p><strong>三、隐藏文本与隐藏链接的后遗症</strong></p><p>使用隐藏文字和隐藏链接，并不一定是作弊，关键要看添加这些东西的目的是什么，是否是为了欺骗搜索引擎来获得好的排名。如果只是为了改善用户体验，那么就没有问题。</p><p>搜索引擎尤其是Google判断网站是否作弊的关键在于你使用该技术的出发点，而不是技术的本身。</p><p>不过，随着搜索引擎的不断完善以及自身的不断改进，使用这几种<a target="_blank" href="http://www.dugutianjiao.com/">SEO</a>方法时，如果处理不当也会面临被处罚的危险。因此，独孤天骄认为，为了避免&ldquo;无谓&rdquo;的误杀，还是要谨慎对待隐藏文本和隐藏链接，因为面向搜索引擎和访问者提供的信息不一样，内容中的隐藏文字或链接可能导致网站被认为不可信赖，从而有可能导致站点被搜索引擎封掉。</p><p>不过如果你的网站已经放置了或者已经被放置了隐藏文本和隐藏链接，并且已经被搜索引擎认为包含具有故意欺骗性的隐藏文字和链接，站点就有可能会被Google从索引中删除。 这个时候，要马上删除网站的相关隐藏文字和链接。针对Google，可以在其网站管理员中心提交网站重新审核。过一段时间之后应该可以重新获得收录和排名。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/hidden-text-link.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=136</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=136&amp;key=25e26816</trackback:ping></item><item><title>SEO两百个秘密：页面静态化与SEO</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/static-page-seo.html</link><pubDate>Sun, 17 May 2009 19:52:24 +0800</pubDate><guid>http://www.dugutianjiao.com/post/static-page-seo.html</guid><description><![CDATA[<p>在影响网站<a target="_blank" href="http://www.dugutianjiao.com/post/seo-secret.html">搜索引擎排名的秘密</a>中，页面的静态化是<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>经常提到的一个话题。可以说，网页静态化应该算得上是一个很重要的秘密。</p><p>因此，现在很多SEO新手甚至&ldquo;SEO专家&rdquo;，对一个网站进行优化诊断，第一个步骤就是建议客户进行全站页面静态化。</p><p>其实并非所有的站点SEO都需要页面静态，HTML静态页面在以前是SEO的重要途径，并不代表永远都是。选择动态URL页面还是静态页面，需要根据网站的需要。许多SEOer提出页面静态化的建议主要基于技术能力所限，因为相对静态页面而言，动态页面的SEO更难操作。</p><p><strong>一、静态页面的前世今生</strong></p><p>早期由于搜索引擎Spider的不完善，在爬行动态网页时容易进入死循环，搜索引擎为避免这种结果就刻意减少了对动态URL特别是带多个&ldquo;？&rdquo;环境变量符号的URL的读取。不过随着搜索引擎的完善，这种现象目前已经基本得以解决，对于现在的搜索引擎而言，静态页面和动态页面并不是影响其收录的第一要素。</p><p>在技术上，静态页面的URL链接一般是以.html、htm、.shtml等为链接后缀。不过这点并不一定，确切的说，当访问者在任何时间内向一个固定URL链接发送请求，都返回同样的网页内容时候，可以认为这样的网页是静态页面（Static Page），所以.asp.php等文件一样也可以成为静态页面，只要这些静态页面是存在于服务器上的一个文件，每个网页都是一个独立的文件（动态页面的内容存在数据库中），客户端加载静态页面时，并没有操作数据库，只是直接提取一个文件的话。</p><p><strong>二、静态页面的排名优势</strong></p><p>简单的说，使用静态页面的HTML网页具有以下SEO优点：</p><p>1、静态网页和动态网页的区别在于动态网页可以给于浏览者权限，而搜索引擎抓取的时候是以游客身份进入的，所以不容易被抓取和收录，而静态网页由于不存在页面权限问题，所以更容易被收录。如果是生成了HTML，更容易被搜索引擎收录和排名靠前。对于搜索引擎而言，静态页面还是优于动态URL的，但优势的差距极小，仅仅是有时候动态页面的参数机制不利于搜索引擎收录，而静态页面更容易收录而已。</p><p>2、HTML网页不需调用数据库，对服务器的压力更小，运行速度更快，页面访问速度更快。所以同样也仅仅是更有利于搜索引擎的收录而已。可以这样说，一个网站一开始可能静态页面更容易收录一点，但是让网站积累了一定权重之后，不论是静态页面还是动态页面，搜索引擎都会一视同仁的去收录。不过独孤天骄也同时相信，从SEO的角度来看，搜索引擎对静态页面的抓取技术会更加成熟，对于小型网站来说，站点静态化是解决网站收录量的一个简便办法。</p><p>不过，对于大型网站来说，是否有必要去做全站静态化，就值得商榷了。大型网站如果全站静态化的话，成本太高，因此个人觉得这种生成静态页面不方便的站点，&ldquo;相对静态化&rdquo;就够了采用伪静态的方式来&ldquo;骗&rdquo;搜索引擎，同样可以达到SEO目的。</p><p><strong>三、伪静态的SEO优势</strong></p><p>伪静态就是动态网页通过重写URL的方法实现去掉动态网页的参数，但在实际的网页目录中并没有必要实现具体的文件，而是根据用户请求，从数据库中返回请求的结果。这个过程模拟成静态页面或目录，就是常见的动态URL的静态化&mdash;&mdash;&ldquo;伪静态&rdquo;。</p><p>1、伪静态最主要的作用就是方便搜索引擎蜘蛛对网页内容的抓取。对于有独立服务器的朋友来说，你就可以使用ISAPI_Rewrite的方式写伪静态规则。</p><p>2、伪静态还有一个非常重要的作用，就是方便了用户访问网站和传播网站。动态的网页不利于用户的口碑传播，在交换友情链接的时候也会遇到很多困难。所以，尤其是对于小型网站，独孤天骄的建议仍然是全站静化，不单纯是为了SEO。对于大型网站，则可以考虑动静态结合，比如访问量特别大的首页和栏目页等可以生成静态页面，其他的内容页面等完全可以实现动态化。</p><p>另外需要注意的一点是：网页不管是动态化还是静态化，抑或是伪静态，这些都只是<a target="_blank" href="http://www.dugutianjiao.com">搜索引擎优化</a>的细节问题，真正能获取搜索引擎青睐的是站点具有优质的原创内容，这是得到高排名的最关键所在。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/static-page-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=137</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=137&amp;key=d527f89c</trackback:ping></item><item><title>SEO两百个秘密：死链接及其对SEO的影响和处理</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/bad-links-seo.html</link><pubDate>Sun, 17 May 2009 00:03:19 +0800</pubDate><guid>http://www.dugutianjiao.com/post/bad-links-seo.html</guid><description><![CDATA[<p><strong>一、什么是死链接？</strong></p><p>在我们浏览网站的时候，一定都有遇到过&ldquo;无法找到网页&rdquo;的经历，即一个看似正常的网页链接，点击之后无法打开相应页面。&nbsp;这个链接我们就称之为死链接。</p><p>死链接是网站建设中的专业术语，简单地讲，死链接是指原来可以正常访问，后来因故失效的无效链接。从用户的角度来看，死链接和错误链接的表现是一样的，所以一般我们并不需要区别死链接和错误链接。</p><p>以下几种情况会出现死链接：</p><ul>    <li>动态链接在数据库不再支持的条件下，将会变成死链接。</li>    <li>某个文件或网页移动了位置，导致指向它的链接变成死链接。</li>    <li>网页内容更新并换成其他的链接，原来的链接变成死链接。</li>    <li>网站服务器设置错误。</li></ul><p><strong>二、死链接对SEO有什么影响？</strong></p><p>作为<a href="http://www.dugutianjiao.com/">SEO</a>人员，我们必须要竭力避免网站出现死链接！</p><p>应该肯定一点，死链接虽然不是影响你网站的排名的主要原因，但是同样会对<a target="_blank" href="http://www.dugutianjiao.com">网站优化</a>排名造成影响。</p><p>首先，一个网站如果存在大量的死链接，点击访问多次受阻的话，用户体验必然很差，必将大大损伤网站的整体形象，严重影响网站的权威性。</p><p>其次，搜索引擎蜘蛛通过链接爬行时如果遇见太多链接无法到达，收录页面数量会减少，进而就会影响到网站在搜索引擎中的权重。可以说，死链接是搜索引擎考核你网站是否合格的重要指标，死链接太多会直接降低搜索引擎对网站的权威性和友好性的判断，同时对网站排名造成伤害。</p><p><strong>三、SEO应该如何处理死链接？</strong></p><p>1，经常性检查网站是否存在死链接。为了树立良好的网站形象，避免出现无效链接，当我们完成一个网站的设计制作后，一定要认真地检查是否存在失效链接，以便及时修改。上传之后，我们还可以利用一些检查死链接的SEO工具进行复查。</p><p>2，遇到网站出现死链接，要第一时间删除死链接或者修复死链接，让网站结构更加顺畅。</p><p>3，建立404页面，引导死链接的点击。死链接发送请求时，服务器会返回404错误页面。404页面的目的即为了告诉浏览者其所请求的页面不存在或链接错误，同时引导用户使用网站其他页面而非关闭窗口离开。</p><p>建立404页面一定要注意符合SEO要求。很多网站存在一个问题，即可404页面返回的是200或302状态码而不是404状态码，这是很致命的。搜索引擎通过HTTP状态码来识别网页的状态。当搜索引擎获得了一个错误链接时，网站应该返回404状态码，告诉搜索引擎放弃对该链接的索引。而如果返回200或302状态码，搜索引擎就会为该链接建立索引，这导致大量不同的链接指向了相同的网页内容。结果是，搜索引擎对该网站的信任度大幅降低。因此，建立完404页面之后，一定要用SEO工具检查一下，返回的状态码是否正确。同时还要注意不要将404错误直接转向到网站首页，这有可能导致首页不被收录。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/bad-links-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=138</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=138&amp;key=e189bf7c</trackback:ping></item><item><title>SEO两百个秘密：首选域的设置</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/preferred-domain.html</link><pubDate>Sat, 16 May 2009 15:45:59 +0800</pubDate><guid>http://www.dugutianjiao.com/post/preferred-domain.html</guid><description><![CDATA[<p>大部分站点其实都可以通过两个网址访问，一个是带www的，比如http://www.dugutianjiao.com/；另一个是不带www的，比如http://dugutianjiao.com/。这个对用户来说没有任何影响，但是容易让搜索引擎犯晕。</p><p>首先，搜索引擎会将两个url当作不同的内容页面来处理，这样就会产生重复页面，进而影响排名。</p><p>其次，网址不规范化不利于链接价值的归一。道理很简单，当有100个<a target="_blank" href="http://www.dugutianjiao.com/post/seo-backlinks-secret.html">外部链接</a>是指向http://www.dugutianjiao.com/，另外100个外部链接则指向http://dugutianjiao.com/，和200个外部链接都同时指向唯一的一个地址比如http://www.dugutianjiao.com/，分别的指向降低了链接的价值，搜索引擎给该域名的链接权重是不一样的。从<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>的角度来看，必须选择并永远坚持一个域名格式，否则Google将会把PageRank分散给两个网址。正确设置首选域名，可以让网站的PR值更集中和准确。而从用户的角度来看，他们也更习惯带有WWW的网址。</p><p>因此，做SEO优化的时候，应该从一开始就设置首选域，并做好相关规范，避免将来的麻烦。</p><p><strong>一、什么是首选域？</strong></p><p>Google在其站长中心里面有篇文章<a target="_blank" href="http://www.google.cn/support/webmasters/bin/answer.py?answer=44231">对首选域（Preferred domain）做了定义</a>：</p><p>首选域（www 或非www）是您希望Google 用来将您的网页编入索引的域（有时也指规范域）。指向您网站的链接也许会使用www 和非www 两种网址（例如http://www.example.com 和http://example.com）。首选域是您希望您的网站在搜索结果中所显示的格式。在您告知我们您网站的首选域名后，我们会在以后抓取您的网站和刷新索引时使用此信息。例如，如果您指定的首选域为 http://www.example.com，而我们发现指向您网站的链接格式为 http://example.com，那么，我们会追踪 http://www.example.com 链接。此外，我们会在显示网址时充分考虑您的使用偏好。如果您未指定首选域，我们会将 www 和非 www 格式的域名视为对不同网页的不同引用。</p><p><strong>二、怎么设置首选域？</strong></p><p>设置首选域的步骤操作如下：</p><p>1，很简单的方法，登陆Goole网站管理员工具，进入控制台，选择要设置的网站，再选择左边的&ldquo;设置&rdquo;，建议选择第二个选项&ldquo;将网址显示为 http://www.yoursite.com &rdquo;，保存即可。</p><p>&nbsp;<img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/5/Preferred-domain.jpg" /></p><p>这是通过Goole网站管理员工具设置首选域，不过仅适合Google，对其他搜索引擎，在你设置首选域名之后，还必须采用301重定向对来自您非首选域的访问进行重定向，这样，其他搜索引擎和访问者就能了解您首选域的格式了。</p><p>维护一个首选的域名格式，确保链接的一致性，PHP系统可以通过添加 .htaccess 文件到你的根目录，确保所有访问都指向你使用的首选域名。</p><p>2，通过301重定向的方法来设置首选域：</p><p>使访问dugutianjiao.com/的时候自动转到 www.dugutianjiao.com。在.htaccess文件里写上以下代码：</p><p>RewriteEngine on<br />RewriteCond %{http_host} ^mydomain.com [NC]<br />RewriteRule ^(.*)$ http://www.mydomain.com/$1 [L,R=301]</p><p>该方法可以让所有搜索引擎和用户都采用首选域。</p><p>其实不做任何设置的话，只要平常注意网址的规范，同样可以达到效果。</p><p>比如SEO研究院就没有做任何设置，不过在平常博客之内的所有链接，包括做<a target="_blank" href="http://www.dugutianjiao.com/post/seo-internal-links.html">站内链接</a>或文章内部的引用链接，以及和别人交换链接等，都采用带WWW的唯一地址。长期下来，搜索引擎也会认为SEO研究院的首选域就是带有www的。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/preferred-domain.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=135</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=135&amp;key=4d8283ba</trackback:ping></item><item><title>SEO两百个秘密：符合规范的SEO文案写作</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-copywriting.html</link><pubDate>Thu, 14 May 2009 14:23:28 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-copywriting.html</guid><description><![CDATA[<p>说来SEO研究院的读者可能不大相信，我大学主修的专业是中文，甚至可以说是中文系所谓的&ldquo;高材生&rdquo;，毕业之后也一直以中文为业，SEO并非独孤天骄赖以生存的职业。</p><p>接触搜索引擎优化的相关知识之后，发现符合规范的<a target="_blank" href="http://www.dugutianjiao.com/post/seo-copywriting.html ">SEO文案写作</a>和大学中文系教授所讲述的那套写作理论是有很大区别的，SEO的文案写作往往以降低原创作品的艺术水准为代价，在进行网页文案写作的时候，通常应该考虑到搜索引擎优化的效果，而不是其艺术性本身，这是很多网站编辑所耿耿于怀，甚至无法原谅的。</p><p><strong>一、SEO文案写作对搜索引擎优化的重要性</strong></p><p>到底什么是搜索引擎优化写作？简单的说，SEO文案写作指的是利用和部署搜索关键词，并且以主关键词为基础而创作的网页文字内容，它包括标题和具体的描述内容。其目的是期望文案发布之后，搜索引擎通过关键词能搜索到该篇SEO过的文章。</p><p>那为什么文字内容创作要符合SEO规范呢？</p><p>首先，我们知道，SEO最原始的目的就是将网页的排名提升至搜索引擎的搜索结果首页，最好是前三。这一点即使你一厢情愿地认为SEO是一门艺术也无法否认，而网页排名的提升一个很关键的支撑点就是内容质量的提升，也就是所谓的&ldquo;内容为王&rdquo;！到底什么样的&ldquo;内容&rdquo;才能&ldquo;为王&rdquo;？应该说，只有符合SEO规范的文字内容才能获取好的排名。</p><p>其次，针对网站进行SEO优化之前，内容是非常关键的。网站有大量的内容，就需要部署大量的关键词，才有可能让搜索引擎了解网站的主题。因此，内容规划的过程其实就是考虑如何进行关键词分析和部署的过程，这个时候针对关键词，符合SEO规范的文案写作就显得尤为重要！</p><p>那么，应该如何具体创作符合规范的SEO文案呢？</p><p><strong>二、文案写作人员在SEO写作时需要注意什么</strong></p><p><span id="1242267934645S" style="display: none">文案写作时首先要考虑到SEO效果，做好关键词的选择。因此，必须先想好自己所写作的内容面向的用户是谁？写的内容围绕什么关键词而作？用户通过搜索引擎查找相关内容的时候会搜索这个关键词吗？ 当</span>决定好了一个关键字后，我们就可以为关键字填充内容了，也就是做好关键词的部署，围绕关键字进行符合规范的SEO文案写作。</p><p>以下就用本文为例子，具体来讲解下什么是符合规范的SEO文案写作！具体的来说，有如下几个方面的要求：</p><p><em>1，文章标题中要包含关键词。</em></p><p>文章标题的权重最高，所以标题中必然要求包含关键词。因为我们是围绕&ldquo;SEO文案写作&rdquo;这个内容来进行写作，所以本文的标题《SEO两百个秘密：符合规范的SEO文案写作》即包含了要优化的关键词&ldquo;SEO文案写作&rdquo;。</p><p>当然，效果最好的可能是直接将&ldquo;SEO文案写作&rdquo;当做标题，达到100%匹配，但是文案写作除了符合SEO规范外，还需要兼顾用户的可读性，做到标题准确简洁，让人一目了然。因此，在这里，我添加了&ldquo;符合规范的&rdquo;四个字，表明文章的主题主要是谈论如何让文案写作符合SEO规范，&ldquo;SEO两百个秘密&rdquo;则告诉用户这篇文章是这一系列文章中的一篇。在正常的文案写作中，关键词在标题的前面更加有助于提升SEO效果。</p><p><em>2，文章第一段包含关键词。</em></p><p>这样的好处是让搜索引擎马上能够提炼出文章的主题。</p><p>&ldquo;接触搜索引擎优化的相关知识之后，发现符合规范的SEO文案写作和大学中文系教授所讲述的那套写作理论是有很大区别的，SEO的文案写作往往以降低原创作品的艺术水准为代价，在进行网页文案写作的时候，通常应该考虑到搜索引擎优化的效果，而不是其艺术性本身，这是很多网站编辑所耿耿于怀，甚至无法原谅的。&rdquo;如果仅考虑SEO效果的话，这段话其实应该是文章的第一段，关键词&ldquo;SEO文案写作&rdquo;在这里重复出现了两次，并且应该说没有堆砌的嫌疑。搜索引擎对于文章第一段内容比较重视。英文写作的习惯是首段一般都用来概括整篇文章的主题或主要内容，搜索引擎也同样认为通常文章第一段的内容是这个文章的主要部分，所以我们在文案写作时要注意第一段的写作。很多转载文章后进行的伪原创，通常也是通过修改第一段内容得以实现。因此在这一段里面，我适当突出了&ldquo;SEO文案写作&rdquo;这个关键词在文章中也适当反复突出这个关键词，当然，尽量做到不刻意堆积，而是自然的表现关键词。</p><p><em>3，小标题有助于读者抓住重点。</em></p><p>文章的小标题可以包含关键词和其拓展变化形式，适当进行加粗，加粗的文本搜索引擎会认为相对比较重要。该文的三个小标题都包含了关键词&ldquo;SEO文案写作&rdquo;，但是又适当地进行了变化，避免了重复。文章写作过程中，要注意多分段，防止用户的阅读疲劳。</p><p><em>4，每一篇文章的SEO写作都以主关键词为目标，但需要其他相关词汇的支持。</em></p><p>搜索引擎可以轻易地认知同义词或者潜在的同义词，比如电脑和计算机，<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>和<a target="_blank" href="http://www.dugutianjiao.com">搜索引擎优化</a>、search engine optimization等。所以我们在进行网页写作的时候，不要局限于目标关键词，应该包含与主关键词语义相关、相近的词汇，以支持主关键词。</p><p>在写作的过程中，独孤天骄有意识地考虑了哪些词和&ldquo;SEO文案写作&rdquo;相关。比如和&ldquo;SEO&rdquo;相关的我适当用上了&ldquo;搜索引擎&rdquo;，&ldquo;搜索引擎优化&rdquo;等词语，和&ldquo;文案写作&rdquo;相关的，我就用上了许多诸如&ldquo;网页文案写作&rdquo;、&ldquo;创作&rdquo;、&ldquo;作品&rdquo;、&ldquo;艺术性&rdquo;、&ldquo;大学&rdquo;、&ldquo;中文系&rdquo;、&ldquo;内容&rdquo;、&ldquo;网页文字&rdquo;、&ldquo;SEO写作&rdquo;、&ldquo;文本内容&rdquo;等等辅助的关键词来烘托主关键词。搜索引擎通过语义分析，应该会将它们视为&ldquo;SEO&rdquo;、&ldquo;文案&rdquo;、&ldquo;写作&rdquo;的相关关键词，因此在写作时，我就尽可能将这些词融入进去。</p><p><em>5，文章内容里面可以适当加上相关链接。</em></p><p>相关链接可以导向相关内容，一方面保证用户能够通过文章了解到其他相关内容，另一方面也提高了文章的相关性。</p><p><strong>三、针对SEO的文案写作中应该注意什么？</strong></p><p>上文我们说道，SEO文案写作和普通的写作是有很大区别的，SEO的文案写作往往以降低原创作品的艺术水准为代价。在进行网页文案写作的时候，通常应该首先考虑到搜索引擎优化的效果，而不是其艺术性！简单的说，符合规范的SEO文案写作必须针对关键词进行主题写作。</p><p>独孤天骄归纳了一下，在SEO文案写作中，有几个要点需要注意：</p><p><em>首先，网站内容要注意主题的归一性。</em></p><p>市场营销中，专卖店是个很好的策略，网络营销中，专题站同样也是一个很好的策略。一个网站如果仅谈论同一个主题，整站内容文章都围绕着看似不同却相关的大量关键词进行写作，有助于搜索引擎提炼网站主题，搜索引擎也更加容易会认为这个网站更加专业。</p><p>针对同一主题进行的SEO文案写作，还有一个好处，就是当搜索引擎收录整个网站的页面之后，能够根据主题词之间的语义相关度判断出网站的主题，进而更加精确地通过语义分析判断关键词与网页的相关性，从而将相关性更高的页面排在搜索结果前面。</p><p>搜索引擎也要顾及用户体验，它断然不想在你搜索&ldquo;和尚&rdquo;的时候，给你一个谈论&ldquo;尼姑&rdquo;的主题帖子，你肯定也不希望用户通过毫不相关的关键词来到你的SEO博客站上，因为这带不来忠实用户。</p><p><em>其次，文章不能单纯为关键词而关键词，必须逻辑语法，符合读者习惯。</em></p><p>简单的说，就是必须具有可读性，如果用户完全不喜欢的话，搜索引擎也不会喜欢。搜索引擎是以用户体验为基础的。</p><p>SEO文案写作不能完全考虑SEO！我们在围绕关键词进行SEO写作的同时，除了要考虑到关键词的出现位置、正确部署之外，更重要的是要考虑文章的可读性和价值性，应该同时为搜索引擎和用户提供高质量的文本内容才是真正的&ldquo;内容为王&rdquo;。在优化文本内容的同时不能为了SEO而忽略了用户。真正好的内容，应该是一方面能够提高搜索引擎对网站内容的认可权重，另外一方面通过优质的内容来引导访客，最终达到提高转换率的目的。</p><p><em>最后，当你写作的时候，请确保自己对文章的主题有一定的认识。</em></p><p>你不需要是专家，但是绝对不能糊弄读者。当你根本就不懂得写作的时候，就不能高谈阔论文案写作。只有你深刻理解了文案写作，也同时深刻理解SEO，那么你写出来的文章才有一定的深度和权威。</p><p>网站的撰稿人和编辑人员都要经过专业化的SEO训练，真正懂得关键词，了解关键词和关键词密度等相关概念，在文案写作中使用关键词并努力考虑相关性来创作或修改内容。这是一个长期的过程。</p><p>如果你还不懂得如何写作符合SEO规范的文案，那么请从头到尾再次好好审阅下这篇文章，它绝大部分符合了独孤天骄上面所讲述的规范。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-copywriting.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=131</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=131&amp;key=93458fc2</trackback:ping></item><item><title>SEO两百个秘密：导出链接在SEO中的秘密</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-outbound-links.html</link><pubDate>Wed, 13 May 2009 17:26:16 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-outbound-links.html</guid><description><![CDATA[<p>　　<strong>导出链接（Outbound Links）</strong>，是指从你自己网站链接到另外网站的链接，与之对应的是导入链接，即SEO研究院以前所阐释过的<a target="_blank" href="http://www.dugutianjiao.com/post/seo-backlinks-secret.html">反向链接或外部链接</a>。</p><p>　　链接策略里我们以前讲述过导入链接和内部链接。很多人觉得只有导入链接，也就是所谓的外部链接才对一个网站有SEO作用。其实网站的导出链接对SEO也有不容小视的影响力。许多人在<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>时，往往都会充分考虑到外部链接的建立和<a target="_blank" href="http://www.dugutianjiao.com/post/seo-internal-links.html">内部链接</a>的相互交联，却常常陷入误区，忘记了导出链接的重要性。因此这一篇文章独孤天骄准备系统地讲一讲导出链接。导出链接包括网站自身的导出链接和外部链接站点上的导出链接两方面的内容，这里主要探讨导向外部站点的导出链接。</p><p><strong>　　一、导出链接的误区</strong></p><p>　　我们知道，一个导出链接相当于自己网站给对方网站一个投票，它会给所指向的网站传递PageRank。因此在SEO行业里面普遍存在着一些误区，许多站长刻意不链接到其他网站上，我想最大的原因莫过于害怕这些导出链接会影响到自己的网页PR，造成PR流失，从而降低该网页的搜索引擎排名，甚至降低自己网站的价值。</p><p>　　其实这是没有必要的杞人忧天！</p><p>　　首先，追溯链接的根源与本质，导出链接主要起到一个不增加你自己网站内容的情况下给访问者提供更多信息源的作用。从理论上来说，导出链接不会影响到本网页的PR值。网页的PR值，是由反向链接的数目及所投票过来的PR值所决定的，与导出链接无关。即使有关，导出链接也只会在很小很小的程度上影响当前页的PR值。因为在一个网页上，通常都会有几十个链接，多一个链接所造成的损耗相当小。比如说页面上多了一个指向其他网站的链接，那么你的指向同一个网站的内部链接所传递的PR值，就会有所降低。而你自己的网站上其他这些网页再传递回当前网页的PR值也会相应降低。但是，这里所损耗的PR值是相当相当小的。</p><p>　　其次，导出链接有极强的用户体验度，相关性高的导出链接能够帮助你的网站访问者找到更多他感兴趣的内容。搜索引擎是站在用户的角度上审核你的网站的，因此适当的导出相关性链接，不仅不会流失PR，反而可能会增加你的PR，提高你的网站排名！</p><p>　　在很多情况下，刻意不链接到其他网站上反倒可能是有害的。Zac在<a href="http://www.chinamyhosting.com/seoblog/2006/05/08/outgoing-links/">SEO误区-害怕导出链接到其他网站</a>还列举了更多的理由应该链接向其他网站：<br />　　1）互联网的本质就是超链接。没有了链接，就没有了互联网。如果大家都不链接出去，网站就成了一个个的孤岛，也就毫无意义了。这种精神和本质是永远不会消失的，也是会得到搜索引擎永远尊重的。如果你的网站没有导出链接，那是很奇怪的一件事，很可能也会被怀疑。<br />　　2）在搜索引擎排名因素中，链接的锚文字或链接文字也是排名的一个重要因素。在链接中包含关键词是网页内优化的重要因素之一。<br />　　3）指向权威性相关网站的导出链接本身就是搜索引擎排名中的重要因素之一。现在这个因素是可以感觉到的，虽然搜索引擎并没有肯定这一点。</p><p>　　<strong>二、导出链接应该注意什么</strong></p><p>　　1，导出链接的数量应该小于100个。Google认为一个页面的最大导出链接数量不应超过100个。这个100个导出链接我认为已经包括了网站自身的导出链接数量和外部链接站点上的导出链接数量两方面的内容。因此，为确保自己网站内部网页的权益，导出到外部站点的链接数量尽量控制在10到15个之内，尤其不要在首页设置过多的导出链接。从用户体验的角度上来看，一个单独页面上含有过多链接确实会让用户很困惑。</p><p>　　2，导出链接的质量应该是相关性的，符合用户需要的，避免毫无逻辑，杂乱无章地链接到其他网站。</p><p>　　首先，相关性高的导出链接能够帮助您网站的访问者。而任由用户自己生成的不加管理的垃圾链接、以及不负责任的付费链接会直接降低网站的信任度。一个网页链接到垃圾网站，那么这个网页的权威性也很有可能被搜索引擎降低。如果你的网站有付费的导出链接，最好对这些链接使用 <a target="_blank" href="http://www.dugutianjiao.com/post/nofollow-tag-seo.html">rel=&ldquo;no follow&rdquo; 元标记</a>或者其他方式以确保他们不会传递PageRank。Google作为一个用户，通常只会对那些充分保障其知情权的网站保持忠诚度。</p><p>　　其次，导出链接的主题很重要，这个直接体现了网站的专业性。一个网页的导出链接，指向内容完全不相干的网站，无助于自身网站主题的集中性，这些导出链接甚至有可能被认为是付费链接或者垃圾链接。但是假设说SEO研究院的所有导出链接都指向了SEO同行的网站或博客，那么搜索引擎将更容易认定SEO研究院是一个SEO专业领域的网站。理性的导出链接有助于建立您的信誉。</p><p>　　3，注意不导向有问题的垃圾网站。但是，现在的搜索引擎算法越来越成熟，导出链接不一定有不利的影响，除非是指向&ldquo;坏邻居&rdquo;垃圾网站。新建立的网站尤其应该重视导出链接，如果是导向垃圾网站，往往会被百度搜索引擎降权乃至直接封杀。独孤天骄最近还有这样的经历，一个全新建立的网站，只导出了四个链接，或者说是四个交换链接（友情链接就是一种最常见的导出链接，不过其同时还带有一个导入的链接）。内容全部都是原创的，没有任何作弊成分，有一天突然被百度封杀。查看<a target="_blank" href="http://www.dugutianjiao.com/post/iis-log-baiduspider.html">IIS日志</a>，发现百度蜘蛛仍然还在爬行网站，但是site命令已经完全查找不到本站了。最终检查了这四个链接，发现有一个链接已经被百度K站，于是立即去掉。持续更新，在当月11日百度小更新的时候，百度重新收录网站。百度有其自己的一套作弊惩罚机制和ip黑名单数据库，为了避免被连坐，你应该非常谨慎地处理导出链接。网页收录数量恢复也意味着百度有可能存在一个临时数据库用来保存那些&ldquo;暂时被删除&rdquo;的网页，只是不清楚这个临时数据库给你多少&ldquo;改邪归正&rdquo;的时间，这个实例是较为幸运的，发现问题并且快速反应及时解决了问题，算是逃离了炮口，否则极为可能就是全站永久封杀的后果。</p><p>&nbsp;　　<strong>三、导出链接的具体应用</strong></p><p>　　导出链接向来被认为是一种无私的贡献或是说对别人的评价或投票，因此导出链接的应用较少。大部分也只是应用于新站建立后做导出链接让搜索引擎对网站进行定位，下面介绍一些导出链接的灵活应用。</p><p>　　首先，导出链接对于新站尤其重要，它有助于搜索引擎对于新站主题的归一集中认识。新站导出到相关高质量网站的链接对提升排名的效应很轻微，但是这些导出链接可以帮助搜索引擎蜘蛛对新站的认识和定位，并进行适当的网站分类，有助于网站的收录，间接提升了排名。</p><p>　　其次，如果首页或者栏目内容比较宽泛，关键词密度很低时，搜索引擎蜘蛛就有可能无法准备判断网站的主题。这个时候，网站的内部链接，反向链接，导出链接的锚文本，都将有助于提高搜索引擎蜘蛛的判断力，更精确地定位该页面的内容。</p><p>　　第三，导出链接的锚文本很重要。描述性的锚文本有助于网络间的准确互联。它可以同时让用户和Googlebot更好地了解他们在跟随一个链接到达另外一个页面时将会看到什么内容。从这个意义上来看，描述性锚文本的导出链接可以提升页面关键词密度，当然链接文字和内容关键词的密度权重还是有区别的。　　</p><p>　　<strong>拓展阅读：</strong><br />　　1，内部链接在SEO中的秘密：<a href="http://www.dugutianjiao.com/post/seo-internal-links.html">http://www.dugutianjiao.com/post/seo-internal-links.html</a><br />　　2，反向链接的秘密：<a href="http://www.dugutianjiao.com/post/seo-backlinks-secret.html">http://www.dugutianjiao.com/post/seo-backlinks-secret.html</a><br />　　3，导出链接在SEO中的秘密：<a href="http://www.dugutianjiao.com/post/seo-outbound-links.html">http://www.dugutianjiao.com/post/seo-outbound-links.html</a></p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-outbound-links.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=130</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=130&amp;key=86add760</trackback:ping></item><item><title>SEO两百个秘密：迁移服务器和更换IP地址对SEO的影响和解决方案</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/server-ip-seo.html</link><pubDate>Tue, 28 Apr 2009 18:17:28 +0800</pubDate><guid>http://www.dugutianjiao.com/post/server-ip-seo.html</guid><description><![CDATA[<p>SEO免费培训群（35026784）里面的网友提问到迁移服务器和更换IP地址需要注意什么工作，在此作一个解答：</p><p>网站如果频繁地迁移服务器或者更换IP地址的话，对其<a target="_blank" href="http://www.dugutianjiao.com">SEO排名</a>是有影响的，频繁更换IP甚至会导致网站被降权，因此在网站优化的过程中，我们应该尽量保持服务器和IP地址的稳定性。</p><p><strong>一、服务器和IP地址对SEO的影响：</strong></p><p>首先，网站服务器的好坏，直接影响了搜索引擎爬虫对服务器所绑定网站空间网页的抓取速度，这一点将直接对SEO排名造成影响。搜索引擎机器人会对已经索引的站点进行回访，以便把站点网页更新或修改信息带回其索引数据库，如果一个站点在搜索引擎机器人造访的时候经常不能访问，这个时候搜索引擎就会容易认为该站点已经失效，接着将该站点的索引数据删除。这是很简单的道理，如果您去拜访一个陌生的朋友，当您几乎每次过去的时候，都吃了闭门羹，那么您很容易放弃再次的拜访；同样，当搜索引擎放弃的网页数量太多，一来网站在搜索引擎索引的收录量会相应减少，二来网站的权重就会被搜素引擎相应降低。很明显，这两点都会造成网站SEO排名的整体下滑。</p><p>其次，IP地址对网站的排名同样也有影响。一栋楼（相当于我们的一台独立服务器）只属于你一家（一个独立运营网站）入住，如果这栋楼还属于高尚住宅区（比如服务器速度特别快等）的话，那么这种典型的&ldquo;豪宅&rdquo;，搜索引擎就会认为您的&ldquo;钱重&rdquo;挺高，将您当成&ldquo;有钱人&rdquo;看待，在您需要贷款（排名）的时候，就会赋予较高的权重，您的网站也会同时变得更有&ldquo;价值&rdquo;。一个域名多注册几年，能提高搜索引擎的信任值也基于同样的道理。我们知道贫民窟也会出百万富翁，不好的服务器同样有可能驻留着一个内容非常棒的网站，搜索引擎上述的判定行径虽然容易受到诟病，但是基于大概率的考虑，如此判定权重的原则跟银行的征信体系一般，可以说是目前最为科学的。</p><p>最后，如果一台服务器上面，几乎大部分的站点都是被搜索引擎惩罚过的垃圾站点，那么您的站点也很容易被搜素引擎株连。举个例子，你在现实生活中，认识的不是贪官就是流氓，那么你在别人的眼里应该也就介于此二者之间了。</p><p>因此，独孤天骄大胆猜测：<br />1，同一个IP下面的网站数量越多，每个网站分到的权重就越少。<br />2，如果一个网站单独使用一个IP，那么它就得到了这个IP地址的全部权重。<br />3，如果一个服务器上太多&ldquo;邻居&rdquo;都被搜索引擎惩罚过，那么您也容易受到牵连。&nbsp;</p><p><strong>二、迁移服务器和更换IP地址时，SEO应该注意什么</strong></p><p>我们上文说了，轻易迁移服务器和改变IP地址是不明智的，但是有时候我们却不得不做这一举动，比如当服务器出现问题，空间过慢，同一服务器坏邻居过多等，以及其他问题都有可能让我们不得不迁移服务器或者更换IP，有兴趣的同学可以搜索下&ldquo;紫田服务器网络中断&rdquo;事件，相信会有更深刻的理解。</p><p>那么，当不得不更换服务器或者IP地址时，我们具体应该做些什么工作呢？</p><p>一个总体原则，就是在更换服务器或IP地址到网站排名恢复稳定之前，尽量不对网站页面做太规模的改动，以免变动过大导致被搜索引擎重新置入<a target="_blank" href="http://www.dugutianjiao.com/post/seo-sandbox-effect.html">沙盒</a>之中进行观察，沙盒对网站排名的影响，我们以前说过，当一个网站没有巨大的预算，可以在网站被置入沙盒期间同时进行相应的线上线下推广的时候，沙盒对一个有点规模的网站来说，无疑是巨大的损失。在迁移服务器或更换IP地址的过程中，我们需要处理得当，将这一些不利影响控制到最小。</p><p>因此，我们的解决方案就是在更换服务器或IP地址之后，及时地将自己的站点信息传递给搜索引擎，告诉它自己站点的更新信息，等待搜索引擎真正地重新地认可了我们，我们就可以开始做其他工作了。</p><p>首先，新旧服务器或IP地址上的两个网站应该并存运行一段时间。复制你的网站到新的服务器中，并确保网站在新的服务器中运转正常。同时很重要的一点，保留旧服务器上的网站数据，暂时不要删除，并保证它也运行正常。</p><p>其次，修改DNS设置中的主机名Hostname，指向新的IP地址。有条件的话，修改你的DNS配置中的TTL值，使TTL更短，比如五分钟。这将告诉网站浏览器每隔五分钟重新检查你网站的IP地址。这一点Google<a target="_blank" href="http://googlewebmastercentral.blogspot.com/2008/01/feeling-lucky-at-pubcon.html">曾经提到</a>&nbsp;，不过按照独孤天骄的经验来看，不做的话，也没有大关系，只是等待的时间要稍微拉长一点点而已。</p><p>第三，检查你的<a target="_blank" href="http://www.dugutianjiao.com/post/iis-log-baiduspider.html">IIS日志</a>，查看Googlebot和baiduspider+等搜索引擎爬虫是否已经开始在你的新IP地址上抓取网站。如果是Google的话，我们还可以查看其网站管理员中的&ldquo;抓取错误&rdquo;信息。新的DNS设置生效一般在24-48 小时，比较快的话几十分钟甚至数小时就足够了，不过搜索引擎对你站点的索引更新则不一定如此之快，搜索引擎的机器人有个爬行周期的概念，它会根据站点的信息更新频率而对其形成特有的爬行周期。一般来说，如果你的信息更新频繁，那么也许你在一到三天就会得到搜索引擎的更新；如果你的内容站点是间歇更新的，也许需要一个礼拜左右才会得到搜索引擎爬虫的重新抓取索引；而如果你是那种数月半年不更新的企业站点，这个过程将更加漫长，也许要一个月以上，甚至更长时间。因此，在等待搜索引擎机器人重新爬行抓取的过程中，我们不妨找一些搜索引擎权重比较高、内容更新比较频繁的站点（一个简单的判定办法，你可以查阅下其快照更新是否频繁）给你导入外链，这个也会造成搜索引擎机器人频繁造访那个站点的同时光顾你的站点。一旦搜索引擎爬虫在新的IP地址上可以正常抓取，搜索引擎的蜘蛛已经完全能够识别到新的IP之后，你所有的工作基本上就完成了。旧站的数据也应该放心删除了。</p><p>我们虽然不建议您经常迁移服务器或者更换IP地址，不过这个时候，迁移或更换工作已经完全成功，不会造成任何其他不良影响了，你可以放心做其他工作了！</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/server-ip-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=124</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=124&amp;key=cd95beca</trackback:ping></item><item><title>SEO两百个秘密：URL的优化与SEO规范</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/url-seo-tips.html</link><pubDate>Mon, 20 Apr 2009 23:51:35 +0800</pubDate><guid>http://www.dugutianjiao.com/post/url-seo-tips.html</guid><description><![CDATA[<p>链接是搜索引擎机器人爬行网站的路径，所以对网站链接的优化也是网站内部结构优化很重要的一个因素。每一个URL被搜索引擎收录之后，就会开始慢慢积累信用，即域名信任度，改动一次URL不管对于个人网站还是门户网站都是灾难性的，尤其对于门户网站，意味着几十数百万乃至成千万页面的重新收录问题。因此，当我们注册好域名，正式开始做站之前非常重要的一步就是做好URL的优化和规范，这个规范一旦形成之后是万万不能再次改动的。</p><p>URL的优化，导航链接，<a target="_blank" href="http://www.dugutianjiao.com/post/seo-internal-links.html">站内链接</a>等都可以归属为链接优化策略，其中URL的优化是一个重头戏。很多人都知道URL对<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>的重要之处，但是很多站点其实都忽略了对站点URL路径的优化，我希望借本博文，唤醒广大站长尤其是SEO慎重来对待网站的URL。</p><p><strong>1，什么是URL路径和URL规范化<br /></strong>URL是统一资源定位，即每个网页的网址、路径。清晰简短和规范的命名不仅有利于用户体验和网址传播，更是搜索引擎友好的体现。一般常用的URL形式有：静态URL、动态URL和目录结构形式的URL，如果再细分下去，我觉得甚至还可以将所有的URL分为绝对URL（即网页路径使用包含顶级域名在内的完整的URL）和相对URL，当然这是SEO的分法。</p><p>网址URL规范化（URL canonicalization）指的是搜索引擎挑选最好的URL网址作为真正网址的过程。举例来说，下面两个URL一般来说指的是同一个文件或网页，因为它们都返回到SEO研究院的首页：</p><p>http://www.dugutianjiao.com<br /><a href="http://dugutianjiao.com">http://dugutianjiao.com</a>&nbsp;</p><p>规划化的URL就不允许你一会链接回http://www.dugutianjiao.com，一会儿链接向http://dugutianjiao.com。搜索引擎必须要从中选择一个作为规划化的、唯一的网址。当这种情况只有一两个的时候，Google和其他搜索引擎显然可以通过外部链接的数量来很容易来判断，但是当这样的页面非常多的时候，将会造成大量的复制内容的网页，给Google等搜索引擎造成麻烦。</p><p>所以，当URL规划化做得不够的时候，很容易影响到站点在搜索引擎上的排名。</p><p><strong>2，URL对SEO的影响</strong>&nbsp;</p><p>讲到了URL规范化，我们就不得不再提提不同的URL对SEO的影响。我们上文讲到<a target="_blank" href="http://www.dugutianjiao.com/post/seo-mulujiegou-youhua.html">网站的目录结构优化</a>时曾提到目录结构混乱对SEO造成的不利影响，URL的规范化显的尤为重要，不规范的URL同样也会对SEO造成极大的困扰，它是决定网站的收录数量、长尾词排名数量和提升、站点内部链接策略等的关键所在。</p><p>太过冗长，太过混乱，动态的URL虽然目前对搜索引擎的收录没有问题，但是不仅会给用户带来不良的用户体验，不利于用户的访问和传播，而且对排名的提升都会带来很大的障碍。这一点很简单，毕竟用户越来越聪明了，带个五六七八个问号的URL那个用户愿意去点击并且传播呢？在用户行为模式日益被重视的今天，排名的不佳也是可以预见的了。</p><p><strong>3，针对URL的SEO方法</strong></p><p>&nbsp;总结几条关于URL优化的经验，有些未经验证，仅是个人猜测。</p><p>1）主域名的选择不应过长（控制在12个字符内），主域名匹配优于目录名或网页名匹配，也就是主域名的权重大于目录和内容页，在主域名包含关键词URL比在目录名和内容页包含URL在同等条件下有排名优势。</p><p>2）同等条件下，静态URL一般比动态URL权重高，但优势差距很小。如果我们擅长站内链接的优化策略，这个差距可以说几乎没有。早期由于搜索引擎蜘蛛本身的问题，对动态网页的抓取不是非常到位，容易陷入动态网页的死循环之中，所以减少对动态URL的读取，特别是带&ldquo;？&rdquo;符号的URL，但是随着搜索引擎的完善，这种现象目前已经基本得以解决，现在<span><span>动态</span>URL<span>并不是</span>SEO<span>中的大问题，不一定非得采用静态链接。 当然，如果你想将正在使用的动态地址改成静态地址，你可以采用URL重写，或者一开始就像DZ论坛程序那样使用伪静态地址。</span></span></p><p>不过，如果你采用动态网页，那么建议参数越少越好。虽然现在SEO一致认为，URL中带2-3个问号不是问题，搜索引擎通常都能收录，尤其是Google完全有能力抓取动态网址，多少个问号似乎也不是问题。高权重的域名，再多几个问号也不在话下。但无论如何，一般还是建议URL静态化。因为Google抓取动态网址没问题，并不意味着雅虎，百度，微软等等就都没问题。尤其是中文网站，百度才是真正的老大。</p><p>3）URL的写法。目录名和文件名的URL里面可以适当包含一些关键词，URL中的关键词多少对搜索引擎算法有用，但是记得不要堆砌，不要有类似seo-seo-seo.html的文件名。堆砌关键词还容易将URL搞得太长，不利用户的访问体验。对于百度，URL采用拼音格式有助于排名的加分，比如baidu-youhua这个目录会比bdyh这个目录具有优势。当然，如果拼音太长的话，可以考虑使用英文，比如sousuoyinqingyouhua这个目录或文件的URL我们完全可以也可以用seo来代替。不过，注意不要采用中文字符，比如使用&ldquo;<a target="_blank" href="http://www.dugutianjiao.com">搜索引擎优化</a>&rdquo;作为目录的url名称，这样的URL在浏览器地址栏会显示成一堆编码字符，让人有很奇怪的感觉。</p><p>4）紧跟上面baidu-youhua例子，关键词之间可以使用连词符，连词符会被当作空格处理。URL中目录名和文件名的单词之间最好用连词符&ldquo;&mdash;&rdquo;，不要用下划线&ldquo;_&rdquo;，也不要用其他允许但很奇怪的字符。整个URL尽量带有描述性，你要相信，百度和Google它们是看得懂你的意思的，所以用baidu-youhua这个文件名的话，百度会知道这个页面是关于&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/baidu-youhua.html">百度优化</a>&rdquo;的，而bdyh就没有这个效果。这是独孤天骄不鼓励站点使用纯粹数字和日期作为URL路径的原因之一，除此之外，具有描述性的URL还有助于用户体验，用户看到URL的时候就大致上了解了这个网站所涉及的相关主题。&nbsp;</p><p><strong>4，URL的规范化</strong></p><p>很多时候，我们考虑把无效的URL如用户拼错的URL、不存在的URL重定向到别的网页，例如网站的首页、404页面等，那么就必须注意URL的规范化。</p><p>1）如果需要改变原有的URL，URL跳转时应使用301 永久重定向。增加内链，引入外链，有助于搜索引擎识别新的标准URL。</p><p>2）同一个域名，同一个网页，同一个文件都只能有一个URL地址。其他地址应该301永久重定向到唯一地址上来。一般情况下，谷歌根据被外链的数量来判断。采用多的，则是标准化URL，但这一般对首页有效，内容页并不像首页那么容易获得外部的链接。首页URL的标准化我们还可以使用Google站长工具来通过&ldquo;控制台 &gt; 工具 &gt; 设置首选域名&rdquo;实现。</p><p>3）搜索引擎虽然能够自动完成诸如保留或者删除末尾的斜杠、将URL从大写格式转换为小写格式等，但是独孤天骄仍然建议在URL的规范中注意格式，比如<a href="http://www.dugutianjiao.com/">http://www.dugutianjiao.com</a>我们一般写作<a href="http://www.dugutianjiao.com/">http://www.dugutianjiao.com/</a>这样的格式，请仔细查看区别；URL中最好统一全部使用小写字母。</p><p>4）不用太在意URL是相对路径还是绝对路径。Google和百度在排名时都不是很看重URL使用的是相对路径还是绝对路径。但是独孤天骄仍然强烈建议你采用绝对路径。为什么呢？因为当你的文章被人家直接复制引用或采集的时候，保留下来如果是相对路径的话，那么你应该知道意味着什么？它意味着你的外部链接将白白损失一个。</p><p>5）如果网页彻底消失了，请确保服务器返回一个关于这个网页的404错误信息。这会增加搜索引擎的收录质量，有助于排名提升。</p><p>原文发布于SEO研究院：<a href="http://www.dugutianjiao.com">http://www.dugutianjiao.com</a>，转载请注明地址，谢谢。<br />&nbsp;</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/url-seo-tips.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=119</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=119&amp;key=b4ac650c</trackback:ping></item><item><title>SEO两百个秘密：网站的目录结构优化</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-mulujiegou-youhua.html</link><pubDate>Sun, 19 Apr 2009 15:36:55 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-mulujiegou-youhua.html</guid><description><![CDATA[<p>除垃圾站之外，很少有网站只由单页面组成，当涉及到多个尤其是成千上万页面时，往往就需要有个清晰的网站结构，来确保搜索引擎和用户的访问，<a target="_blank" href="http://www.dugutianjiao.com/post/seo-mulujiegou-youhua.html">网站的目录结构</a>就起到这样的作用，它在<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>中意义非凡。</p><p><strong>1，什么是网站的目录结构</strong></p><p>网站的目录是指你建立网站时所创建的目录，目录结构则主要是指物理结构和逻辑结构这两种。</p><p>具体的说，网站物理结构指的是网站目录及所包含文件所存储的真实位置所表现出来的结构。对于小型网站来说，所有网页都存在网站根目录下的扁平式结构，这种单一的目录的扁平结构对搜索引擎而言是最为理想的，因为只要一次访问即可遍历。但是如果太多文件都放在根目录下的话，维护起来就显得相当麻烦；而对规模大一些的网站，往往需要二到三层甚至更多层级子目录才能保证文件内容页的正常存储，这种多层级目录也叫做树型结构，即根目录下再细分成多个频道或目录，然后在每一个目录下面再存储属于这个目录的终极内容网页，这样的好处是维护容易，但是搜索引擎的抓取将会显得困难些。</p><p>与网站的物理结构不同，网站的逻辑结构也叫链接结构，主要是指由网页内部链接所形成的逻辑结构或者叫链接的结构。这在现在的一部分CMS建站系统中已经可以实现文件虽然存在不同的物理结构目录之中，但是访问的链接的目录层级只需要一层即可转向访问。</p><p><strong>2，网站的目录结构对SEO的影响</strong></p><p>网站的目录结构的层级对SEO的影响很大。网站的目录层级不要太深，目录结构越简单，搜索引擎访问就越容易，目录结构层级越深，搜索引擎爬虫就越不容易抓取。</p><p>这个很简单的道理，有人说了个绝妙的比喻，就比如你急着上厕所的时候，总不会穿街走巷绕圈去，而总会优先考虑就近的厕所。囧！再举个例子，&ldquo;酒香也怕巷子深&rdquo;，再好的内容页，如果隐藏在太深的目录层级之下，搜索引擎也是要望洋兴叹，徒叹奈何！</p><p>3，<strong>如何优化网站结构</strong></p><p>目录的结构往往容易被普通网站长所忽略，其实目录结构的好坏，对站点的SEO有着重要的影响。网站内部结构优化也是整个优化过程中非常重要的一个环节。那么，作为SEO，怎么去优化网站的结构呢？我想，优化网站结构应该主要涉及到物理结构和逻辑结构这两个方面。</p><p>首先，优化网站的物理结构目录。一般说来，我们不提倡将将所有文件都存放在根目录下，而鼓励按栏目内容建立子目录，并且尽量使用意义明确的目录名称，比如image，css，js，post，bbs等等名称，但是注意不要使用中文名称，尤其是针对英文的SEO优化更应该使用中文目录，目录名称也不宜太过冗长，URL应该越短越好。举个例子，我们没有必要将seo这个目录改成sousuoyinqingyouhua，因为搜索引擎看得懂seo这个词。目录和文件命名可以适当使用到关键词，如果是关键词组，需要用分隔符分开的话，我们常用连字符&ldquo;-&rdquo;进行分隔。</p><p>最为重要的是，网站的目录层级一般建议不要超过3层！&mdash;&mdash;这是我们在SEO的过程对网站的物理结构目录最大的一个优化。这个优化如果不计SEO，其实还有很多其他的好处，比如较少层级的目录容易传播、用户体验和交换链接等等。</p><p>当然，这并不是绝对的。不管内容页所处的目录层级有多深，只要该页有一个或者大量来自其它网站的外部链接，它同样会被搜索引擎收录；如果我们在首页上增加一个该页的链接，那么其实就相当于二次点击即可访问到该页，再深的巷子如果通了条火车，同样也会顾客盈门，因此链接是被搜索引擎收录的关键。对一个站点中包含的子目录，只要链向该层子目录的链接提供有搜索引擎能够跟进的导航配置和URL结构，那么所有的搜索引擎都会对子目录提供遍历。做好导航结构，将会有效控制多层目录结构对SEO造成的不利影响。</p><p>其次，对网站的逻辑结构的优化也应该同样重视。一般来讲，首页的PR值最高，二级目录次之，最终内容页面再次之，因此为使这些页面更有效地展示出来，就要尽量减少PR流失，所以目录结构不要太深，三级已经足够，并且所有的链接应该能够做到相互回环，目录的逻辑结构也要尽量要做到符合&ldquo;面包屑导航&rdquo;效用。使得搜索引擎只要抓取了一个页面，就可以顺着这个页面抓取更多乃至整个站点的所有页面。另外，要注意，如果网站调整，网页目录结构改变，网页被移到一个新地址等改变网页目录结构的时候，我们都应该充分考虑到SEO，尽可能采用301重定向到新的页面，以免网站出现死链、断链、错链等问题。</p><p><strong>4，网站目录结构在SEO排名中的具体应用方法</strong></p><p>我们前面讲到，网站的目录结构的层级对SEO的影响很大，目录结构越简单，搜索引擎访问就越容易。对百度而言，它给予网站的域名、目录和页面的权重是不一样的。当参与关键词排名竞争的时候，域名级的链接在百度是最具排名优势的，目录级其次，页面级则最低。因此，当我们所关心的关键词，排名前十的大多数是页面级的站点在竞争，那我们就可以在网站之下建立一个目录来参与竞争；如果前十名都是目录级，那我们就需要用域名级来争取排名；如果前十名都是域名级，那你就要拼网站的权重和质量了。<em>&nbsp;</em></p><p>在这里，我们还要解决一个疑问：二级域名与二级目录，即子域名和子目录，二者到底那个目录结构更容易被收录呢？</p><p>一般来说，二级目录的权重增加，可以提高主域名的权重，主域名的权重增加，也能带动二级目录的权重。二级目录是依靠着主域名权重，主域名收录完好，直接能加快二级目录收录；相比二级域名，二级域名在搜索引擎中相当独立的网站，单就URL来看，二级域名比一级目录天生的信任度稍微高一点，但是收录中可能要比二级目录稍慢些。</p><p>如果你的网站类别不是很多，建议采用二级目录的形式，这样更有利于主打品牌的推广和提高网站权重。如果你是个类别比较多，内容比较丰富的网站，建议你采用二级域名的形式。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-mulujiegou-youhua.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=62</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=62&amp;key=77904e23</trackback:ping></item><item><title>SEO两百个秘密系列总目录</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-secret-index.html</link><pubDate>Sat, 18 Apr 2009 18:17:59 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-secret-index.html</guid><description><![CDATA[<p>1，<a target="_blank" href="http://www.dugutianjiao.com/post/what-is-seo.html">SEO是什么？</a><br />讲述了SEO是什么？为什么需要学习SEO？&mdash;&mdash;这是初学SEO者必须跨越的第一道槛！因此&ldquo;SEO两百个秘密&rdquo;开篇我们准备先对它的正确概念进行阐述。</p><p>2，<a target="_blank" href="http://www.dugutianjiao.com/post/seo-internal-links.html">SEO两百个秘密：内部链接在SEO中的秘密</a><br />讲解了SEO中内部链接的作用以及优化技巧，就网站优化中的内部链接优化进行细化分析。</p><p>3，<a target="_blank" href="http://www.dugutianjiao.com/post/seo-backlinks-secret.html">SEO两百个秘密：反向链接的秘密</a><br />学习SEO者都知道反向链接的重要性，对所有的搜索引擎来说，高质量的反向链接皆是搜索引擎排名的最重要因素之一。SEO两百个秘密，反向链接绝对是最重要的秘密之一。但，到底什么是反向链接？</p><p>4，<a target="_blank" href="http://www.dugutianjiao.com/post/how-to-use-heading.html">SEO两百个秘密：如何正确使用Heading标签</a><br />Heading 标签（注意和 HTML 中的&lt;head&gt;标签进行区别）通常用来为用户展现网页的结构，由于heading 标签通常会使某些文字比普通的文字大，对于用户来说，这样可以便于他们更直观地看出这些文字的重要性，而且可以帮助他们理解heading文字下方的内容。多种渐变大小的heading一开始主要为网页的内容创建分层结构，便于用户直观地浏览网站。不过目前SEO届普遍将heading 标签作为丰富文字形式的手段，这其实并不可取。有感于许多SEO滥用Heading标签，因此独孤天骄在这里统一说说这个标签都使用需要注意一些什么问题。</p><p>5，<a target="_blank" href="http://www.dugutianjiao.com/post/keywords-description-seo.html">SEO两百个秘密：Keywords标签与Description标签的再认识</a><br />META标签，即Meta Description，就是网页头部一段对该页内容的描述性文字，也可以称之为页面摘要。META标签通常被搜索引擎用来描述一个HTML网页文档的属性，例如作者、类别、日期和时间、网页描述、关键词、页面刷新等。在Google和百度的搜索结果中，页面摘要通常是搜索引擎为每个搜索结果显示的简短的文字预览，其质量直接影响到你的网站被点击的可能性。</p><p>6，<a target="_blank" href="http://www.dugutianjiao.com/post/seo-title-secret.html">SEO两百个秘密：如何优化网站的标题标签</a><br />Title翻译至Title Tag，即标题标签，在Html的Head标签内被用来定义页面文档的标题。做SEO不优化标题标签，绝对是不可饶恕的低级错误，因为搜索引擎索引到的内容标题往往是网页Title的内容，想要有好的排名就必须多推敲Title，合理分配Title的关键词，让Title标签里面拥有最为核心的关键词。到目前为止，标题标签被证明是SEO中最为关键的优化项目之一，Title虽然不是决定网站排名的最终因素，但是一个合适的Title标签可以使你的网站获取更好排名。这一点通过搜索关键词就可以得证，当Title标签中没有出现关键词的情况下，想排在前十的几率是很低的。因此，如何写网站的标题标签，是SEO学习的基础，也是最为重要的基础之一。</p><p>7，<a target="_blank" href="http://www.dugutianjiao.com/post/seo-control-searching.html">SEO两百个秘密：控制搜索引擎的行为</a><br />在这一篇文章里面，独孤天骄将向大家介绍如何引导搜索引擎的蜘蛛来访和控制蜘蛛行为。</p><p>8，<a target="_blank" href="http://www.dugutianjiao.com/post/seo-robots-txt.html">SEO两百个秘密：robots.txt文件的秘密</a><br />网站能不能被搜索引擎索引到，除了看有没有向搜索引擎入口提交、有否与其他站点交换链接等之外，还得看根目录底下的robots.txt文件有没有禁止搜索引擎的收录。熟练书写robots.txt语法，是每个SEOer所必须掌握的基本技能。</p><p>9，<a target="_blank" href="http://www.dugutianjiao.com/post/nofollow-tag-seo.html">SEO两百个秘密：Nofollow标签的定义和使用</a><br />&nbsp;2005年Google率先引入一个防止垃圾链接的规范，开始支持对链接的&ldquo;nofollow&rdquo;属性(&ldquo;rel=&rsquo;nofollow&rsquo;&rdquo;)。这是当时SEO（搜索引擎优化）界一个争论四起的热点新闻事件。毕竟&ldquo;nofollow&rdquo;属性剥去了链接的价值，而链接对于SEO的影响巨大。</p><p>10，<a target="_blank" href="http://www.dugutianjiao.com/post/keyword-selection.html">SEO两百个秘密：关键词的选择策略</a><br />所有网站的SEO都必须围绕关键词来展开，否则它就不可能从搜索引擎获取有效的导入流量。</p><p>11，<a target="_blank" href="http://www.dugutianjiao.com/post/site-update-seo.html">SEO两百个秘密：网站信息更新频率与关键词的SEO排名</a><br />随着优质页面的更多收录，整站的权重也将逐渐累积得更高，到一定程度，你刚发布的文章，百度就会像其对新闻源网站的更新，一个小时左右即可将之收录并展示到索引上。因此作为SEO，我们要对网站的信息更新频率有所认识，这是积累百度权重的重要方式，并且要控制好权重的合理传递。</p><p>12，<a target="_blank" href="http://www.dugutianjiao.com/post/baidu-xiangguansousuo-seo.html">SEO两百个秘密：&ldquo;百度相关搜索&rdquo;的秘密</a><br />百度相关搜索一直被SEO用来判断关键词搜索量高低、关键词选择优化的最好工具之一。2008年4月，百度彻底禁用了它的相关搜索功能，当你打开<a href="http://d.baidu.com/rs.php">http://d.baidu.com/rs.php</a>时，此页面已经显示为&ldquo;很抱歉，您要访问的页面不存在&rdquo;，这是继百度删除搜索结果中的&ldquo;更多相关搜索&rdquo;后的又一大举动，无疑对广大站长，特别对SEO业界是一个非常大的打击。</p><p>13，<a target="_blank" href="http://www.dugutianjiao.com/post/google-pagerank-seo.html">SEO两百个秘密：PageRank是否风采依然？</a><br />&ldquo;SEO两百个秘密&rdquo;系列肯定少不了对Google搜索引擎PageRank这一专利技术的分析。毕竟现在还是有很多SEO新手对搜索引擎优化的PageRank技术，这个使Google成为我们所热爱的搜索引擎的关键秘密感兴趣，独孤天骄也就趁这个机会再唠叨两句。</p><p>14，<a target="_blank" href="http://www.dugutianjiao.com/post/vector-space-model-seo.html">SEO两百个秘密：向量空间模型与SEO的本质</a><br />一些所谓的SEO高手，连什么叫向量空间模型都不知道，完全不了解搜索引擎的检索原理，却到处吹牛，动辄保证能把任意词做到首页。这样的保证，其实是相当苍白可笑的。因为缺乏对搜索引擎检索原理的了解，是永远也无法深入到SEO的本质之中的！</p><p>15，<a target="_blank" href="http://www.dugutianjiao.com/post/baiduimage-seo-shang.html">SEO两百个秘密：百度、Google等图片搜索引擎的SEO策略（上）</a>，&nbsp;<a target="_blank" href="http://www.dugutianjiao.com/post/baiduimage-seo-xia.html">SEO两百个秘密：百度、Google等图片搜索引擎的SEO策略（下）</a><br />图片搜索进行搜索引擎优化已经逐渐成为一种趋势。Google和百度等都有专门的图片索引库，很多新闻搜索，购物搜索，以及社会化搜索，都包括了图片搜索在内。Alexa数据显示，目前图片搜索约占百度总搜索量的12%左右，百度日本站一度曾76%以上流量来自图片搜索。我们主要介绍图片搜索引擎优化的趋势和必要性、特点，并且分析了如何让搜索引擎收录网站图片的策略，并且拟就如何提高自己网站图片文件在搜索引擎中的权重问题做一简要分析。</p><p>16，<a target="_blank" href="http://www.dugutianjiao.com/post/seo-trustrank-secret.html">SEO两百个秘密：Google TrustRank及其影响因素分析</a><br />&nbsp;Goolge TrustRank翻译过来就是Google信任指数，是Google对于网站信赖程度的指数。搜索引擎信任值，是为了确保高质量的站点能够获得搜索引擎的第一时间关注，并保证原创的优先性，从而确保好的网站能获得更高的搜索表现。</p><p>17，<a target="_blank" href="http://www.dugutianjiao.com/post/seo-sitelinks-secret.html">SEO两百个秘密：如何生成Google Sitelinks？</a><br />Google Sitelinks也叫站内链接，这种方式的索引结果在Google搜索引擎上已经存在了相当长一段时间。</p><p>18，<a target="_blank" href="http://www.dugutianjiao.com/post/seo-sandbox-effect.html">SEO两百个秘密：搜索引擎的&ldquo;沙盒效应&rdquo;</a><br />大家可能在给新网站做排名的时候，经常会遇见一个问题，那就是在百度、Yahoo等搜索引擎很容易排上的关键词，在Google则不然。一些流行度比较高的关键词，没有数月之功几乎是没有办法将排名提升上去的。这个主要是因为Google的时间因子&mdash;&mdash;&ldquo;沙盒效应&rdquo;在作怪。</p><p>19，<a target="_blank" href="http://www.dugutianjiao.com/post/seo-domain-secret.html">SEO两百个秘密：域名的选取及对SEO的影响</a><br />域名(domain)是网站独一无二的身份证，用户访问并辨别不同网站最重要的途径就是通过域名，因此决定注册或启用一个新域名的时候，必须注意域名的选取及对SEO的影响，这是网站成功的第一步。</p><p>20，<a target="_blank" href="http://www.dugutianjiao.com/post/seo-keywords-density.html">SEO两百个秘密：关键词密度的常见问题</a><br />要正确理解关键词密度，首先得理解什么是关键词？关键词就是搜索者在查找信息、产品或服务时，在搜索引擎界面中输入的词条。一般的规则是，关键词越长，从搜索引擎索引中返回的信息也就越精确。<br />关键词密度(Keyword Density)也叫关键词频率(Keyword Frequency)，所阐述的实质上是同一个概念，它是用来量度关键词在网页上出现的总次数与其他文字的比例，一般用百分比表示。</p><p>以上是4月18日前发布的SEO两百个秘密系列。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-secret-index.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=117</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=117&amp;key=5808710c</trackback:ping></item><item><title>SEO两百个秘密：内部链接在SEO中的秘密</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-internal-links.html</link><pubDate>Thu, 02 Apr 2009 00:54:43 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-internal-links.html</guid><description><![CDATA[<p>　　内部链接到底是什么？它有多重要？内部链接的优化有什么技巧吗？应该如何优化网站的内部链接？在对内部链接的优化过程中需要注意什么？本文独孤天骄将就网站优化中的内部链接优化进行细化分析，解决您的这些疑问。</p><p>　　<strong>一、什么是内部链接？</strong></p><p>　　与外部链接(即反向链接)相反，内部链接是指同一网站域名下的内容页面之间互相链接。如频道、栏目、终极内容页之间的链接，乃至站内关键词之间的Tag链接都可以归类为内部链接，因此内部链接我们也可以称之为站内链接，对内部链接的优化其实就是对网站的站内链接的优化。比如&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/seo-backlinks-secret.html">SEO两百个秘密：反向链接的秘密</a>&rdquo;这一篇文章，在此处的文字链接指向<a href="http://www.dugutianjiao.com/post/seo-backlinks-secret.html">http://www.dugutianjiao.com/post/seo-backlinks-secret.html</a>，它与本文的链接http://www.dugutianjiao.com/post/seo-internal-links.html同属于一个域名<a href="http://www.dugutianjiao.com/">http://www.dugutianjiao.com/</a>之下，所以这两个链接我们都可以称之为内部链接。</p><p>　　<strong>二、内部链接的重要作用</strong></p><p>　　我们都知道外部链接可以提高网站权威，进而促使排名靠前，那么内部链接又有什么作用呢？我在SEO三十六计中的&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/seo-paozhuanyinyu.html">抛砖引玉</a>&rdquo;一文阐述过反向链接的重要性，很多SEO项目其实到了后期就是外部链接的交换与维护，由此也可见外部链接对网站排名的重要性。但是很多SEO将外部链接当成网站优化的全部，这其实是非常错误的，因为合理地安排内部链接，尤其是大型网站，合理的内部链接部署策略同样可以极大地提升网站的SEO效果。作为SEO，我们不应该忽略站内链接所起的巨大作用。</p><p>　　首先，内部链接容易控制，成本低。你直接就可以在自己的站上进行部署，不像外部链接的不可控性比较大，需要大量的购买或长期的积累才有办法实现稳定的SEO效果。</p><p>　　其次，正确地对网站的内部链接进行<a target="_blank" href="http://www.dugutianjiao.com">SEO优化</a>，站点中网页间的互链有助于提高搜索引擎对网站的爬行索引效率，有利于网站的收录。一个页面要被收录，首先要能够被搜索引擎的蜘蛛爬行到，蜘蛛的爬行轨迹是顺着一个链接到另一个链接，想让搜索引擎蜘蛛更好地爬行，一般都需要通过反向链接来引导，但是内页的爬行就需要良好的内部链接了，如果不注意形成死链断链，蜘蛛就无从爬起，也就谈不上良好收录了。我们交换链接很少会涉及到具体的内容页面，即使别人给你的主动反向链接，一般也很少链到你的分类页或内容页，所有只有做好内部链接才能让搜索引擎的蜘蛛遍历并抓取网站的链接。长尾关键词的链接资源几乎都来自内链。</p><p>　　第三，良好的网站内部链接策略能推动网站的排名。在搜索引擎面前，一个链接就代表一张投票，外部链接就是网站之间的互相投票，而内部链接则代表了网站内的各页面互相投票。通过大量而适度的内部链接来支持某一个具体页面，有助于该内容页主题的集中，促使搜索引擎识别出哪些页面在你的网站中是重要的，进而推动该页面的排名。因此在搜索引擎优化的过程中，网站当中哪些网页参与了主要关键词的排名竞争，我们一般就会采取重点突出主要关键词的内部链接，从而使该主题中的核心关键词在搜索引擎中更具有排名优势。举个例子，我们将本<a target="_blank" href="http://www.dugutianjiao.com">SEO博客</a>内容页中的所有带SEO的文字都链接向首页，那么首页在参与&ldquo;SEO&rdquo;这个关键词的排名竞争上就会更加有优势。</p><p>　　我们可以先推排名靠前的文章，然后在循环退排名稍后的文章。比如我们发现博客中某一篇文章通过某一关键词搜索，排名在第10位。那么就可以在新发布的文章中，集中更多的链接链向这篇文章，把它的排名推到前三位。这个时候，要注意有时候你文章所谈论的某一主题的相关文章可能不止一篇，那么就应该通过搜索引擎的搜索，确定占据排名优势的那篇文章，进而集中优势内链，一直到把这篇文章推到排名第一位置。当这个关键词推到排名第一了，就应该改换关键词，再次通过内部链接来进行推动，比如当&ldquo;SEO&rdquo;这个关键词排到第一了，那么就应该推动&ldquo;搜索引擎优化&rdquo;这个关键词，在新的文章内容页出现&ldquo;SEO&rdquo;这个关键词的时候，就可以不说&ldquo;SEO&rdquo;，改说&ldquo;搜索引擎优化&rdquo;。</p><p>　　第四，内部链接还有助于PR的传递，平均站内网页的权威度。内部链接也是被搜索引擎计算到&ldquo;反向链接&rdquo;的范围之内的，获得内部链接越多的页面通常获得的PR就会越高。先举个简单的例子来证实一下，合理的内部链接的网站几乎不需要与任何网站交换友情链接，PR即可达到3以上，就是这个道理，这也是为什么往往大型网站的PR比较高的原因。一些文章页面的收录情况或者PR传递不是很理想的话，我们就可以有意识地多做一些内部链接过去，这样可以促进收录和提高排名。</p><p>　　第五，内部链接可以提高用户体验度，增加PV，提升访问量。表现为相关文章，热门文章，最新文章等的内部链接很容易提高用户的访问体验，部署优秀的内部链接越多，页面被点击的机会就越大，PV的增加越显而易见。这些相关文章的内部链接不能滥用，应该尽量链接到相似主题的文章，否则就谈不上提升用户的体验度了。</p><p><strong>　　三、怎样制作网页的内部链接呢？</strong></p><p>　　独孤天骄认为，为了保持优化的自然，尽可能不要靠程序来实现内部链接，依靠手工准确度会更高。当然，如果是大型网站就得依靠程序的自动化了，否则那么多的相关文章工作量之大是难以想象的。具体内容页要做内部链接的时候，一般要当提到和本页内容相关的关键字时，才做一个链接指向该页面，这样不仅让用户了解到更多相关内容，同时也增加了PV和用户体验。比如独孤天骄在写博客的时候，当提到以前所写作的帖子时，一般就不再重复，直接做一个内部链接指向过去，读者需要拓展阅读的时候就可以点击进去。</p><p>　　这样做，还有一个好处，可以让搜索引擎在收录的时候，爬到更多相关的内容，增加收录量和页面的权重。</p><p><strong>&nbsp;　　四、网站内部链接优化的方法有哪些？</strong></p><p>　　网站内部链接的优化有哪些具体的方法呢？下面我们讲讲网站优化过程中内部链接优化的技巧。</p><p>　　1，网站导航。网站的栏目导航应该按照重要度来进行排序。重点要推的栏目链接放置在靠前面。另外要注意各个频道、栏目的导航尽量使用文字，避免js、Flash和图片链接，这样有助于搜索引擎的顺利抓取。网站导航中的链接文字应该准确、自然地描述所指向页面的内容，这样也方便搜索引擎通过链接文字了解这些栏目页的具体内容。</p><p>　　2，网站地图的建立。建一个将所有内容终极页都包含在内的完整网站地图(sitemap)，也就是全站文章索引页，同时将这个链接放置在首页上，以便搜索引擎发现和抓取该sitemap页面；如果是大型网站可以按照栏目列出最主要的类别即可。</p><p>　　3，404错误页面的建立。自定义的404页面会使网站显得更加友好，并且捕获那些差一点就消失的流量。不过请记得，404页面起码要留一个返回到网站首页的链接，这个页面可以是一些温馨的提示，也可以放置一些网站重点要推的栏目或文章。</p><p>　　4，FAQ页面的建立。这个视情况而建。在FAQ页中，列出读者常见的问题，在内容中使用他们搜索问题时喜欢使用的关键词，在内容中使用链接指向具体的文章内容页，这样可以提高该页的搜索排名。</p><p>　　5，网站的页面页脚。页面一般是用来介绍网站的主题，页脚用来放置版权信息等，这些地方我们可以适当地部署上最核心的关键词，并且给一个返回首页的链接。但是这个地方的优化是有争议的，记得SEO的时候要自然。所有页面底部都放上了特定锚文本的内部链接有时候会导致被Google惩罚。</p><p>　　6，相关链接的使用。在文章内容页列出与其相关的文章、热门的文章、推荐的文章、随机的文章、TAG、上一篇、下一篇文章等，这些都是网站的内部相关性链接。这样容易增加用户的黏性，同时提升网站的流量。</p><p>　　7，写总结性文章或者设置专题。一般来说，对于博客，月总结是必要的，可以将本月所写过的文章进行简短介绍，同时将链接指向具体的内容页。或者将同一主题内容归纳到一个文章之内，比如这篇<a target="_blank" href="http://www.dugutianjiao.com/post/seo-sanshiliuji.html">SEO三十六计系列总目录</a>。大型网站更喜欢通过专题来实现这个目的。腾讯网的专题一般就是将之前发布的文章利用链接重新进行整合。</p><p>　　8，具体内容页的内部链接指向锚点关键字尽量使用原文章标题。如果在内容页里面提到另外一篇文章，尽量使用原文章标题，避免使用&ldquo;点击这里&rdquo;等关键词来进行链接，内容中出现的相关关键词，可以适当地链接回包含该关键词的页面。网站的编辑人员要将这种内部链接的部署当成一种习惯。SEOmoz的randfish对于内链锚文本有一些结论，&ldquo;1，内部链接指向首页的锚文本效果很小，并不会对首页的关键词排名有多大帮助。2，有时候并不是所有的内部链接的锚文本都能传递链接价值。&rdquo;因此，内部链接如果是链接到首页则不需要太注重链接文字的优化，但是内页之间的链接则需要适当注意链接文字技巧。我们在做内部链接时除了要注意数量，还要注意尽量对同一个链接使用多个锚文本，以提高链接价值。当然，randfish的这次试验，只针对Google进行，以上的结论不一定适用于其他搜索引擎。而且所有的SEO试验，都有局限性，并不会完全准确。</p><p><strong>&nbsp;　　五、内部链接需要注意哪些事项？</strong></p><p>　　1，尊重用户的体验，注意链接的相关性，内部链接不要太过泛滥。相关性高的链接有助于提高搜索引擎收录，并且有助于提升用户体验，增加用户的黏性，进而提升网站的浏览量。如果一篇文章出现了50次SEO这个关键词，你总不能每次都给加上内部链接吧？这样只会让读者反感。正文当中相同的一个关键词出现很多次，只需要做一次链接就可以。</p><p>　　2，内部链接一定要保证URL的唯一性。特别是动态网站静态化处理过的，只能保留一个链接。链接到具体的页面都只能有一个链接，不能一会链接到<a href="http://www.dugutianjiao.com/">www.dugutianjiao.com</a>，一会又链接到<a href="http://www.dugutianjiao.com/index.html">www.dugutianjiao.com/index.html</a>，这样的次数多了，很容易导致搜索引擎无法判断那个是正确的链接页面，进而将之归入重复页面，从而无法获得任何权重。</p><p>　　3，内部链接要注意放置死链和断链。内部链接的速度同样是衡量网站可靠性的一个重要参数，一个好的空间或一台好的服务器很重要。</p><p>　　4， 每个页面的内部链接数量要有控制。如果页面中的内部链接数量超过限制，搜索引擎就可能会忽略该页面，或者忽略该页面中超出限制的那部分链接所指向的目标页面。一般来说，一个页面的内部链接数要限制在100个以内。</p><p><strong>　　六、如何查看你的内部链接优化是否成功?</strong></p><p>　　首先，一个好的内部链接网站往往体现在搜索引擎的收录量上。一个网站的收录量如果稳定并且持续增加，则意味着至少这个网站的内部链接处理得较为到位。</p><p>　　其次，如果网站有好的整体结构，整个网站的PR传递应该是很均匀的，首页最高，栏目页次之，内容页再次。如果你有意识地通过内部链接策略推动某些重要页面，那么是可以通过网页的链接影响PR的，当这些页面的PR值和重要性升高的时候，也就意味着你对内部链接的优化是成功的。</p><p>　　<strong>拓展阅读：</strong><br />　　SEO三十六计系列总目录：<a href="http://www.dugutianjiao.com/post/seo-sanshiliuji.html">http://www.dugutianjiao.com/post/seo-sanshiliuji.html</a><br />　　SEO两百个秘密：反向链接的秘密：<a href="http://www.dugutianjiao.com/post/seo-backlinks-secret.html">http://www.dugutianjiao.com/post/seo-backlinks-secret.html</a><br />　　该文已经被收录到百度百科：<a href="http://baike.baidu.com/view/2333363.htm">http://baike.baidu.com/view/2333363.htm</a></p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-internal-links.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=104</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=104&amp;key=b68d2cc4</trackback:ping></item><item><title>SEO两百个秘密：如何正确使用Heading标签</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/how-to-use-heading.html</link><pubDate>Mon, 02 Feb 2009 23:39:51 +0800</pubDate><guid>http://www.dugutianjiao.com/post/how-to-use-heading.html</guid><description><![CDATA[<p><strong>SEO两百个秘密：如何正确使用Heading标签</strong></p><p>HTML语言里一共有六种大小的heading 标签，最重要的是H1，权重依次降低，一直到H6。</p><p>Heading 标签（注意和 HTML 中的<a target="_blank" href="http://www.dugutianjiao.com/post/keywords-description-seo.html">&lt;head&gt;标签</a>进行区别）通常用来为用户展现网页的结构，由于heading 标签通常会使某些文字比普通的文字大，对于用户来说，这样可以便于他们更直观地看出这些文字的重要性，而且可以帮助他们理解heading文字下方的内容。多种渐变大小的heading一开始主要为网页的内容创建分层结构，便于用户直观地浏览网站。不过目前SEO届普遍将heading 标签作为丰富文字形式的手段，这其实并不可取。</p><p>有感于许多<a target="_blank" href="http://www.dugutianjiao.com/">SEO</a>滥用Heading标签，因此独孤天骄在这里统一说说这个标签都使用需要注意一些什么问题。</p><p><strong>Heading 标签的推荐使用方法</strong></p><p>我们先来看一个范例：</p><blockquote dir="ltr" style="margin-right: 0px"><p>&lt;html&gt;<br />&lt;head&gt;<br />&lt;meta http-equiv=&quot;Content-Type&quot; content=&quot;text/html; charset=gb2312&quot;&gt;<br />&lt;title&gt;正确使用 heading标签&lt;/title&gt;<br />&lt;/head&gt;<br />&lt;body&gt;<br />&lt;h1&gt;如何正确使用heading标签呢？&lt;/h1&gt;<br />&lt;h2&gt;heading 标签的定义&lt;/h2&gt;<br />&lt;/body&gt;<br />&lt;/html&gt;</p></blockquote><p>我们假设这是一个内容页，那么我们可以把内容页的名字放到一个&lt;h1&gt;标签里面，然后将最重要的章节或标题放到一个&lt;h2&gt;标签里。一般来说，对这个内容页面，页面上的要点和次要点我们会用不同的Heading标签来进行区别。看到过报纸的排版吗？请将你手边的报纸拿出来，翻到有报告文字板块的地方。一篇提纲式的报告是怎么写的呢？相信您了解了报纸的排版之后，对Heading标签的使用就心中有数了。</p><p>这些含Heading标签的文字应该有助于读者理解页面的结构，而不应该滥用这一标签，比如将所有你认为重要的地方都加了&lt;h1&gt;标签，这样反而会适得其反。所有点都是重点，就是所有点都不再成为重点。英文里面有句俗谚叫&ldquo;no news is good news&rdquo;，没有消息就是最好的消息。套用下这句谚语，&ldquo;no heading is good heading&rdquo;，&ldquo;没有Heading标签就是最好的Heading标签&rdquo;。独孤天骄并非鼓励不使用Heading标签来进行SEO。相反，Heading标签对SEO（<a target="_blank" href="http://www.dugutianjiao.com/">搜索引擎优化</a>）极端重要。但是就类似于你将整个内容页的文字都加粗一样，如果当一个页面上有过多的heading标签， 就会对用户浏览内容和分辨出某个标题的起始带来不便。<u>所有都加粗了的文字也就等于所有的文字都没有加粗，同样所有加了heading标签的文字也就等于没有加这一标签</u>。</p><p>有些初学SEO者片面地重视了Heading标签的重要性，所以往往将通篇内容页的文字都包括在一个H1标签里面，或者过渡地使用这一标签。一般来说，一个页面，只允许有一个H1标签，H2标签适当可以提高到2个，H3标签可以提高到3个左右。&nbsp;过度地使用heading标签并没有任何好处。</p><p>细心的读者一定也发现了SEO研究院也在使用Heading标签，大家不妨一起来看下现在这个内容页的源代码，以此作为SEO时候的参考。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/how-to-use-heading.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=75</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=75&amp;key=86db446b</trackback:ping></item><item><title>SEO两百个秘密：Nofollow标签的定义和使用</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/nofollow-tag-seo.html</link><pubDate>Fri, 30 Jan 2009 20:41:52 +0800</pubDate><guid>http://www.dugutianjiao.com/post/nofollow-tag-seo.html</guid><description><![CDATA[<p class="breadcrumbs">Google的<font color="#0000cc"><a href="http://www.google.cn/support/webmasters/">站长中心</a></font>里面有篇关于rel=&quot;nofollow&quot;标签的帮助，大家可以参阅。</p><p class="breadcrumbs"><a target="_blank" href="http://googleblog.blogspot.com/2005/01/preventing-comment-spam.html">2005年Google率先引入</a>一个防止垃圾链接的规范，开始支持对链接的&ldquo;nofollow&rdquo;属性(&ldquo;rel=&rsquo;nofollow&rsquo;&rdquo;)。这是当时<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>（搜索引擎优化）界一个争论四起的热点新闻事件。毕竟&ldquo;nofollow&rdquo;属性剥去了链接的价值，而链接对于SEO的影响巨大。</p><p class="breadcrumbs"><strong>一、Nofollow标签的定义：</strong></p><p class="breadcrumbs">最初，nofollow 属性出现在网页级元标记中，指示搜索引擎不要追踪（即抓取）该网页上的所有外向链接。 例如：&lt;meta name=&quot;robots&quot; content=&quot;nofollow&quot; /&gt;。<span style="font-size: 10pt">这个语句将</span><i><span style="font-size: 10pt">nofollow</span></i><span style="font-size: 10pt">该网页的所有链接。</span></p><p class="breadcrumbs">后来，Google将这一标签属性单独提出，加于独立链接之上，例如： &lt;a href=<a href="http://www.dugutianjiao.com">http://www.dugutianjiao.com</a> rel=&quot;nofollow&quot;&gt;SEO研究院&lt;/a&gt;，则表示告诉搜索引擎&ldquo;不要追踪此网页上的链接&rdquo;或&ldquo;不要追踪此（SEO研究院）特定链接&rdquo;。Google不会追踪带Nofollow的链接，这些链接中的PageRank 或定位文字不会被Google传送。</p><p class="breadcrumbs"><strong>二、nofollow标签是否确实有用？</strong></p><p>维基百科现在对所有的外部链接增加了&ldquo;nofollow&rdquo;属性，这样做的原因是为了对抗垃圾链接，像那些黑帽seo。改动已经生效。</p><p>正确使用nofollow标签对屏蔽搜索引擎垃圾发送者有很大作用的。<strong>一个链接只要被加上了nofollow属性，则无论如何操作，都不会被Google等搜索引擎赋予较高的权重。</strong>使用了nofollow标签的链接严格意义上并不算真正的外部链接，起码不算是有效的、在SEO上起作用的外部链接。当然，它只针对支持这一标签的搜索引擎而言。Google，Yahoo，MSN表示支持这个标签，百度目前并不支持这一标签。</p><p>中文搜索市场超过一半是百度的天下，只要百度不支持这个链接属性，nofollow就无法真正流行起来。垃圾链接在百度还是很起作用的，因此垃圾留言者绝不会因为nofollow而停手。</p><p>不过，需要注意的是，nofollow的链接百度依然会爬，因此即使被加了这一标签的链接，仍然有助于提高百度的收录甚至是排名。而且即使是针对Google而言，放置了nofollow标签，Google还是会索引部分链接内容。</p><p>根据独孤天骄的观察，加了nofollow属性，Google是否真的会将权重置零还有待商榷。我想，加了这一属性的链接应该也不会被认为是不&ldquo;信任&rdquo;的，其作用应该是对网站主而言，标示该链接&ldquo;无关紧要&rdquo;。比如一个娱乐类的博客链接了SEO研究院，这一链接加了nofollow标签，Google应该会将其理解成，对这个娱乐博客来说，SEO研究院这个链接因为主题不一致，是无关紧要的。</p><p class="breadcrumbs"><strong>三、什么情况下需要使用 nofollow 标签及使用这一标签的作用？</strong></p><p class="breadcrumbs"><strong>1、垃圾链接可以考虑使用nofollow标签。</strong>比如一些博客程序里面的用户评论或留言信息，以及一些论坛帖子里面的链接这一类最多垃圾链接出现的地方。通过nofollow这一类链接，也可以有效防止了自己的网站被牵连处罚。举个例子，当你在写文章并不得不引用某个垃圾网站时，比如您正准备揭发一个垃圾网站，显然你不会愿意将自己网站的权重传递给它，这个时候使用nofollow就再合适也不过了。</p><p><strong>2、付费链接或广告内容类的链接可以考虑使用nofollow标签</strong>。网站在 Google 搜索结果中的排名部分取决于对链接到该网站的其他网站的分析。为了防止付费链接影响搜索结果并对用户产生不利影响，Google建议网站管理员在此类链接上使用 nofollow。</p><p><strong>3、次要级别的链接可以使用nofollow标签予均衡全站的链接权重传递。</strong>也就是说，一个网站的内部链接也可以使用nofollow标签，以达到控制内部链接权重和PR流动及分布的目的。比如一些联系我们，隐私政策，版权申明等链接，流动到这些网页的权重往往是浪费了。&nbsp;</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/nofollow-tag-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=74</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=74&amp;key=b3a12d30</trackback:ping></item><item><title>SEO两百个秘密：关键词的选择策略</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/keyword-selection.html</link><pubDate>Sat, 17 Jan 2009 17:46:14 +0800</pubDate><guid>http://www.dugutianjiao.com/post/keyword-selection.html</guid><description><![CDATA[<p>所有网站的<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>都必须围绕关键词来展开，否则它就不可能从搜索引擎获取有效的导入流量。</p><p><strong>一、什么是关键词</strong></p><p>关键词，就是您输入搜索框中的文字，也就是您命令搜索引擎寻找的东西。关键词可以输入任何内容，比如人名、网站、新闻、小说、软件、游戏、星座、工作、购物、论文等。关键词，可以是任何中文、英文、数字，或中文英文数字的混合体。关键词，您可以输入一个，也可以输入两个、三个、四个，您甚至可以输入一句话。输入多个关键词搜索，可以获得更精确更丰富的搜索结果。目前，大多数人搜索时使用平均2-5个关键词。</p><p><strong>二、关键词的定位</strong></p><p>要想挑选正确的关键词，首先必须对关键词进行深入的分析。好的关键词应该具有较高热度，不会因为热度不够，而即使关键词排名提升之后，仍然没有流量被有效引入；好的关键词还应该是竞争力度不是太过激烈，不会给SEO工作带来极大困难，花费大量精力和财力却长时间达不到预定目标。</p><p>所以，作为SEO，对关键词的分析，我们应该注意以下两点：</p><p>1、<strong>关键词定位应该精准！不能过于宽泛，也不能太过冷僻。</strong></p><p>大家都知道，百度搜索风云榜上面的关键词搜索量巨大，比如下图的这些关键词，肯定不是一朝一夕能够排名上去的。</p><p><img height="301" alt="百度搜索风云榜" width="207" src="http://www.dugutianjiao.com/upload/2009/1/baidu-top.jpg" /><br />百度搜索风云榜-Top50</p><p>而且一些通过关键词比如手机、机票等，竞争者更是多不可胜数，即便能排到前面，所带来的流量也并不具有很强的目标性，<a target="_blank" href="http://www.dugutianjiao.com/post/liuliang-zhuanhuan.html">订单的转化率也很低</a>。</p><p>当然，太过冷僻的关键词即使取得好排名了，没有用户搜索，所引入的流量和有效用户量将会很小。</p><p><strong>2、关键词的竞争力度不能过大，以免给自己的SEO工作造成过大困难。</strong></p><p>在初步得出一些关键词词库之后，我们还必须研究这些关键词的竞争程度。</p><p>通常判定一个关键词的竞争程度，我们首先看搜索引擎在搜索结果右上角列出的这个关键词所返回的总相关网页数。其次可以看下这个关键词在搜索引擎比如在百度上第一页是否充满着竞价广告。第二点我们可以进行适当的拓展，比如我们还可以在Google Adwords上面查询这个关键词在竞价广告中需要付多少钱。可以使用这些工具，<a target="_blank" href="https://adwords.google.com/select/KeywordToolExternal">Google的关键词竞价选择工具</a>，<a target="_blank" href="http://www2.baidu.com/inquire/dsquery.php">百度的竞价关键词工具</a>，<a target="_blank" href="http://chaxun.sina.com.cn/">新浪的搜索引擎竞价查询</a>等。你想一想为什么这么多人要投放竞价广告就明白这个关键词的竞争程度了。竞价程度激烈说明该词是符合搜索需求，有一定的转化率，否则不会那么多同行去竞价，竞价越激烈说明该词的综合商业价值越高。这些词是完全值得我们去认真考虑的。最后查询下这些关键词被搜索的次数。目前百度的指数工具还开放着，可以直接查询，不过<a target="_blank" href="http://index.baidu.com">百度指数</a>有些水分，不一定是这个关键词被真正搜索的次数，SEO要懂得客观看待。另外，我们还可以通过查询Google的趋势工具来进行判断。</p><p><strong>三、关键词的研究分析和选择策略</strong></p><p>关键词的研究和选择是搜索引擎营销活动中至关重要的一步。独孤天骄认为，关键词的选择就是基于研究用户的关键词搜索行为之后的选择。在选择关键词时，我们必须先进行调查，首先调查用户的搜索习惯。把自己放在用户的角度上，比如这个用户要在网站上购买手机，机票，他会在搜索引擎上面通过搜索什么词汇来获取信息？最有效率的关键词就是那些竞争网页最少，同时被用户搜索次数最多的词。有效关键词指数(KEI，Keyword Effectiveness)就是指这类价值极高的词。关键词选择非常重要，一旦不慎选择错误，后面的优化工作就等于在做无用功了。所以我们建议大家在搜索引擎优化（SEO）的过程中，将目标关键词做成一个文档，对于大型网站，主要要做到就是对网站的关键词进行分类并分清主次。</p><p>选择关键词的要注意如下几点：</p><p>1、确定核心关键词。当某个人在搜索引擎上查找类似的信息时，他可能使用的关键词有哪些?</p><p>2、核心关键词定义上的扩展。其实这个时候我们涉及到的关键词已经可以称之为长尾关键词了。这个拓展上面可以通过我自身的判断，所选择的关键词应该比较具体，有针对性，越长尾关键词针对性越高。</p><p>比如将同一个产品的不同名称（也许是叫法各异，也许是各地方叫法不一致）进行优化，不同地区的同一产品进行细化，并且将核心关键词与厂商、品牌、区域等进行组合，这样的关键词的竞争压力将小很多。如三星手机、中国导弹、福建SEO等，甚至与产品特性组合，如光电鼠标、真皮皮带、玻璃茶环等，进行多重排列组合，如彩屏和弦手机、数字高清电视、真皮单人沙发等。还可以通过模拟客户思维来进行核心关键词的拓展，毕竟每个人的习惯各异。比如有的人可能搜索&ldquo;福建 SEO&rdquo;，有些人可能就搜索&ldquo;SEO 福建&rdquo;，甚至还有些人会搜索&ldquo;福建+SEO&rdquo;等等。</p><p>在用户的所有搜索行为中，有研究证明，20％的关键词产生了80％的访问量，而且这20％访问量的关键词转化率可能更高！这些看起来微不足道的流量，汇聚成了用户每月60%以上的订单。在关键词分析中，尤其是产品类的传统制造业企业站点中，长尾关键词是绝对不能忽略的。具体而言，长尾关键词的扩展形式无穷无尽。不同类型关键词的扩展方式不同。</p><p>一般情况下长尾关键词需要通过关键词分析工具来获得，但大致的常见关键词长尾可包括以下几种：</p><p>相关关键词词根排列组合而成。比如你做一部电影的关键词，那么可以拓展到这部电影的演员、剧情、下载（各种下载工具）、在线视频、片尾曲、剧集介绍等来排列组合而成。</p><p>添加一些语气助词等等。&ldquo;福建的SEO&rdquo;跟&ldquo;福建SEO&rdquo;搜索出来的结果肯定不大一样。</p><p>问答式的关键词。比如&ldquo;某某产品好不好？&rdquo;，&ldquo;什么是SEO&rdquo;等。</p><p>3、我们可以利用搜索引擎的关键词工具。以前的百度相关搜索非常实用，可惜被<a target="_blank" href="http://www.dugutianjiao.com/post/baidu-xiangguansousuo-seo.html">关闭</a>了。不过我们还可以使用Google Adwords的相关工具，进一步扩展关键词列表。在这一步骤，我们还可以研究竞争者的关键词列表，主要是查阅他们网站内容页的<a target="_blank" href="http://www.dugutianjiao.com/post/seo-title-secret.html">标题标签</a>。浏览他们的网站，看看是否有还没注意到的关键词，这样可以更好的完善关键词列表。</p><p>4、网站的统计分析也非常有利于我们对关键词的完善。经常查看用户都是通过哪些关键词搜索来到你的网站。通过研究这些关键词列表，我们将会发现哪些关键词具有更高的潜力，作为SEO，我们完全可以针对这些关键词写新的网页内容。</p><p>最重要的一点，无论是什么样的关键词，都必须要和网站内容切切相关，网站内容从另外一方面又烘托着目标关键词。绝对不应该一个卖手机的销售网站，充满着无数的人体艺术类的关键词。</p><p>参考文献：<br />电子商务网站关键词选择详解：<a href="http://www.dunsh.org/2006/09/14/ecw-keywords/">http://www.dunsh.org/2006/09/14/ecw-keywords/</a>，樂思蜀。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/keyword-selection.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=68</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=68&amp;key=dfa87fc2</trackback:ping></item><item><title>SEO两百个秘密：网站信息更新频率与关键词的SEO排名</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/site-update-seo.html</link><pubDate>Sat, 03 Jan 2009 20:20:28 +0800</pubDate><guid>http://www.dugutianjiao.com/post/site-update-seo.html</guid><description><![CDATA[<p>百度Spider原本可算是最辛勤的蜘蛛，可惜在经历许多&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/seo-chenhuodajie.html">变故</a>&rdquo;之后，已经不若Google和Yahoo的勤奋了。不过即便如此，只要你的站点权重尚可，当天更新的文章一般最多隔天即可收录。</p><p>举个例子，我在12月30日当天搜索了自己<a target="_blank" href="http://www.dugutianjiao.com">SEO博客</a>的快照，发现当天百度对网站进行了更新，同时体现在一些相关关键词的索引上，比如&ldquo;SEO研究院&rdquo;、&ldquo;独孤天骄&rdquo;、&ldquo;www.dugutianjiao.com&rdquo;等不常用关键词上，搜索这些关键词所显示出来的页面都已经是12月30日的快照。而SEO博客新发布的文章，一般也都是当天或隔天即见收录。<br /><img height="106" alt="SEO博客的快照1" width="516" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/1/baidu-www.dugutianjiao.com-1230.jpg" /></p><p>随着优质页面的更多收录，整站的权重也将逐渐累积得更高，到一定程度，你刚发布的文章，百度就会像其对新闻源网站的更新，一个小时左右即可将之收录并展示到索引上。因此作为SEO，我们要对网站的信息更新频率有所认识，这是积累百度权重的重要方式，并且要控制好权重的合理传递。</p><p><strong>1，网站搜索结果中的信息更新频率和站点的信息更新频率是不同步的</strong></p><p>我们在这里必须区分下两个概念，网站的信息更新频率其实包含了站点自身的信息更新频率和站点搜索结果信息的更新频率两个方面的内容，这是不一样的。</p><p>比如，我举同样的例子，百度在30日这天再次索引了SEO博客的首页，但是当你搜索&ldquo;SEO&rdquo;这个关键词时，我们不难发现，百度索引对本SEO博客的快照更新则停留在12月24日这一天，并未同时更新。</p><p><img height="105" alt="SEO博客的快照2" width="517" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/1/baidu-seo-1224.jpg" /></p><p>&nbsp;也就是说，一般情况下，网站搜索结果中的信息更新频率和站点的信息更新频率是不同步的。</p><p><strong>2，如何控制网站搜索结果中的信息更新频率和站点的信息更新频率</strong></p><p>每天发布一篇原创文章，这是指你网站内容的更新频率，而如果你站点的权重不够，搜索引擎是不会马上反映到索引上面的，可能要过几天才会将你网站的更新反映到索引上，尤其是对热门的关键词的反应百度蜘蛛就更加缓慢。</p><p>能够同步当然是最为理想的，当你网站上一有信息更新，在搜索引擎中的网页对应的网页索引信息就会做出相应的更新，这只有站点的权重累积到一定程度才有可能。</p><p>怎么才能将这种可能控制住呢？也就是说，从SEO（<a target="_blank" href="http://www.dugutianjiao.com">搜索引擎优化</a>）的角度看，作为SEO，我们应该如何控制网站信息的更新频率才能保证网站优化效果？</p><p>首先，站点自身信息的更新频率是影响站点搜索结果信息的更新频率的主要因素。假设说SEO博客半年更新一篇文章，那么搜索引擎蜘蛛肯定是不会再经常造访这个网站的，久而久之，即使后来你发布了一个内容，也就不大容易被搜索引擎收录了。当然，通过网站的信息更新频率的传递，我们可以通过在一个信息更新频率高的网站做一个外部导出链接，吸引蜘蛛的造访，加快我们自身网站内容的收录。</p><p>其次，只要不是为了更新而更新，而是真的有原创的或者优质的内容需要提供给访客，那么就应该更新。像SEO研究院差不多每天一贴，这样每天更新，搜索引擎也养成习惯，知道你每天一篇，所以就每天来一次。不同的网站类型的更新频率是不一样的，搜索引擎绝对可以判断出网站的大致类型的。SEO研究院作为前沿的SEO博客，经常更新就显得很必要，而如果是产品类的企业网站，更新频率也许就是一周甚至一个月乃至半年一次了。这种类型的关键词的排名一般都比较稳定，也出自于此种原因。</p><p>第三，我们还需要观察关键词竞争程度。我们应该先搜索下关键词的热门或冷僻程度。在上面两张图中，我们可以看到，独孤天骄的SEO博客天天更新，但是在热门关键词上，百度搜索引擎的索引就隔了更多时间才更新一次。也就是说，百度索引对热门关键词排名的更新可能就不是一天更新一次，也许就是一个礼拜更新一次，甚至更长时间了，对企业站类等特定关键词的排名更新周期有可能就更加长了。有兴趣的SEO可以自己跟踪取证一下。对竞争程度不高的一些词，很少更新的网站或一两篇很老的信息内容页，都可以达到比较好的排名。但如果关键词竞争程度很厉害，靠静止的网站，往往不能达到最好的效果。比如关键词&ldquo;SEO&rdquo;的排名，前十的一般都是每天都有新信息的发布。</p><p>最后，需要说明的是，内容的持续更新是网站得以生存与发展的最基本条件，是网站的根本，无论用户还是搜索引擎，均不可能对一个长期不更新的网站投入过多的关注。</p><p><strong>3，经常更新的网站更容易得到搜索引擎的青睐吗？</strong></p><p>一般情况下当然是，不过也有例外的时候，独孤天骄主要分为三种情况来看待，一是站点类型，二是信息类型，三是修改类型。</p><p>比如一些产品类的企业网站，不太常更新可能更符合行业的实际情况，因此搜索引擎对这类网站的更新一般相应都延长了周期，这些企业类的产品关键词一般也都比较稳定，有些网站一年半载没有更新，不过关键词排名却非常稳定，就源于此。当然，如果你是个博客的话，没有更新，可能排名就会一落千丈。假设说独孤天骄的SEO博客半年没有更新，我想肯定无法在SEO这个关键词上获取好的排名的。这是基于站点类型上的考虑。</p><p>还有一种则是基于信息类型的考虑。如果你天天更新，但是都是采集类的内容，跟一个网站每周更新，但都是原创优质内容，排名上肯定是有区别的。尤其当你几万几十万的信息一直发布，搜索引擎再傻也知道你是采集信息站，我曾经实验过一个案例网站，每天发布5000篇，一共是30万篇信息，连续发布了两个月，百度流量很快达到1万ip每天，但是三个月过后，这个网站马上被百度封杀了，Google则对这个网站采取了降权，每天所引入的ip不到200。怎么发布采集信息类文章是一种策略，以后有机会，我们另文讲述。</p><p>另外一种情况，则是为更新网页而更新网页。这种修改类型效率其实不高。许多网站在没有实质性内容时采用类似于&ldquo;今日链接&rdquo;、&ldquo;今日摘要&rdquo;的方式保持网站的更新，似乎便有类似的考虑。作为<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>，我是很排斥为了告诉搜索引擎我的网页更新了，而在网页布局上更改一下，文字位置上调换一下，对用户没有任何实质影响，只是希望搜索引擎觉得网页已经更新了的做法。如果单纯仅是为了吸引蜘蛛的爬行，以便发布信息时能立马显示在索引上，我一般建议企业网站创设博客。举个例子，如果你有一个企业站，半年更新一次，蜘蛛也养成了半年爬一次的习惯，那么当你发布新产品的时候，难道要等半年用户才能在搜索引擎上搜索到你的产品？当然，我们还是可以通过外部链接吸引蜘蛛，这是另外的话题了。</p><p>由此可见，网站是否需要更新，以及对排名的影响，视具体情况而定，没有一成不变的规则。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/site-update-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=59</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=59&amp;key=c76e9d35</trackback:ping></item><item><title>SEO两百个秘密：“百度相关搜索”的秘密</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/baidu-xiangguansousuo-seo.html</link><pubDate>Thu, 01 Jan 2009 23:47:44 +0800</pubDate><guid>http://www.dugutianjiao.com/post/baidu-xiangguansousuo-seo.html</guid><description><![CDATA[<p>百度相关搜索一直被SEO用来判断关键词搜索量高低、关键词选择优化的最好工具之一。2008年4月，百度彻底禁用了它的相关搜索功能，当你打开<a href="http://d.baidu.com/rs.php">http://d.baidu.com/rs.php</a>时，此页面已经显示为&ldquo;很抱歉，您要访问的页面不存在&rdquo;，这是继百度删除搜索结果中的&ldquo;更多相关搜索&rdquo;后的又一大举动，无疑对广大站长，特别对SEO业界是一个非常大的打击。</p><p>有需求就有市场，这话一点不假，但是做<a target="_blank" href="http://www.dugutianjiao.com">SEO</a>其实不能光顾及经济效益，要考虑到长期发展。这无疑让人再次联想起那一段时间，SEO们疯狂地刷百度相关搜索排名的情景，本来独孤天骄并不想涉及这个话题的，因为多少总有些<a target="_blank" href="http://www.dugutianjiao.com/post/seo-mantianguohai.html">黑帽SEO</a>的味道，但无意之间发现，即使现在在搜索引擎的搜索结果上仍然可以看到许多&ldquo;专业&rdquo;的刷百度相关搜索排名的公司，其业务包括代刷百度相关搜索，代发百度快照排名等。</p><p><img title="" alt="" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/1/shua-baidu-xiangguansousuo.jpg" /></p><p>SEO市场就这样让黑帽手法给搅乱了，最终导致了百度彻底关闭这一通道的严重后果。不知道这些黑帽SEO现在有什么感想？</p><p><strong>一、什么是相关搜索？</strong></p><p>我们能查到的资料大致上是说：把大量用户进行搜索的输入词进行分词和索引，然后当每一次进行搜索的时候，对这个&ldquo;搜索的关键词索引&rdquo;进行搜索，就得到了相关搜索。</p><p>对近意词进行相关性矩阵运算，得到带有权重的系列词汇的列表，再进行上面的基本的搜索。</p><p>例如：相关（学校）=0.6学校+0.3教育+0.2教师+0.2学生+&hellip;&hellip;，那么学校的相关搜索应该是学校本身的搜索+0.6权重下的学校搜索的相关搜索，0.3权重下的教育的相关搜索&hellip;&hellip;，再进行排序得到最相关的搜索。</p><p><strong>二、百度相关搜索的好处</strong></p><p>百度相关搜索排名原本确实是个好东西，它可以&ldquo;曲线救站&rdquo;。我随便举两个例子：</p><p>1，当您的潜在顾客搜索某些关键词的时候，比如在百度搜索腕表，您是不是想把您的手表品牌，比如&ldquo;yami腕表手机&rdquo;显示在百度最下面的相关搜索中呢？</p><p><img alt="百度搜索腕表的相关搜索" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/1/baidu-wanbiao-search.jpg" /></p><p>当你把yami腕表手机排到了相关搜索前十名之上的时候，是不是就增加了更多的曝光率？是不是就更有可能获得更多的潜在用户的点击？</p><p>2，你当然非常乐意看见你的产品出现在上面的相关搜索列表之中了。但是在<a target="_blank" href="http://www.dugutianjiao.com/post/seo-jinchantuoqiao.html">搜索引擎危机</a>中，估计你就不乐意了。举个例子，当你搜索一个关键词&ldquo;减肥产品&rdquo;的时候，出现如下图的相关搜索，当这个相关搜索出现了你的产品关键词后面跟着骗子之类的词怎么处理？假设说这个列表出现了&ldquo;安利减肥产品是骗子&rdquo;估计作为企业主的你就不乐意了，这个时候怎么办呢？很显然，要解决搜索引擎危机，还得利用百度的相关搜索来进行解决，清除相关搜索负面词。</p><p><img alt="百度减肥产品相关搜索" onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2009/1/baidu-jianfeichanpin-search.jpg" /></p><p><strong>三、百度相关搜索的原理</strong></p><p>把相关关键词做上去的方法很难吗？真的需要&ldquo;专业&rdquo;的公司来操作吗？其实只要你稍微懂得SEO的一些常识就可以解决。说破了，无非就两个思路，一个是增强相关性的关键词搜索，其次是增加搜索量。</p><p>目前&ldquo;专业&rdquo;的SEO大部分方法都是通过黑帽类的方法来刷百度相关搜索，他们通过代理刷，通过ADSL换IP刷，通过清cache等方式来刷， 一般都是通过垃圾站进行iframe<font color="#000000">跳转搜索页地址来实现的。以前这种方法百试百灵，不过目前百度更改了算法，早晚有一天这个方法是行不通的，比如到时候，热门关键词的相关搜索有百度的人工来控制的话？SEO研究院不建议做这种违反百度政策的事，我们在这里披露技术细节，也仅仅供SEO爱好者学术研究所用。&nbsp; </font></p><p>刷相关搜索的原理很多人不明就理，觉得很神奇，其实说破了很简单，比如当你搜索一个关键词如&ldquo;SEO&rdquo;时，然后你发现这个关键词似乎不大合乎自己的搜索请求或者没有找到自己所要的，于是就直接在搜索框再次键入其他相关关键词如&ldquo;SEO研究院&rdquo;，然后找到了所需要的网站。那么我们就可以说&ldquo;SEO研究院&rdquo;是关键词&ldquo;seo&rdquo;的相关搜索，当很多人都这样搜索的时候，即搜索量大了时，关键词&ldquo;SEO研究院&rdquo;就会出现在百度的相关搜索中。明白个中道理，你想刷百度的相关搜索就非常简单了。比如你要将&ldquo;SEO研究院&rdquo;刷到SEO的相关搜索上面，让它在&ldquo;seo&rdquo;相关搜索出现。</p><p>首先在百度搜索&ldquo;SEO研究院&rdquo;，出来的地址是：<a href="http://www.baidu.com/s?wd=seo%D1%D0%BE%BF%D4%BA">http://www.baidu.com/s?wd=seo%D1%D0%BE%BF%D4%BA</a>；然后接着在原来那个搜索了&ldquo;SEO研究院&rdquo;之后的搜索框里继续搜索&ldquo;SEO&rdquo;，出来的搜索结果链接就是：<a href="http://www.baidu.com/s?ie=gb2312&amp;bs=seo%D1%D0%BE%BF%D4%BA&amp;sr=&amp;z=&amp;cl=3&amp;f=8&amp;tn=baidu&amp;wd=seo&amp;ct=0">http://www.baidu.com/s?ie=gb2312&amp;bs=seo%D1%D0%BE%BF%D4%BA&amp;sr=&amp;z=&amp;cl=3&amp;f=8&amp;tn=baidu&amp;wd=seo&amp;ct=0</a>。也就是说，当你要搜索A关键词的相关搜索B关键词，那么首先在百度搜索B关键词，然后在B关键词的基础上搜索A关键词，那么到时候B就会出现在A关键词的相关搜索结果上。</p><p>以上的操作思路主要出自SEO实践派<font size="2">丘仕达之手</font>。</p><p>这个地址里面的url地址参数其实有两个，一是&ldquo;<a target="_blank" href="http://www.dugutianjiao.com">SEO研究院</a>&rdquo;，二是&ldquo;SEO&rdquo;。你可以直接把第二个地址变成文字链接或图片链接，这样用户一点击，就直接到了搜索&ldquo;SEO&rdquo;那个页面，而实际上那个页面也同时包含有&ldquo;SEO研究院&rdquo;的关键词在里面。对于流量高的站点，可以采用弹窗的方式将这个最终结果链接弹出来，对于流量低的页面，可以把放百度弹窗的网页，设置成0.5s自动更新。不过百度蜘蛛也不是傻子，所以有些黑帽SEO就会去一些网站购买弹窗广告，每天几百块钱，弹个几千数万次，不仅速度快，风险也转化到别人网站上了。作为网站主在介绍广告主的网站的时候，也必须注意这种现象，避免自己成为别人的无辜&ldquo;肉鸡&rdquo;。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/baidu-xiangguansousuo-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=58</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=58&amp;key=17c3653a</trackback:ping></item><item><title>SEO两百个秘密：PageRank是否风采依然？</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/google-pagerank-seo.html</link><pubDate>Sun, 21 Dec 2008 16:57:27 +0800</pubDate><guid>http://www.dugutianjiao.com/post/google-pagerank-seo.html</guid><description><![CDATA[<p>SEOBook.com的站长Aaron Wall认为：PageRank并不象有些人深信的那样，与网站的相关性有着最为直接的联系。毋庸置疑，PageRank曾一度在Google排名体系中饰演着关键的角色，但时过境迁，PageRank已不再是Google骄子，它正慢慢淡出Google的排名系统。而且他断言，随着时间的推移，PageRank在Google排名中所占据的比重必定还会愈来愈小。</p><p>确实，网络发展日新月异，尤其按照互联网时间推算起来，PageRank应是&ldquo;人到中年&rdquo;。廉颇已老，尚能饭否？PageRank是风采依然还是将逐渐淡出Google排名算法，风光不再？</p><p>&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/seo-secret.html">SEO两百个秘密</a>&rdquo;（<a href="http://www.dugutianjiao.com/post/seo-secret.html">http://www.dugutianjiao.com/post/seo-secret.html</a>）系列肯定少不了对Google搜索引擎PageRank这一专利技术的分析。毕竟现在还是有很多SEO新手对搜索引擎优化的PageRank技术，这个使Google成为我们所热爱的搜索引擎的关键秘密感兴趣，独孤天骄也就趁这个机会再唠叨两句。</p><p><b>一、什么是PageRank值？</b></p><p>PageRank，简称为PR，取自Google的创始人LarryPage，它是Google搜索引擎排名运算法则（排名公式）的一部分。<u>在以前</u>，PageRank是Google对网页重要性的评估，是Google用来衡量一个网站好坏的标准。PR值共有10个等级，依次为PR1到PR10，一个网页的等级越高说明Google对该网页的评价也相应越高，也就是说，在其他条件相同的情况下，PR值高的网站在Google搜索结果的排名中有优先权。例如：一个PR值为1的网站表明这个网站不太具有流行度，而PR值为5以上则表明这个网站较受欢迎，或者说较为重要。</p><p>在1998年Google刚刚开始的时候，PR对搜索引擎的搜索公正性和相关性起到了一个非常重要的作用，但是PR算法在设计上还是存在了一些脆弱性与限制性。目前PR的作用正在减弱，SEO届普遍猜测Google的TrustRank可能正逐渐成为PR的替代品，可以参看SEO研究院的&ldquo;<a target="_blank" href="http://www.dugutianjiao.com/post/seo-trustrank-secret.html">SEO两百个秘密：Google TrustRank及其影响因素分析</a>&rdquo;（<a href="http://www.dugutianjiao.com/post/seo-trustrank-secret.html">http://www.dugutianjiao.com/post/seo-trustrank-secret.html</a>）</p><p><strong>二、查询网站的PR值与PR值诈骗<br /></strong></p><p>1，到Google的官方网站去安装一个<a target="_blank" href="http://toolbar.google.com/T5/intl/zh-CN/index.html">Google toolbar </a>，安装的时候注意点选&ldquo;启用 PageRank &rdquo;，访问网页时即可直观地通过浏览器的菜单栏查看PR值显示。</p><p>2，很多网站提供在线查询PR值的功能。<br /><a href="http://tool.chinaz.com/Ranks/">http://tool.chinaz.com/Ranks/</a>，通过该工具可以快速查询指定网站的Google PageRank值和Sogou Rank值。<br />还有<a href="http://www.123cha.com/Google_PageRank/">http://www.123cha.com/Google_PageRank</a>和<a href="http://pagerank.webmasterhome.cn/">http://PageRank.webmasterhome.cn/</a>也挺实用。</p><p>我们推荐大家通过在线查询PR值的网站进行查询，因为toolbar工具条显示的PageRank容易遭到操控。</p><p>在以前，倘若手头有资源，比如拥有一个PR6的网站，当创建一个新网站时，只要在PR6的网站上所有页面放上这个新网站的链接，过不了多久，这个新网站就可以自动获得至少为5的PR。而且，由于排名靠前的绝大多数行业站点，其PR普遍为5或者6，因而倘若PageRank是决定Google排名的关键因素，那么对新行业的恶意控制简直易如反掌。</p><p>此外，随着PageRank热，叫卖高PR链接的买家也比比皆是。大规模的象Internet.com，价位在7,500美元/月，客户的文字链接广告将出现在Internet.com网络所属各站点中。</p><p>正因为有PR值买卖交易，由此出现了PR值诈骗。诈骗者注册一个域名并建立一个网站。在公开这个网站之前，他会先去偷一个网站的PR值，具体我们这篇文章就不再详细描述了，技术的实现相当的简单。首先他们将自己网站的域名指向这个拥有很高PR值的网站，如6级PR，Google就误以为偷窃者的网站PR值是6。当偷窃者的网站PR达到6级，他开始兜售这个PR，或者开始交换友情链接，这是<a target="_blank" href="http://www.dugutianjiao.com/post/seo-mantianguohai.html">SEO三十六计里面的瞒天过海之计</a>（具体大家可以查阅：<a href="http://www.dugutianjiao.com/post/seo-mantianguohai.html">http://www.dugutianjiao.com/post/seo-mantianguohai.html</a>）。</p><p>因此，在评估一个网站PR值的时候，要仔细辨别真伪。搜狗的Sogou Rank值得参考，经过实践，百度的Rank跟其更为相似。</p><p><strong>三、<b>拥有高PR值的作用</b></strong></p><p>Google的PageRank，一直是SEO界较为敏感，也是极为关注的一个话题。PageRank曾经是主宰Google排名算法的一个主要因素，以至于看一个网站的排名，往往会先去分析它的PageRank是多少。不过现在人们正逐渐意识到，PageRank已难再唱主角。</p><p>因为通过链接来控制PR非常容易，Google肯定也早已意识到这一点，所以不断完善其算法，前一段时间甚至向付费链接开了刀。独孤天骄的许多网站PR值都已经达到了PR5，这是以前不可想象的，从这一点也可以发现Google正不断削弱PageRank在排名中的份量，因而单凭PR来改善网站排名的做法已然行不通了。</p><p>那么，拥有高PR值还有用处吗？独孤天骄认为，仍然有用。</p><p>提高PageRank虽然无法为网站带来直接的好处，比如排名上质的提升，但是它可以为网站带来许多其它的间接好处。</p><p>首先，一个网站拥有比较高的PR值，说明Google对网站有一个认可，该网页比较重要，在某些方面，是网站权威性的证明。PageRank值更新得比较慢，今天看到的PageRank值可能是三个月前的值。特别是一些新的网站，一般都没有PR值的显示。因此，拥有高PR值，是网站具有持久力的证明。同时也拥有了排名靠前的优先权，当然这个并不能与排名靠前直接划上等号。</p><p>其次，搜索引擎可能加快对网页数据的更新。</p><p>第三，非常重要，拥有高PR值，就具有了获得高质量导入链接的谈判优势。当和同类等级的网站进行友情链接交换时，就比较容易获得通过，甚至能够吸引高质量的站点链接。提高PR其实是提高交换链接的信任值。</p><p>正因如此，未来相当长一段时间内，PageRank仍然是搜索引擎优化行业的一个重心。</p><p><strong>四、影响网页的</strong>Google PageRank<strong>因素有哪些？</strong>&nbsp;</p><p>PageRank是Google排名里面最为公开的因素。</p><p>Google通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进行计算，PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计算直接链接的数量，而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B所投的一票。这样，PageRank 会根据网页 B 所收到的投票数量来评估该页的重要性。此外，PageRank 还会评估每个投票网页的重要性，因为某些网页的投票被认为具有较高的价值，这样，它所链接的网页就能获得较高的价值。重要网页获得的 PageRank（网页排名）较高，从而显示在搜索结果的顶部。&nbsp;</p><p>所以，我们知道，PageRank 和链接息息相关，更多的网站链接了你，你的 PageRank 自然会提高。那么要提高自己的 PageRank，也就要想办法得到更多的链接。提高外部链接的质量和数量，提高 Google 在你的网站抓取的页面数都能有效提升你的 PageRank。</p><p><strong>五、如何提高你网页的PR值？</strong></p><p>提高PageRank 的要点，大致有以下这些：</p><p>1，<strong>&nbsp;</strong>反向链接数量和反向链接的质量。与PR高的网站尤其是内容质量高的网站做链接。对一个拥有PR值的网站A来说，如果你的网站B是它的唯一一个外部链接，那么Google就相信网站A将你的网站B视做它最好的一个外部链接，从而会给你的网站更多的分值。可是，如果网站A上已经有49个外部链接，那么Google就相信网站A只是将你的网站视做它第50个好的网站。因而你的外部链接站点上的外部链接数越多，你所能够得到的PR分值反而会越低，它们呈反比关系。所以，在交换链接时候，独孤天骄更愿意跟一个外部链接几乎没有的PR2的网站交换链接，也不跟一个PR6却拥有上百个外部链接的网站交换链接。前者更能提升你的PR分值。另外，质量也是很有关系，独孤天骄更愿意跟一个PR0，却天天更新的网站交换链接，也不愿意跟一个PR5，却半年不见更新的网站交换链接。</p><p>简单的说，外部链接站点的PR值固然重要，该站点的外部链接数也是一个需要考虑的重要因素。在建设自己网站的外部链接时，应尽可能找那些PR值高且外部链接数又少的网站。</p><p>另外，一个网站内部页面的PR值是不一样的，这主要跟导出链接数量相关。如果网站首页的PR值高那其传递到下级页面的PR也会不错。当网站内页的返向链接（Back Link）数目大于首页的返向链接数目的时候，就可能会出现内页的PR值大于首页的PR值。</p><p>2，加入搜索引擎分类目录、加入免费开源目录等。网站被世界三大知名网站 DMOZ，Yahoo和Looksmart 收录，则可有效提升你的页面等级。不过据独孤天骄的观察，目前这些目录也已经被Google降低了权重。你的链接出现在流量大、知名度高、频繁更新的重要网站上，可能更为有效。</p><p>3，Google在你的网站抓取的页面数。Google在你的网站抓取的页面数，数目越多，PageRank值越高。</p><p>4，建设外部链接还需要注意外部链接应与网站内容密切相关也就是主题性相关；这些链接应来自不同的C类IP地址，不能在同一服务器上；在这些链接的链接文字中应富含关键词 ，并且链接文字在内容上应灵活多变。</p><p>提高PR值最佳和最简单的办法在于：提供有趣或有用的网站内容，吸引人们的主动链接，从而提高你的外部链接值。</p><p>相关性是搜索技术的唯一目标。搜索引擎的任务是把与查询主题最为相关的网站呈现在搜索结果的最前面，所以即使一个网站经过了最优化，拥有最多的外部链接，但若缺乏对查询主题的相关性，一样得不到理想的排名。为您的网站获取外部链接是一件好事，但是无视其他SEO领域的工作而进行急迫的链接建设就是浪费时间。Google的排名算法并不是完全基于外部链接的，高PageRank并不能保证Google高排名，决定排名的因素可以有上百种，由于网页级别的高低直接受链接的影响，而链接仅是SEO的一个方面，因此PR的高低只能反映出SEO的部分效果。因此我们不鼓励刻意的去追求PageRank。</p><p>结论：在SEO的过程中，不能忘记内容建设，不能忘记优质外链，但忘掉PR可没什么大不了的。</p><p>&nbsp;<strong>参考文献：<br /></strong>《谈 Page Rank &ndash; Google 的民主表决式网页排名技术》，Google 工程师，吴军<br />Google PageRank：<a href="http://www.google.cn/corporate/tech.html">http://www.Google.cn/corporate/tech.html</a><br />《Google 的秘密- PageRank 彻底解说》中文版：<a href="http://www.kreny.com/PageRank_cn.htm">http://www.kreny.com/PageRank_cn.htm</a>，这篇文章还涉及到具体的PageRank算法，推荐大家阅读。<br />PageRank -百度百科：<a href="http://baike.baidu.com/view/1518.htm">http://baike.baidu.com/view/1518.htm</a><br />&nbsp;</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/google-pagerank-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=51</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=51&amp;key=e82038c3</trackback:ping></item><item><title>SEO两百个秘密：Keywords标签与Description标签的再认识</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/keywords-description-seo.html</link><pubDate>Wed, 17 Dec 2008 13:47:13 +0800</pubDate><guid>http://www.dugutianjiao.com/post/keywords-description-seo.html</guid><description><![CDATA[<p><b>一、什么是Keywords标签与Description标签？</b></p><p>META标签，即Meta Description，就是网页头部一段对该页内容的描述性文字，也可以称之为页面摘要。META标签通常被搜索引擎用来描述一个HTML网页文档的属性，例如作者、类别、日期和时间、网页描述、关键词、页面刷新等。在Google和百度的搜索结果中，页面摘要通常是搜索引擎为每个搜索结果显示的简短的文字预览，其质量直接影响到你的网站被点击的可能性。</p><p>Meta标签最重要的当属标题标签（Title Tag），描述标签（Description Tag）和关键词标签（Keyword Tag）。其中标题标签在SEO中的作用，独孤天骄已经在上一篇《<a href="http://www.dugutianjiao.com/post/seo-title-secret.html">SEO两百个秘密：如何优化网站的标题标签</a>》里进行了详细阐述，大家可以参阅。这篇SEO技巧，就专门针对Meta Description标签以及Keywords标签部分的优化进行分析，希望能对你有点用处。</p><p>META标签中的Description标签被用来描述一个网页的介绍，格式如下：&lt;META NAME=&quot;Description&quot; CONTENT=&quot;把一段信息丰富的描述放在这里&quot;/ &gt;；Keywords则被用来描述一个网页的关键词，格式如下：&lt;META NAME=&rdquo;Keywords&rdquo; CONTENT=&rdquo;这里填入对网页提取的关键词&rdquo;/ &gt;。</p><p>我们一起来看一个例子，打开SEO研究院首页：<a href="http://www.dugutianjiao.com">www.dugutianjiao.com</a>，查看源代码，发现里面有这么一段代码：</p><p>&lt;title&gt;SEO研究院 - 独孤天骄为您揭秘最核心实用的搜索引擎优化技术&lt;/title&gt;<br />&lt;meta name=&quot;keywords&quot; content=&quot;seo,搜索引擎优化&quot; /&gt;<br />&lt;meta name=&quot;description&quot; content=&quot;这是独孤天骄的SEO博客。主要以学术研究的态度撰写原创的SEO文章，包括入门的《SEO两百个秘密》，进阶的《SEO七十二案例》，以及高阶的《SEO三十六计》三个系列，共308篇搜索引擎优化文章。&quot; /&gt;</p><p>上面示例就是典型的使用Keywords标签与Description标签来定义页面内容的简短描述。</p><p><b>二、Keywords标签与Description标签在SEO中是否还有用处？</b></p><p>通过上一篇的《<a href="http://www.dugutianjiao.com/post/seo-title-secret.html">SEO两百个秘密：如何优化网站的标题标签</a>》，我们已经知道Google、百度等搜索引擎都会给予标题标签比较高的权重，并且知道如何在不进行关键词堆砌的情况下写好标题标签。在Keywords标签与Description标签中，同样也都可以放入关键词，但对SEO是否还有足够大的用处呢？不少seoer并不确定。</p><p>因为早期标签被黑帽SEO用来堆砌关键词和提供与网页无关的关键词描述，以此获得更好的排名，搜索引擎现在已经降低了对这两个标签的权重。如果你不知道如何设置，甚至可以不用这两个标签，只要你页面符合相关规范，搜索引擎照样能正常提取你页面的正确描述，比如独孤天骄在没有加入这两个标签的时候，就截图了两张主流搜索引擎对<a href="http://www.dugutianjiao.com">SEO研究院</a>的页面描述，两家都能正常地提取出页面摘要：</p><p><img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/12/seoyanjiuyuan-baidu.jpg" alt="" title=""/><br />百度搜索引擎对SEO研究院的页面描述提取&nbsp;</p><p><img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/12/seoyanjiuyuan-google.jpg" alt="" title=""/><br />Google搜索引擎对SEO研究院的页面描述提取</p><p>SEO普遍认为有可能搜索引擎会把描述和关键词标签做为排名的一个很小的因素，但所占的分量应该非常低。因此在做搜索引擎优化的过程中往往只注意对页面文本内容的SEO，而忽略了Meta Description在搜索引擎中的表现，许多网站干脆将Meta Description抛弃。</p><p>&nbsp;其实我们应该换一个角度来看这个问题，SEO应该<a href="http://www.dugutianjiao.com/post/seo-zouweishang.html">跳出单纯的技术优化</a>，那么我们就明白尽管现在的搜索引擎排名很少依赖META标签中的内容，但META标签的内容设计仍然是至关重要的。</p><p>因为，保留Meta Description描述以及合理的使用其内容对于提高搜索引擎友好度有很大效果！Meta Description作为对网站页面的描述性语句，可以让搜索引擎清楚了解页面的主要内容。很多时候搜索某些关键词的时候，在搜索引擎结果页面（SERP）中出现的就是Meta Description中的描述。搜索引擎浏览网站时的程序与人访问网站时的思路是非常相似的，他们都在竭力找出能识别网页标题的线索。不同之处在于，搜索引擎会对所有信息进行正常索引，而访问者则根据标题判断是否愿意进行下一步的点击。</p><p>在《使用更好的元描述来改善页面摘要》一文（发表者：Raj Krishnan, 页面摘要组，<span class="byline-author"><a target="_blank" href="http://www.googlechinawebmaster.com/">谷歌中文网站管理员博客</a>）中，Google介绍了网页中Meta Description的作用，以及如何写出好的网页描述，以便在搜索结果中有更多的机会被人点击。其中提到了一个</span>主要产品聚集商为&ldquo;哈利波特7&rdquo;一书的元描述范例，我们一起来看看：&nbsp;</p><p>不是很理想的描述：<br />&lt;META NAME=&quot;Description&quot; CONTENT=&quot;[域名：redacted]: 哈利波特(7)：死神的圣物: 书籍: J. K. Rowling,Mary GrandPr&eacute; 作者： J. K. Rowling,Mary GrandPr&eacute;&quot;&gt;&nbsp;</p><p>有很多原因将导致这段元描述对我们的搜索结果来说不是一个好的页面摘要：<br />* 描述中的书名信息和该页面的标题有完全重复的信息。<br />* 信息描述本身就有重复（J. K. Rowling, Mary GrandPr&eacute; 被罗列了两次）。 .<br />* 描述提供的信息不清楚，谁是 Mary GrandPr&eacute;?<br />* 名字间少了个空格，用了太多的冒号使得描述很难读。</p><p>一般用户看谷歌的搜寻结果页可能只花一秒钟来扫描某一页面摘要，上述的所有因素都意味着用户很可能跳过这一结果。</p><p>考虑以下好多了的元描述：&lt;meta name=&quot;Description&quot; content=&quot;作者: J. K. Rowling, 插图: Mary GrandPr&eacute;, 分类: Books, 价格: $17.99, 长度: 784 页&quot;&gt;</p><p>什么改变了呢？没有重复，更多的信息，所有信息都清楚地标记和分开。并不需要真正的额外工作来产生这样的一种质量：价格和长度是仅有的新数据，他们已经在当前页显示了。</p><p>很明显，如果网页标题和描述关键词丰富，分布合理，网站即使排名不在第一位也会吸引来大量的访问者和潜在消费者，甚至将潜在消费市场转化成现实消费市场。</p><p>因此，SEO研究院得出结论：在同一页搜索结果有机排列时，网页标题和描述非常重要，他们是最好的广告，有助于提高点击率。要做好<a href="http://www.dugutianjiao.com">SEO</a>，就一定要对它们的重要性有深刻认识。&nbsp;</p><p><strong>三、如何写好高质量的Keywords标签与Description标签？</strong></p><p>高质量的元描述页面摘要对网站的重要性我们前面已经说过，那么什么才是好的元描述策略呢？</p><p>1，<b><em>网页的简短描述不能太长。</em></b>&nbsp;</p><p>Meta可以写无限多描述文字或关键字吗？答案当然是否定的，写的太多没有任何作用。两大主流中文搜索引擎，页面摘要的有效字符数差不多。百度有效字符数为220个（相当于110个汉字）左右，Google有效字符数为240个（相当于120个汉字）左右，都包括标点符号在内。在这两个标签里，都切忌重复和堆砌关键词，&nbsp;罗列大量关键词对于搜索引擎检索没有太大的意义，甚至可能起到副作用。关键词需要在页面中多次重复出现。具体多大的密度好，可以参阅《<a href="http://www.dugutianjiao.com/post/seo-keywords-density.html">SEO两百个秘密：关键词密度的常见问题</a>》<br />&nbsp;</p><p>&nbsp;2，<b><em>不要给网页定义与网页描述内容无关的简短描述。</em></b></p><p>要根据网页的主题和内容选择合适的关键词。将你的页面所涉及到的主要内容归纳对几个最能体现网页主题的关键词，将提取出来的关键词组织成句子，这句子要能很好的描述网站（网页）内容，将组织的句子精简，再精简，最后要浓缩成精华即是最好的描述。在选择关键词时，除了要考虑与网页核心内容相关之外，还应该是用户易于通过搜索引擎检索的，过于生僻的词汇以及一些不必要的词（主要是Stop words），都尽可能不要出现。</p><p><b>3，<em>在描述中明确包含标记性事实。</em><br /></b></p><p>网页标题和Meta Description必须详尽有用。Meta Description中可以包含一些能吸引并说服访问者点击你的网站的描述。要让你的访问者明白他们能从你的网站上获取什么样的信息，可能的话，最后加上一两句承诺的话以增强信服力。比如同样的下载站，你在描述里面加上&ldquo;无须注册，完全免费&rdquo;效果估计就好的多，同样的信息发布站，你加上&ldquo;官方站&rdquo;就显得权威得多。</p><p>元描述不一定是一个句子格式。它是一个放置关于当前页面结构化数据的好地方。举例来说，新闻或博客帖子可以列出作者，出版日期，或署名信息。这给潜在的访客以非常相关的信息。如果不放在元描述里，它们就可能不会显示在页面摘要里。同样，在产品介绍的页面可能有关键的信息（价格，生产日期，制造商等)，他们可能分布在当前页的各处，所以不可能通过一个页面摘要来显示所有这方面的资料。如果你把它们放在元描述里，页面摘要就能显示它们了。比如，我们上面说过的&ldquo;哈利波特7&rdquo;一书的元描述。&nbsp;</p><p><b>4，<em>对不同页面给予不同的描述。</em></b></p><p>你应为每个具体的一页写一个准确的描述。在首页或其他总结性页面上给一个网站级别的描述，而对其他单个页面使用页面级别的描述。如果你没有时间为每一个单页去创造一个描述，显然你应该对你的不同网页考虑优先级。至少，为你的关键 URL（譬如你的首页和热点页面）创建一个描述。&nbsp;</p><p>用程序来产生描述，Google并不禁止，甚至是受到鼓励的，但是要确保你的描述看上去不是在产生网络垃圾。好描述的可读性强并且是多样的。独孤天骄的做法一般是通过修改程序，调用文章正文内容的前100个汉字作为描述。</p><p><b>5，<em>使用高质量的描述。</em><br /></b></p><p>确保你的描述确实是在描述你的页面。元描述有可能显示在谷歌搜索结果中，如果描述的质量足够高，易于阅读、语言精练概括，可以大大地提高搜索结果中的页面摘要的相关性。这不但可能改善你的网站的质量，也有可能增加你的用户流量。</p><p>我们可以参考一些比较权威的大网站是怎么写的，再具体运用到我们的网站上面来。</p><p><b>关键词工具<br /></b>Google Adwords关键词工具：https://adwords.google.com/select/KeywordToolExternal<br />百度相关搜索：http://d.baidu.com/rs.php<br />百度指数：http://index.baidu.com/<br />关键词密度分析工具：http://tool.cndw.com/Seo/Key_Density.asp（中文）；http://www.keyworddensity.com/（英文）<br />另外，Google发布的关键字词定位工具&mdash;&mdash;Google sktool，虽然主要作用是针对adwords投放，但是对研究搜索引擎营销人群来说，一样可以用来作为关键词的分析和优化：http://www.google.com/sktool</p><p><b>关键词热门排行及指数<br /></b>谷歌热榜：http://www.google.cn/rebang<br />百度排行榜：http://top.baidu.com<br />Yahoo排行榜:http://misc.yahoo.com.cn/top_index.html<br />搜狗指数：http://www.sogou.com/top/<br />搜搜龙虎榜：http://www.soso.com/lhb/s_i_sosolhb.shtml</p><p>参考文献：<br />SEO两百个秘密：关键词密度的常见问题 <a href="http://www.dugutianjiao.com/post/seo-keywords-density.html">http://www.dugutianjiao.com/post/seo-keywords-density.html</a><br />SEO两百个秘密：如何优化网站的标题标签 <a href="http://www.dugutianjiao.com/post/seo-title-secret.html">http://www.dugutianjiao.com/post/seo-title-secret.html</a><br />使用更好的元描述来改善页面摘要，Raj Krishnan，页面摘要组，<span class="byline-author">谷歌中文网站管理员博客<br />SEO三十六计：走为上 <a href="http://www.dugutianjiao.com/post/seo-zouweishang.html">http://www.dugutianjiao.com/post/seo-zouweishang.html</a></span></p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/keywords-description-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=50</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=50&amp;key=b2927f1d</trackback:ping></item><item><title>SEO两百个秘密：向量空间模型与SEO的本质</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/vector-space-model-seo.html</link><pubDate>Sun, 14 Dec 2008 23:21:47 +0800</pubDate><guid>http://www.dugutianjiao.com/post/vector-space-model-seo.html</guid><description><![CDATA[<p><b>开篇语</b></p><p>搜索引擎就像是一个神奇的魔方空间，如下图：</p><p><img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/12/vector-space-model-1.gif" alt="" title=""/></p><p>当访客要检索一个叫完好归位的魔方时，搜索引擎就必须将最符合要求的魔方，如下图呈现出来。</p><p><img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/12/vector-space-model-2.gif" alt="" title=""/></p><p>搜索引擎排名是SEO的一个重要工作。作为SEO要做的工作就是将自己所优化的页面最佳化，通过向量空间模型来使所有的方块颜色一致，玩转魔方，达成搜索引擎的&ldquo;最符合&rdquo;，从而占据理想排名。</p><p>一些所谓的SEO高手，连什么叫向量空间模型都不知道，完全不了解搜索引擎的检索原理，却到处吹牛，动辄保证能把任意词做到首页。这样的保证，其实是相当苍白可笑的。因为缺乏对搜索引擎检索原理的了解，是永远也无法深入到SEO的本质之中的！&mdash;&mdash;独孤天骄</p><p><strong>向量空间的概念</strong></p><p>向量空间是线性代数的主体，它是数学中基本又重要的概念，其概念是：设V为n维向量的集合，如果集合V非空，且集合V对于加法及乘数两种运算封闭，那么就称集合V为向量空间。其理论和方法已应用到自然科学、工程技术及社会科学的诸多领域。</p><p>向量空间模型（VSM）是近年来应用最多且效果较好的方法之一，在该模型中，文档向量空间被看作是由一组正交词条向量所组成的向量空间。</p><p><b>向量空间模型产生的背景及运用</b></p><p>早期的搜索引擎所使用的技术造成了信息检索的结果查全率高，查准率底。介于此，为了增加词和信息之间的<u>相关性</u>，以求达到和检索者的思维的统一，搜索引擎开发出了向量模型，概率模型，神经网络模型，贝叶斯模型等等。</p><p>其中，由Salton，Wong and Yang提出的向量空间模型（vector space model，简称VSM）是比较经典的一个模型。</p><p>它的缺点是相似度的计算量大，当有新文档加入时，则必须重新计算词的权值；不适合处理过长的文件，因为近似值不理想；检索词组必须要完全符合文件中出现的词组，不完整词组(子字串)会会生false positive；语言敏感度不佳，情境相同但使用不同语汇的文件无法被关联起来，这产生所谓的false negative。</p><p>但是瑕不掩瑜，由于具有较强的可计算性和可操作性，已经被广泛地应用于文本检索、自动文摘、关键词自动提取、词义消歧（多义词的词义消歧）、文本分类（包括多主题web文本分类方法）、信息过滤和搜索引擎等信息检索领域的各项应用中，并且取得了较好的效果。还有许多地方也运用到这个模型。比如目前的邮件自动归类，基于统计的邮件分类一般采用向量空间模型来表示邮件。</p><p>在数据建模上，现有多种信息检索算法模型，如布尔模型、概率模型、向量空间模型、神经网络模型、遗传算法模型及模糊集合模型等，有其各自的适用范围和优缺点。其中，检索效果较好且较通用的是向量空间模型和概率模型。</p><p>现在针对文档频度和Salton（1973）年提出的计算向量权重的TF*IDF 算法有不少的改进，如：Thorsten Joachims提出了概率TF*IDF 算法；Roberto Basili提出了TF*IWF*IWF 算法等等。</p><p>训练方法和分类算法是分类系统的核心部分，目前存在多种基于向量空间模型的训练算法和分类算法，例如，支持向量机算法、神经网络方法，最大平均熵方法，KNN（K 最近邻居）算法和贝叶斯方法等等。从测试结果看来，KNN 算法在分类效果上是最佳的，同时在训练过程中投入的时间最少，但是在分类过程中花费的时间最多，不利于文本的实时处理；而贝叶斯算法和简单向量距离算法的时间花费近似，其分类效果也近似，简单距离算法的效果略好。Ko与Seo提出一算法TCFP(text categorization using feature projection)，尝试利用特征投影法(feature projection)来降低与分类无关的特征对于系统的影响，并借此提升系统效能，其实实验结果显示其分类效果与k最近邻居法相近，但其运算所需时间仅需k最近邻居法运算时间的五十分之一。</p><p>百度开发的百度新闻、百度图片、相似网页、相关搜索等等几乎都是基于向量空间模型的。</p><p><b>信息检索技术的基本原理</b></p><p>简单介绍一下信息检索技术的基本原理。</p><p>信息检索系统流程大致如下图所示：</p><p><img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/12/vector-space-model-shujuchuli.gif" alt="" title=""/></p><p>总体上，系统可分为数据预处理、索引生成、查询处理、终端检索四个部分。</p><p>在搜索引擎的数据预处理阶段，《一种基于锚文本的并行检索策略》（高 珊，何婷婷，胡文敏）提出：进行Web信息检索时，页面中的锚文本与正文存在较大相关性，多数检索系统忽视了锚文本对页面正文的贡献。该文提出一种提高检索精度的方法，为文档集建立一个基于页面正文的索引和一个基于锚文本的索引，对其采取并行检索策略。实验结果表明，该方法可以有效处理特定结构的网页集。</p><p>该文写到，因为要为正文和锚文本分别建立索引，所以需要获取正文和锚文本。因为很多锚文本是链接到广告等与页面内容无关的信息，所以在获取锚文本时，要根据新闻网页结构的特殊性，抽取相关锚文本。例如，在正文下方通常有相关新闻的字样，只抽取出现在相关新闻下方表格里的锚文本，因为在整个网页中，只有这部分的链接信息与正文内容相关度较大，所以可以有效剔除与正文内容不相关的锚文本，从而提高系统准确率。 <br />&nbsp;</p><p>在获取锚文本时，为该网页建立一个文本文件，用于存放与正文内容相关度较大的所有锚文本。待检索网页集经过预处理后，得到2个文档集合：页面正文集和锚文本集。后续处理将为这2种文档集分别建立索引。</p><p>传统上所讨论的文本分类一般面向文本内容的本身。在文本的预处理阶段会将文本中所包含的如HTML标签（tag）、主题以及超级链接等结构信息清除。然后，在面向互联网的信息，特别是web页面的分类中，文本中所包含的这些结构化信息会提供文本归属的丰富信息。通过这篇论文，独孤天骄进行大胆的猜测，目前搜索引擎在数据的预处理阶段的时候，正文、锚文本和链接地址都是要提取出来的。</p><p>在搜索引擎的索引生成阶段，目前主流的方法是以词为单位构造倒排文档表，大家可以参阅SEO研究院上的其他相关资料，本文不赘述。</p><p>在搜索引擎的查询处理阶段，作为SEO要注意各种语言中都会存在的很多同义词现象。掌握这个技能有助于SEO文案的写作，从而推广排名的前进。举个例子，比如你查&ldquo;SEO&rdquo;的时候，包含&ldquo;搜索引擎优化&rdquo;的结果也应一并返回，这种情况搜索引擎通常会采用查词典的方法解决。</p><p><b>向量空间模型的具体运用</b></p><p>在搜索引擎的最后一个阶段&mdash;&mdash;检索阶段的时候，为了把最符合用户需求的结果显示在前面，还需要利用各种信息对结果进行重排序。</p><p>目前有两大主流技术用于分析结果和查询的相关性：链接分析和基于内容的计算。</p><p>前者主要以Sergey Brin 和Larry Page 在1998 年提出了PageRank 算法为代表。同时还有同年J.Kleinberg 提出的HITS 算法，以及其它一些学者也相继提出的链接分析算法，如SALSA，PHITS，Bayesian等算法。这些算法有的已经在实际的系统中实现和使用，并且取得了良好的效果。</p><p>后者的计算则沿用传统的文本分类方法，多采用向量空间模型、概率模型等方法来逐一计算用户查询和结果的相似度（相关性）。两者各有优缺点，而且恰好互补。链接分析充分利用了Web 上丰富的链接结构信息，但它很少考虑网页本身的内容，而直观上看，基于内容的计算则较为深入地揭示了查询和结果之间的语义关系，但忽略了不同网页之间的指向关系，因此现在很多系统尝试把两者结合起来，以达到更好的性能。</p><p>作为想深入到SEO的本质的学习者来说，要想学习检索模型，就必须深入研究向量空间模型、概率模型、语言模型等基本模型或者混合模型，同时掌握PageRank、链入分析等链接分析或者页面分析技术来提高检索效果。中文检索相对英文等其它语种来说，如何正确分词对于检索效果有所影响，尤其是命名实体、缩略语以及新词等未登录词的正确识别对于某些查询来说影响较大。现在的大部分检索系统在索引以及查询分析阶段采用了命名体识别，从结果来看，取得了比较好的效果。</p><p>互联网的数据以及资源呈现海量特征。搜索引擎为了有效索引和排序这些分布的海量信息，就必须开发基于内容的信息检索和数据挖掘。其中文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术。向量空间表示模型（VSM）仍是文本表示的主要方法。相关研究仍然集中在以什么语义单元作为项以及计算项的权重两个问题上。大部分工作仍然以关键词作为项，以项的频率为基础计算权重，如tf*idf等。目前的搜索引擎是基于&ldquo;词项&rdquo;在进行一系列的排序计算的。</p><p>在搜索引擎中，一个词能够概括这篇文章意思的能力越高，权重就越高，反之则降低。比如<a href="http://www.dugutianjiao.com">独孤天骄</a>写的这篇文章，&ldquo;如何优化网站的标题标签&rdquo;（<a href="http://www.dugutianjiao.com/post/seo-title-secret.html">http://www.dugutianjiao.com/post/seo-title-secret.html</a>），很明显，文本经过分词程序分词后，首先去除停用词，合并数字和人名等词汇，然后统计词频，经过提炼的主题词为&ldquo;标题标签&rdquo;，全文差不多出现了四十次的&ldquo;标题标签&rdquo;这个关键词进行强调。</p><p>在检索过程中，向量空间模型根据文档之间的相似度，结合机器学习的一些算法如神经网络算法，K-近邻算法和贝叶斯分类算法等，可以实现文档的自动分类和对查询结果的相似度排序，能够有效提高检索效率。</p><p>向量空间模型在查询过程中，可以计算出每个文档与查询的相似度，进而可以根据相似度的大小，将查询的结果进行排序。从SEO的角度上理解，就是当访客在搜索引擎上搜索一个关键词时，向量空间模型会自动计算中哪个文档最符合这个关键词，从而将最符合的结果排在索引前列。真正掌握了向量空间模型，我们就很容易判断出所<a href="http://www.dugutianjiao.com">SEO</a>的页面和关键词的相关性，从而将关键词做到第一页。</p><p>在信息检索中常用的关键词权值计算方法在向量空间模型中表现为TF-IDF函数。TF/IDF其实说白了就是关键词权重的量化方法。根据TF-IDF公式，文档集中包含某一关键词的文档越多，说明它区分文档类别属性的能力越低，其权值越小；另一方面，某一文档中某一关键词出现的频率越高，说明它区分文档内容属性的能力越强，其权值越大。</p><p>通过独孤天骄对搜索引擎的观察，以及参阅搜索引擎对索引网页的描述部分（主要是源代码不输出Description标签的页面，描述是由搜索引擎自动进行提取的文摘），我认为判断一个句子重要度是有效构筑良好向量空间模型的基础，试验表明，很多说明性句子，句子长，分句多，包含有多个主题语义概念使得句子的重要度十分的大。句子在段落中所处位置。一个句子的重要度还与句子本身在段落中所处的位置有关。作为关键句一般在文章的开头、结尾或者在段落的开头、结尾可能比较大。句子的重要度除了与自身的一些因素相关外，还与句子所在段落也有一定的关系。</p><p>在向量空间模型中，文本泛指各种机器可读的记录。用D（Document）表示，特征项（Term，用t表示）是指出现在文档D中且能够代表该文档内容的基本语言单位，主要是由词或者短语构成，文本可以用特征项集表示为D(T1，T2，&hellip;，Tn)，其中Tk是特征项，1&lt;=k&lt;=N。例如一篇文档中有a、b、c、d四个特征项，那么这篇文档就可以表示为D(a，b，c，d)。对含有n个特征项的文本而言，通常会给每个特征项赋予一定的权重表示其重要程度。即D＝D(T1，W1；T2，W2；&hellip;，Tn，Wn)，简记为D＝D(W1，W2，&hellip;，Wn)，我们把它叫做文本D的向量表示。其中Wk是Tk的权重，1&lt;=k&lt;=N。在上面那个例子中，假设a、b、c、d的权重分别为30，20，20，10，那么该文本的向量表示为D(30，20，20，10)。在向量空间模型中，两个文本D1和D2之间的内容相关度Sim(D1，D2)常用向量之间夹角的余弦值表示，公式为：</p><p><img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/12/vector-space-model-gongshi1.jpg" alt="" title=""/></p><p>其中，W1k、W2k分别表示文本D1和D2第K个特征项的权值，1&lt;=k&lt;=N。</p><p>在自动归类中，我们可以利用类似的方法来计算待归类文档和某类目的相关度。例如文本D1的特征项为a，b，c，d，权值分别为30，20，20，10，类目C1的特征项为a，c，d，e，权值分别为40，30，20，10，则D1的向量表示为D1(30,20,20,10,0),C1的向量表示为C1（40，0，30，20，10），则根据上式计算出来的文本D1与类目C1相关度是0.86。</p><p>实际上，计算夹角向量之间的余弦比直接计算夹角容易：</p><p>&nbsp;<img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/12/vector-space-model-gongshi2.gif" alt="" title=""/></p><p>余弦为零表示检索词向量垂直于文件向量，即没有符合，也就是说该文件不含此检索词。</p><p>转载请注明来自SEO研究院：<a href="http://www.dugutianjiao.com">http://www.dugutianjiao.com</a></p><p>参考文献：<br />《一种基于锚文本的并行检索策略》（高 珊，何婷婷，胡文敏）<br />《<a href="http://zh.wikipedia.org/wiki/%E5%90%91%E9%87%8F%E7%A9%BA%E9%96%93%E6%A8%A1%E5%9E%8B">向量空间模型</a>》，维基百科<br />《基于向量空间模型的多主题Web文本分类方法》周炎涛 唐剑波 吴正国<br />《基于向量空间模型的INTERNET信息检索》<br />《向量相似度的计算和向量夹角余旋的关系》<br />《基于向量空间模型的文本自动分类系统的研究与实现》<br />《基于向量空间模型的文本检索系统》 王晓黎 王文杰<br />中文信息检索：<a href="http://baike.baidu.com/view/920786.htm">http://baike.baidu.com/view/920786.htm</a>，百度百科</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/vector-space-model-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=47</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=47&amp;key=3e3f115a</trackback:ping></item><item><title>SEO两百个秘密：如何优化网站的标题标签</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-title-secret.html</link><pubDate>Wed, 10 Dec 2008 21:19:55 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-title-secret.html</guid><description><![CDATA[<p>Title翻译至Title Tag，即标题标签，在Html的Head标签内被用来定义页面文档的标题。做SEO不优化标题标签，绝对是不可饶恕的低级错误，因为搜索引擎索引到的内容标题往往是网页Title的内容，想要有好的排名就必须多推敲Title，合理分配Title的关键词，让Title标签里面拥有最为核心的关键词。到目前为止，标题标签被证明是SEO中最为关键的优化项目之一，Title虽然不是决定网站排名的最终因素，但是一个合适的Title标签可以使你的网站获取更好排名。这一点通过搜索关键词就可以得证，当Title标签中没有出现关键词的情况下，想排在前十的几率是很低的。</p><p>因此，如何写网站的标题标签，是SEO学习的基础，也是最为重要的基础之一。</p><p>通常情况下，我们在写标题标签时，应该考虑到以下两个具体因素：</p><p><b>一、迎合搜索引擎的喜好。</b></p><p><b>1，每个页面的标题标签不能相同。</b></p><p>所有的网页都应该有适合自己的独特Title标签，首页与频道页、栏目页、列表页、内容页的标签都要尽量不能一致。应该根据网页内容的不同，有针对性地设置不同的标题标签。这样可以加大被Google、百度等搜索引擎索引的几率和避免被搜索引擎判定为重复的垃圾页面。</p><p>我们知道，网页编辑软件DreamWeaver新建一个HTML页面的默认Title是&ldquo;无标题文档&rdquo;，特别是许多企业站，不明白<a href="http://www.dugutianjiao.com">搜索引擎优化</a>的人还很多，基本上没有加标题标签，几乎全部是默认的&ldquo;无标题文档&rdquo;；另外一种情况则是，加倒是加了，可是基本上全部是公司或产品的名字，结果搜索引擎收录在一起的页面都是同一个标题，加之许多企业站都是用flash或图片来进行信息展示，搜索引擎无法辨认，只好判定为重复的垃圾页面了。这样的站点收录估计都将成问题，想在搜索引擎的索引结果占据前三页地位，更加难乎其难了。</p><p>独孤天骄在写该文时，专门在百度和Google两个搜索引擎都搜索了下&ldquo;无标题文档&rdquo;，两家主流搜索引擎都有逾数百万项符合&ldquo;无标题文档&rdquo;的查询结果，说明犯这种低级SEO错误到现在还不知道改正的网站遍地都是，数不胜数。</p><p><b>2，限制每个页面标题标签的字数。</b></p><p>一般来说，搜索引擎只考虑标题标签中有限的字数。根据W3C的提议，Title的字符不应该超过64个字符（32个汉字），避免超过80个字符（40个汉字）。太长的Title Tag，搜索引擎若非抛弃不收录，便有直接封杀之虞。</p><p>有的人认为，尽可能把关键词放在标题标签的最前面；也有人认为，关键词在前后都无关紧要。其实随着搜索引擎排名技术的改进，这个权重值将会逐渐下调，只要注意你的标题标签别太长了就行。</p><p>目前，SEO研究院仍然建议大家将重要的关键词放在标题标签的最前面。</p><p><b>3，标题标签应该突出核心关键词，合理控制关键词的匹配度。</b></p><p>标题标签中应该含有关键词，并突出核心关键词。关键词应该很自然地被融入在一句合乎逻辑的通顺句子或短语里，而不是生硬的将关键词堆砌在一起。关键词也是&ldquo;人&rdquo;，不管是谁，都是比较喜欢看符合语法结构的Title，尤其是做英文站优化的时候，这点就显得更加重要。</p><p>要尽可能避免堆积、没有策略地重复关键词。由于堆积重复关键词造成的关键词密度过高，很容易引起搜索引擎反感。在SEO的过程中，设置的关键词密度不要过高，一两个即可，最多控制在三个左右。这个其实很容易理解，如果你脸上长两三颗青春痘，应该来说你还是能够忍受的，但是如果密密麻麻遍布青春痘的话，估计你也会将自己&ldquo;封杀&rdquo;在房间里面不出外见人了。搜索引擎也一样，密度太过的话，很容易直接将你请进搜索引擎的独有&ldquo;房间&rdquo;&mdash;&mdash;<a href="http://www.dugutianjiao.com/post/seo-sandbox-effect.html">沙盒</a>里面（沙盒效应的具体技术详解见独孤天骄的另外一篇论述：<a href="http://www.dugutianjiao.com/post/seo-sandbox-effect.html">http://www.dugutianjiao.com/post/seo-sandbox-effect.html</a>）。</p><p><b>4，注意标题标签的写作策略。</b></p><p>通过实验证明，目前百度和Google搜索引擎中，想要获得好的排名，文章类的页面写作应该主要表现在&ldquo;文章名-分类名-网站名&rdquo;，或者单纯只要文章名，参照以上三条建议即可。但是下载类网站的内容页写作就稍微有些区别了。</p><p>内页Tttle标签写法权重较高的主要表现在：&ldquo;关键词后缀1，关键词后缀2，关键词后缀3&rdquo;，比如你要做电影《赤壁》的三种软件下载，那么就应该写成&ldquo;《赤壁》迅雷下载，《赤壁》BT下载，《赤壁》电驴下载&rdquo;，不过这种写法有堆砌关键词嫌疑，放在具体内容页使用，首页得特别注意。当然，不同时期可能写作的策略是不一样的，你可以通过新造一个完全没有的生词进行修改Title的实验，得出结果之后再用于写作的实践上面。</p><p><b>5，网页内容要对标题标签进行适当强化重复。</b></p><p>搜索引擎会根据标题标签中的关键词来判断整个正文的内容，因此在网页内容里第一个&lt;h1&gt;标签当中，我们可以重复一次标题标签，这样有利于搜索引擎判断这个页面的主题，可以加重搜索引擎对这个页面标题的权重计算。</p><p>在文章正文开头部分200个字符（100个中文文字）内合理出现关键词的描述，关键词分布要自然，不可堆砌。比如我们这篇文章的关键词应该就是&ldquo;<a href="http://www.dugutianjiao.com/post/seo-title-secret.html">标题标签</a>&rdquo;（<a href="http://www.dugutianjiao.com/post/seo-title-secret.html">http://www.dugutianjiao.com/post/seo-title-secret.html</a>）了，&ldquo;标题标签&rdquo;这个关键词在第一段已经很自然、很合理出现了很多次，全文段落里面也很自然地融合了这个关键词。这就是对标题标签中的关键词进行分布的策略。</p><p><b>6，正确运用标题标签的分词策略。</b></p><p>把分词技术融合到Title标签的写法之中，能够合并的关键词可以在标题里面合并在一起来表达，避免有堆砌关键词的嫌疑。独孤天骄还是举本文为例，这篇文章的标题是《如何优化网站的标题标签》，经过搜索引擎的相关权重计算，提取出来的关键词就是&ldquo;标题标签&rdquo;。同时，通过长尾策略，这个标题还有其他的关键词将会被提取，比如&ldquo;优化网站&rdquo;、&ldquo;网站优化&rdquo;&ldquo;标题标签的优化&rdquo;&ldquo;优化标题标签&rdquo;&ldquo;优化网站的标题标签&rdquo;等等数个关键词语，假如我们在文章正文内容中，对这些关键词加以拓展延伸，这些关键词同样也可以将排名做上去的，当然，类似&ldquo;网站优化&rdquo;这样的关键词则不是一篇文章能做上去的，也不是本文所有优化的主关键词。</p><p>至于搜索引擎怎么判断并提取文章的主要关键词、辅助关键词，以及如何分布给他们相关的权重，就涉及到搜索引擎的核心秘密&ldquo;向量空间模型&rdquo;上面去了，大家可以查看SEO研究院独孤天骄写的其他相关文章，简单的说，掌握了&ldquo;向量空间模型&rdquo;之后，你才开始迈出初级<a href="http://www.dugutianjiao.com">SEO</a>之列。</p><p>我们必须明了一点，搜索引擎提取的关键词的判定，第一步骤看的就是标题标签，标题如果没有包含该文内容的主题关键字，那么权重值的分布就更加不易了。一般情况下，我们应该尽量使标题标签的关键词和内容文本之间的主关键字一样来迎合搜索引擎。</p><p>我们讲解第一点的时候，用的是&ldquo;迎合&rdquo;搜索引擎，第二点则是要做到&ldquo;符合&rdquo;用户体验。网站最终是给用户看的，光是迎合搜索引擎的网站可能会被用户抛弃，用户体验太过糟糕的网站是很难获得真正成功的。所以接下来天骄从本文主要论述的主题&ldquo;标题标签&rdquo;出发，讲一下如何让自己的网站符合访问用户的体验。</p><p><b>二、符合访问用户的体验。</b></p><p><b>1，标题要言简意赅，点明主旨，吸引用户。</b></p><p>标题是否对用户有足够的吸引力？用户在判断应该点击哪一个网站时，很大程度上取决于你的标题写作水平。如果你的标签只是一堆关键词堆砌，却不知所云，就算你的排名靠前，用户不点击也没有什么用。搜索引擎正在把用户行为方式考虑进排名算法当中。用户点击率越高，你的排名完全就有可能越靠前，排名第十的网站可能很快就超越了你的排名第一，从而替代你的位置。</p><p>有吸引力的文章标题往往更加能够吸引住用户的点击，同时更有利于SEO。要吸引人的眼球，以下一些软文常用的方法挺实用（以下内容来自网络）：</p><ul>    <li>用一些热门词汇。你可以在搜索引擎搜索下&ldquo;标题标签&rdquo;这个关键词有多少页面？</li>    <li>用一些含图片的括号文字，如&ldquo;刘亦菲喝完三鹿奶粉怎么变成这样子了(组图)&rdquo;，相信没有几个人可以档住这种点击的诱惑力。</li>    <li>论坛标题要主动申请置顶。如：刘亦菲喝完三鹿奶粉怎么变成这样子了(严重申请至顶)！</li>    <li>问题式标题效果更好。如本文的&ldquo;如何优化网站的标题标签？&rdquo;</li>    <li>猜想类、预测类、盘点类标题效果更好。如：&ldquo;赵本山有望替代罗京主持新闻联播&rdquo;，&ldquo;2008年赚钱最多的十大女富豪&rdquo;。</li>    <li>自嘲型标题效果更好。如：原来我比芙蓉姐姐还出名。</li></ul><p><b>2，Title标签尽量要有原创性。</b></p><p>标题标签原创性更有利于搜索引擎的索引。这个也非常容易理解，举个例子，在一片五颜六色的广告牌旁边，矗立一座黑白广告牌，营销的效果应该比那些彩色广告牌效果更直接。</p><p>如果没有原创的能力，我们可以对采编过来的内容，进行适当的修改，添加些原创因素，有助于提高网页搜索引擎的收录。</p><p><b>3，标题标签体现品牌的策略。</b></p><p>尽量在标题标签中提到你的品牌、产品或网站名。我曾经在天骄语文网（<a href="http://www.tj66.net">http://www.tj66.net</a>）上面做过实验，有意识地将网站名称融入到各个标题标签里面，这样有助于一部分没有将网站加入收藏或者在不同电脑上网的用户，帮助他们快速在搜索引擎里面寻找到您的网页，以后要再度到访也会比较方便。我统计了下，目前每天都有上百人次通过搜索&ldquo;天骄语文网&rdquo;这个网站名称到达该站。</p><p>研究证实，有牌的商品跟无牌的商品放在一起时，消费者倾向于购买有牌的商品。将这个研究应用到搜寻引擎结果上也是相同的，搜寻者倾向点击他们有印象的网站，而不是他们从未听过的网站。因此在标题上面，一般我们采取&ldquo;文章名-分类名-网站名&rdquo;的写作策略。当然，如果标题标签过于冗长，可以只要：&ldquo;文章名- 网站名&rdquo;，还嫌长的话，只要&ldquo;文章名&rdquo;即可。中间我们可以用分隔符&ldquo;-&rdquo;来注释，&ldquo;|&rdquo;、&ldquo;&gt;&rdquo;等也都是不错的选择，甚至也可以混合使用，例如&ldquo;页面标题 -&nbsp; 小分类名称 &gt; 分类名称| 网站名称&rdquo;这样也是可以的。</p><p>企业网站首页Title标签可以这样写：对公司的描述性词句/公司对外宣传的口号+公司名，或者公司名+描述性词句。个人网站首页的标题标签也大致上可以如此描写：对网站的描述性词句/网站口号+网站名，或者将网站名提前。</p><p>最后，请大家注意，只有使用者将你的站点设置为可信赖的网站，搜索引擎也才会逐渐地将您的网站设置为可信赖的网站。走出SEO才是最好的SEO，您可以参看下天骄写的SEO三十六计之&ldquo;走为上&rdquo;（<a href="http://www.dugutianjiao.com/post/seo-zouweishang.html">http://www.dugutianjiao.com/post/seo-zouweishang.html</a>）。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-title-secret.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=42</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=42&amp;key=5e8e73a5</trackback:ping></item><item><title>SEO两百个秘密：百度、Google等图片搜索引擎的SEO策略（上）</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/baiduimage-seo-shang.html</link><pubDate>Sun, 30 Nov 2008 01:43:19 +0800</pubDate><guid>http://www.dugutianjiao.com/post/baiduimage-seo-shang.html</guid><description><![CDATA[<p><b>图片搜索引擎优化的趋势和必要性</b></p><p>我们通常在说到SEO时，一般都是指文字方面的优化，SEOer大多是专攻网页搜索的优化，绝大部分的关注度都在于如何将常规搜索中的流量带到网站中去，对于图片的搜索引擎优化这块几乎很少涉足。</p><p>但是，对图片搜索进行搜索引擎优化已经逐渐成为一种趋势。Google和百度等都有专门的图片索引库，很多新闻搜索，购物搜索，以及社会化搜索，都包括了图片搜索在内。Alexa数据显示，目前图片搜索约占百度总搜索量的12%左右，百度日本站一度曾76%以上流量来自图片搜索。</p><p>以下是Google和百度图片搜索频道访问量的Alexa统计数据（2008年11月29日截取），数据显示图片搜索占Google总流量的10％，位居Google第三大频道；占百度12％，为百度第二大频道：</p><p><img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/11/baidu-liuliang-image.jpg" alt="" title=""/><br /><a href="http://image.baidu.com">百度图片搜索</a><br />&nbsp;</p><p><img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/11/google-liuliang-image.jpg" alt="" title=""/><br /><a href="http://www.dugutianjiao.com/upload/2008/11/200811291515405581.jpg[/IMG]&lt;br &gt;&lt;/a&gt;Google 图象搜索&lt;a href=">Google图片搜索</a>&nbsp;</p><p>你在百度图片搜索许多人气较旺的关键字，得到的图片，都是一些做到了极致的主题网站的图片优化，他们网站70%的流量都是来自图片搜索，独孤天骄曾经对自己网站一张&ldquo;春天&rdquo;的主题图片做了简单优化实验，51啦统计数据显示每天这个页面的独立ip达到5000左右。图片具有更好的用户体验，相对文字来说用户更容易点击图片，同时带动这个页面的Google Adsense广告点击率特别高。所以，我们完全有必要对网站的图片进行搜索引擎优化，以给网站带来更多的流量，获取更多收益。</p><p><b>百度搜索引擎图片搜索优化的特点</b></p><p>不过，针对图片搜索的搜索引擎优化，并不是一件容易的事情，它不像网页<a href="http://www.dugutianjiao.com">搜索引擎优化</a>那么容易研究。主要原因在于目前搜索引擎并不能很好的识别出图片信息，据说Google搜索引擎的新技术已经能辨认出图片中的文字。但是目前主流搜索引擎还没有办法都做到这个，图片不像文字，搜索引擎对文字内容的识别，可以通过自身的文字识别系统来判别出，而图片的搜索对于搜索引擎来说，图片的识别难度要比文字的难很多，然后搜索引擎还要匹配上搜索的关键词，给出一个适当的标签就难上加难了。<br />&nbsp;<br />但也正因为这样，图片搜索更有自己的优势之所在：</p><p>首先，图片所处的竞争环境不激烈，图片搜索目前还没有被SEO普遍接受，更不要谈一般的站长了，所以它比常规的搜索有更多的优化机会；</p><p>其次，图片可以包含更多信息，像一些图片分享网站有更多的内容做为搜索引擎排名依据，他们比普通的网页包含更多的信息；</p><p>最重要的一点，百度图片搜索引擎跟网页搜索引擎是分开的，即使你的网站已经被百度屏蔽掉，依然可以做图片搜索，从图片搜索引导来高质量的流量。</p><p><b>如何让搜索引擎收录网站的图片</b></p><p>在图片搜索中能否得到流量，取决于你的图片能不能得到收录并获得好的排名。</p><p>让搜索引擎更好更多的收录我们网站的内容一直是我们站长努力的目标，文本文档收录相对比较容易一点，但是如何让百度等搜索引擎更好的收录网页中的图片也是我们应该考虑的问题，特别是对于纯图片网站来说。</p><p>一般来说，只要你的网页能被搜索引擎收录，图片文件也会被爬虫顺着链接抓取，不过一定要注意确保我们保存图片的文件夹没有被Robots.txt文件给阻止掉。很多站点由于流量、盗链等原因，对图片的连接都进行了屏蔽，同样的也把搜索引擎的蜘蛛也挡在了门外，使搜索引擎无法抓取到图片，这也是一个需要进行权衡的问题。</p><p>其次，我们还可以使用<a href="http://www.dugutianjiao.com/post/seo-robots-txt.html">Robots.txt文件</a>区分文件图片和新闻图片。</p><p>我们没有必要优化网站上的所有的图片，比如模板中使用的图片、导航中的图片、结构上用到的图片还有背景图片等等，我们不用为这些图片添加ALT标签，我们可以把这些图片放在一个单独的文件夹里。并通过设置robots.txt文件来阻止蜘蛛抓取这个文件夹。再把关于产品、事件，特别是新闻相关的图片，就是你需要被人了解的图片，存在另外一个文件夹下，并确保这个文件夹能够被搜索引擎蜘蛛访问到。<br />&nbsp;</p><p>设置所有的蜘蛛都被阻止抓取不需要的文件夹图片：<br />User-agent: *<br />Disallow: /Images<br />也可以只阻止Google图片搜索蜘蛛抓取不需要的文件夹：<br />User-agent: Googlebot-Image<br />Disallow: /Images</p><p>最好，要避免有重复内容。举个例子，你的网站上的一张图片有三种形式存在：较小尺寸的图片，中等尺寸的图片，较大尺寸的图片。那么，不要让这三张图片都被索引到。处理这种情况的最好的方式还是用robots.txt文件告诉蜘蛛不要抓取你不想被索引的图片版本。</p><p>记住不要使用java链接图片文件。如果你那样做的话，搜索引擎是无法检索到你的图片文档的。</p><p>（百度、Google等图片搜索引擎的SEO策略（上）结束，下篇我们将介绍<b><a href="http://www.dugutianjiao.com/post/baiduimage-seo-xia.html">如何提高自己网站图片文件在搜索引擎中的权重</a></b>。）</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/baiduimage-seo-shang.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=40</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=40&amp;key=80bb6e42</trackback:ping></item><item><title>SEO两百个秘密：百度、Google等图片搜索引擎的SEO策略（下）</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/baiduimage-seo-xia.html</link><pubDate>Sun, 30 Nov 2008 01:38:47 +0800</pubDate><guid>http://www.dugutianjiao.com/post/baiduimage-seo-xia.html</guid><description><![CDATA[<p>上篇的《<a href="http://www.dugutianjiao.com/post/baiduimage-seo-shang.html">百度、Google等图片搜索引擎的SEO策略</a>》，我们主要介绍了图片搜索引擎优化的趋势和 必要性、特点，并且分析了如何让搜索引擎收录网站图片的策略，本篇独孤天骄拟就如何提高自己网站图片文件在搜索引擎中的权重问题做一简要分析。</p><p>&nbsp;在搜索引擎还无法成功的识别图片的真正内容之前，SEOer需要帮助搜索引擎来识别这些图片内容。</p><p>一张完整的图片，它需要什么内容呢？<a href="http://www.sogou.com/labs/">搜狗实验室</a>里有一个&ldquo;<a href="http://www.sogou.com/labs/dl/p.html">互联网图 片库</a>&rdquo;，它给出了一个存储图片相关元数据的Meta_Data，这些数据对于我们了解图片搜索的具体优化方法有很大的帮助，具体格式如下：</p><p>＜PIC＞<br />＜PIC_URL＞图片在互联网中的URL地址＜/PIC_URL＞<br />＜PAGE_URL＞图片所在网页的URL地址＜/PAGE_URL＞<br />＜ALT_TEXT＞图片的替换文字＜/ALT_TEXT＞<br />＜ANCHOR_TEXT＞以图片为目标的超链接的显示文本＜/ANCHOR_TEXT＞<br />＜SUR_TEXT＞页面中提取的图片周围的文本＜/SUR_TEXT＞<br />＜PAGE_TITLE＞图片所在页面的标题＜/PAGE_TITLE＞<br />＜WIDTH＞图片的宽度＜/WIDTH＞<br />＜HEIGHT＞图片的高度＜/HEIGHT＞<br />＜/PIC&gt;</p><p>下面独孤天骄就针对图片搜索进行搜索引擎优化提出如下相关建议，以下对图片搜索引擎优化的总结，谷歌和百度都基本适用，但不同搜索引擎对下列排名因素的权重分配是不 同的，还需在实践中不断挖掘和总结：</p><p><strong>1、图片的替换文字。</strong></p><p>在图片的替代文字中，即Alt标签加入关键字，这是优化网站图片的最重要的一点。大家都知道，目前搜索引擎很难读取图片中的文字，所以它判断图片的一个重要方法就是看 alt标签的注释，如&lt;img src=&quot;http://www.dugutianjiao.com/upload/2008/11/dugutianjiao.jpg&quot; alt=&quot;独孤天骄的形象照&rdquo;&gt;&nbsp;，百度、 Google等图像搜索引擎就会大致判定（还有其他参照标准）这是一张关于独孤天骄的形象照的图片。</p><p>&nbsp;<img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/11/dugutianjiao.jpg" alt="" title=""/></p><p>但这个代码不完整，起不到最好的SEO作用。一个标准的图片嵌入代码根据搜狗实验室的数据应当包含的5个关键性标签：src、width、height、alt和title，其中alt标签最为 关键。&nbsp;</p><p>举个例子，上图规范的HTML代码就应当为：&lt;img src=&quot;/upload/2008/11/dugutianjiao.jpg&quot; width=&quot;64&quot; height=&quot;64&quot;alt=&quot;独孤天 骄的形象照&quot; title=&quot;独孤天骄的形象照&quot; /&gt;。alt属性作用是替换图片文字，当图片因人为或非人为原因无法显示时，图片位置出现alt替换的文字，title属 性是为当前的对象提供额外的说明，因此title对排名的影响也是非常大的，所以在对图片属性进行设置时，应注重title属性的描述，当然有时候也可以省略，以避免关键词堆砌 嫌疑。</p><p>普通程序员，不注重图片SEO的话，一般写法都是：&lt;a href=&quot;#&quot; title=&quot;图片关键词&quot;&gt;&lt;img src=&quot;图片路径&quot; border=&quot;0&quot; /&gt;&lt;/a&gt;，这样仅是鼠标移动到图片上提示图片关键词，百度图片即使抓取到了图片，排名也不是很理想。规范的图片SEO还必须标注出图片的大小 和title，后面的几条你看完就知道为什么了。</p><p><strong>2、以图片为目标的超链接的显示文本。</strong></p><p>我们使用超链接打开图片，超链接的锚文本应当包含图片的关键字，比如你要链接本文的那张形象照片，就不宜使用&ldquo;点击获得完整尺寸&rdquo;等链接文字，而应当试着 使用诸如&ldquo;独孤天骄的形象照&rdquo;之类的命名形式。</p><p>不仅网页需要外链，图片同样也需要外链，给图片增加一个外部链接，并且链接锚文本含有关键词有助于提高图片的搜索权重。</p><p>图片的站内链接可以用指向页面的主要关键词作为ALT内容，另外在图片下搭配一个文字链接作为辅助，写一些有选择性的文本(它会显示在GOOGLE的图象搜索结果中)，将会吸 引用户的注意并进入网站。在网页设计过程中，最好是将每一处图片+文字的导航区域都作为一个单独的div来处理。</p><p>&nbsp;<b>3，页面中提取的图片周围的文本。</b></p><p>如果你用百度或Google搜索图片，会发现在每张图片下都有一段描述性文字，其中关键字用粗体显示。图片搜索就是通过分析页面上图片附近的文字、图片标题以及许多其它元 素来确定图片内容的。搜索引擎在抓取内容和图片的时候，除了直接抓取图片之外，还会分析在图片前后的文字内容，以帮助确定图片的内容。一般说来，图片文件名与Alt标签方 面均存在很大的作弊可能，而网页中的文字则会真实地反映网页的内容，Google等搜索引擎使用这种方法可以在更大程度上避免Spam的作弊，保证图片搜索结果的准确性。</p><p>既然搜索引擎在抓取内容时会看图片周围的文字来决定图片的相关性，那么在图片周围就应该有关于图片信息的描述，添加包含关键字的描述信息将可以优化网站图片在搜索引 擎中的排名。</p><p>另外，提取图片的这个页面也应该优化，如果这个页面的排名上去了，相关图片的搜索排名应该也会一并提高。所以，切记优化图片所在的页面和优化图片本身同样重要。</p><p><b>4，图片所在页面的标题。</b></p><p>百度收录图片的重要参考已经慢慢从alt中脱离出来，更多时候参考的是图片前后描述文字的一部分。但是如果图片没有alt，也没有文字描述，搜索引擎怎么办？</p><p>经过独孤天骄的实验，搜索引擎主要参考该页面的文章标题。因此我们要注意图片所在的页面标题应该包含图片信息中提炼的关键词。</p><p>大致上来说，title、alt与keywords三个标签越相似，越容易被收录，排名越容易靠前。</p><p><b>5，图片的宽度与高度、创作质量等。</b></p><p>图片的文件大小，宽度与高度，图片本身的创作质量都成为制约搜素引擎排名的因素。</p><p>首先，我们必须注意图片的尺寸以适应搜索引擎，比如你链接的是一张壁纸，那么壁纸的大小就应当符合规范。因为Google、百度等图片搜索都提供根据图片尺寸来搜索。</p><p>其次，图片的创作质量也有助于图像搜索排名。对于很多做产品的站点来说，尤其是针对一些特定的产品型号，一张高质量、清晰的图片往往更能带来潜在的客户，毕竟图片所 带来的视觉上的判断比文字的要强许多，one image beats thousands of words。</p><p>加利福尼亚州大学的研究员们声称，关于图象搜索的未来他们已经找到了一种基于内容的识别图片的更好的方法，它包括通过对图片中的色彩、纹理和线条进行分析，然后确定 用以描述图片的对象。这些对象可以通过那些分析功能找出来并与其他图片中找到的结果产生互比性。&nbsp;</p><p>参与这项研究项目的Google公司研究工程师佩德罗莫雷诺说，这个新研究成果新增的一个步骤是用来得到关于图片的语义标签或者文字标签的。这样，假设有一幅图片画的是一 直爬在草坪上的狗。通过新方法分析得出的可比性对象是狗，它可以与同类图片中的其他对象如猫或者鱼形成对比，从而区分不同的图片。然后计算机可以对那些对象进行统计分 析，给出满足所有特征对象的图片。系统还可以评定搜索出的图片与想查找的图片之间的相似度，比如将其他画有狗的图片标注60％的相似度，而对带有猫或者鱼的图片标注20％ 的相似度。这样，计算机就可以识别出图片中画了一只狗。莫雷诺说，这种方法的要害就是从语义的角度来定义图片。这好象可以大大提高图片搜索的准确性。&nbsp;</p><p>因此创建独特的图像内容；使用自己的而不是其他网站的图片；提供高质量的图片对提高图片网站的长期排名肯定是有很大的作用的，专家一致认为图片如果是原创的会有很大 的优势。这跟文本的优化异曲同工了，&ldquo;内容为王&rdquo;。在百度和Google搜索关键词壁纸时，排在结果页第一位的，就是猫猫壁纸酷。图酷（www.tucoo.com）、猫猫壁纸酷（www.wallcoo.com）这两个夫妻站，长期的手工 高质量更新站点而占有较好的图像搜索排名就直接证明了这一点。</p><p>经常更新图片。如果你的图片网站很长时间没有变化，其排名可能被降低。</p><p><b>6，图片的命名。</b></p><p>给你的图片取个描述性文件名，用适当的关键词来命名图片。比如上图的照片是跟独孤天骄相关的，你就可以取名叫dugutianjiao.jpg，使用这种具有描述性质的文件名，而不 是123.jpg这类只是代号的名字，当然也可以让图片的文件名与ALT标签里面的内容相同或者一致。默认的名字对搜索引擎没有任何的沟通作用，因此应该事先设定一套命名结构体系。文件名中包含关键词对于图片搜索引擎优化来说，非常有帮助，你可以用合适的关键词来命名图片，但是不要堆砌关键词。</p><p>虽然我们在使用图片搜索时，通常输入的关键字以汉字居多，但汉字命名图片还是不可取的，浏览器对汉字的支持和解释很不稳定，所以建议尽量以英文单词或缩写作为图片的 文件名。尽量使用可以自定义或修改上传图片文件名的信息发布系统，如果不规范文件名，那将失去很多图片排名靠前的机会。</p><p><strong>7、使用最适合的图片格式。</strong></p><p>图片格式有很多种，比如jpeg，gif，png等。目前，搜索引擎图片库中，大多数图片的文件格式是JPG，JPEG，GIF。搜索引擎通常将GIF格式的当作是标准的256色彩的图片，将 JPG的当作是拥有上百万色彩的照片。那么如何选择合适的格式呢？这里有个原则，如果是照片类的，那么用jpeg，如果是图标，装饰性的图片，那么用gif，而png很多时候用于照 片类的也不错。百度还支持bmp格式，不过bmp默认保存的文件大小太大，你用qq截图默认保存一下然后看看文件大小就知道了，不建议使用。</p><p><b>8、使用自己的而不是其他网站的图片。</b></p><p>图片一定要本地化保存。链接别人网站的图片来做百度排名是不可能的，蜘蛛会顺着图片抓到别的网站上去，不要为了节省空间而丢失流量。很多站点由于流量、盗链等原因，对图片的连接都进行了屏蔽，同样的也把搜索引擎的蜘蛛也挡在了门外，使搜索引擎无法抓取到图片，这也是一个需要进行权衡的问题。</p><p>保存的时候，要注意将图片频道增加分类，尽量让图片主题与所在目录保持一致，例如pixels目录里面包含一些像素画的图片应该就比较理想。在发布新的图片时候尽量自动生成静态页面，以便搜索引擎收 录。有条件的话，可以将数据和图片分别放在2台服务器上。像一些大型网站，下载文件、图片文件、数据库甚至评论都是单独一台服务器的。</p><p>分类的情况可以反映在classification标签上面，比如：</p><p>keywords：<br />description：<br />classification：图片/像素画/个人形象/<br />author：独孤天骄-SEO研究院<br />copyright：Copyright 2008-2009 SEO研究院版权所有</p><p><b>9、提供会引起社会效应的图片。 </b></p><p>被访客点击量大的图像更容易让智能化的搜索引擎排在索引前面。在使用像flickr之类的图片存储服务时，最好为图片加上tag。为了更好地提高 图片的搜索引擎权重，有时候我们会为某个类型的图片建立一个专题，以告诉搜索引擎这个图片的重要性。</p><p>一般来说，排在前面的图片，基本都是关于这张图片的一个专题介绍。专题形式本身就告诉了搜索引擎这个图片的重要性。</p><p><b>10、写作文章的时候尽量注意图文结合。</b></p><p>在发布文章的时候，不要忘记包含一张图片，或者一个连接到一张图片。在文章上加图片，会使这些文章更容易吸引读者，而且看起来更不像软文。</p><p><b>11、没有必要优化你网站上的所有的图片。</b></p><p>我们上篇已经说过的使用Robots.txt文件，确保图片可以被搜索引擎抓取。记住不要使用java链接图片文件。人们经常犯的一个错误就是&ldquo;点击小图变大图&rdquo;中里面有一个javascript连接，这个链接搜索引擎以前是一直无法抓取的。确保我们保存图片的文件夹没有被Robots.txt文件给阻止掉。比如模板中使用的图片、导航中的图片还有背景图片等等，我们不用为这些图片添加ALT标签，我们可以把这些图 片放在一个单独的文件夹里。并通过设置robots.txt文件来阻止蜘蛛抓取这些图片。</p><p>避免有重复内容。举个例子，你的网站上的一张图片有三种形式存在：较小尺寸的图片，中等尺寸的图片，较大尺寸的图片。那么，不要让这三张图片都被索引到。处理这种情况的最好的方式是用robots.txt 告诉蜘蛛不要抓取你不想被索引的图片版本。</p><p><strong>12、使用Google网站管理员增强型图片搜索功能</strong></p><p>Google 目前提供增强型搜索功能，可搜索您网站中的图片，这些功能包括用于 Google 所托管图片的高级标签技术。你可以使用Google 帐户登录 Google 网站管理员工具，然后点击所需网站的网址，点击&ldquo;工具&rdquo;，然后点击&ldquo;启用增强的图片搜索&rdquo;。把&ldquo;我想在我的网站上启用增强型图片搜索，而且我有加入此项高级服务的权限&rdquo;选项打勾，并确定即可。</p><p>&nbsp;启用增强型图片搜索功能，Google 将使用<a href="http://images.google.com/imagelabeler/">Google Image Labeler</a>等工具将你网站所包含的图片与标签相关联，以优化这些图片的索引并提高搜索质量。在Google的Labeler中有一个有意思的工具，就是通过两个匿名的用户对同一张 图片进行标签标识，来帮助Google提高图片识别的能力。你也可以试试看，自己的标签标识能力。</p><p><b>13、检测被搜索引擎图片搜索索引的图片</b></p><p>为了检测我们对网站图片的优化方法是否成功，我们需要监测搜索引擎对网站图片的收录率。方法仍然是在搜索栏中输入site:www.dugutianjiao.com（将<a href="http://www.dugutianjiao.com/">www.dugutianjiao.com</a> 替换成你需要查询的域名即可），其他搜索引擎也有类似功能。</p><p>当然，图片的SEO方法还有很多，但是万变不离其宗，只要图片的内容与质量上去了，排名上去是早晚的事情。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/baiduimage-seo-xia.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=41</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=41&amp;key=58e70772</trackback:ping></item><item><title>SEO两百个秘密：Google TrustRank及其影响因素分析</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-trustrank-secret.html</link><pubDate>Fri, 28 Nov 2008 01:31:40 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-trustrank-secret.html</guid><description><![CDATA[<p><b>什么是Google TrustRank</b></p><p>Goolge TrustRank翻译过来就是Google信任指数，是Google对于网站信赖程度的指数。搜索引擎信任值，是为了确保高质量的站点能够获得搜索引擎的第一时间关注，并保证原创的优先性，从而确保好的网站能获得更高的搜索表现。</p><p>Google自己最早关于TrustRank的论述：&ldquo;垃圾页面经常使用各种各样的作弊方法来获取一个好的搜索引擎排名，虽然人工可以很容易识别这些垃圾，但问题是这么多的页面，靠人工是无法完成的，所以我们就提出了我们最新的半自动的一种技术方案。我们首先让我们的专家选择一些好的样板页面，然后分析他们的连接结构并以此结构来比较其他页面，进而发现那些没有作弊可能性较大的页面。我们讨论了好几种样板选择和如果发现优质页面的方案， 我们利用AltaVista在因特网上进行了实验，并评估了我们这项技术的效果，结果证明我们能够很好的通过网上一小部分优质的网站来辨别垃圾页面。当然这些优质的样板网站数量不得少于200个。&rdquo;</p><p>独孤天骄的理解是，Google的TrustRank首先是对网站的&ldquo;信任&rdquo;，其次才是对网页的&ldquo;信任&rdquo;。就是说，只要你的站点获得较高的TrustRank值，那么你站内的网页也就获得或者很容易就可以获得较高的TrustRank值，从而获得较好的排名，这一点跟PR的单纯链接权重不相一致。在这个意义上，它甚至超过了我们平常所关注的关键词密度，PR值，链接广泛度，链接数量等因素。</p><p>&ldquo;<u>沙盒效应</u>&rdquo;也许就是Goolge TrustRank的一个延伸，当然这二者关系是很微妙的，高TrustRank值的站点容易逃出SandBox，但逃出SandBox的站点才有可能获得高TrustRank值。这个矛与盾的观点就涉及了到底鸡生蛋还是蛋生鸡的哲学问题了。</p><p><strong>Google TrustRank出现的背景</strong></p><p>由于Google搜索引擎在计算网页排名的时候，非常依赖连接，逐渐形成了Google PageRank，但是单纯依靠PR的办法已遭到了各种各样作弊行为的挑衅。Goolge TrustRank则采用半人工的方式，通过Google或其他一些检索机构的专家，先确定一批站点的TrustRank值，再通过机器的连接结构分析来确定互联网上其他站点的TrustRank值，然后以TrustRank值的高低来做为网页排名的一个重要依据。TrustRank是与PageRank相关的链接分析技术，用以将来自Spam的链接与优质内容带来的真正意义上的好评区别开来，其计算的基础是大部分优秀的文件很少链接至Spam。在处理上TrustRank分两个步骤，源目标的选定和评分的传递。一个超链接文件的TrustRank用来评价其是否具有真正的权威性。跟PR值原理类似，如果其他站点获得了来自高TrustRank值站点的连接也将获得更高的TrustRank值。作为PR的准替代品，Goolge TrustRank重要性不言而喻，甚至已经超过PR值的作用。</p><p><b>影响Google信任指数的一些因素</b></p><p>网站信任度有两方面的意义，一方面指浏览者对于站点的信任程度，另一方面指搜索引擎对于网站的信任值（TrustRank）。独孤天骄认为获得搜索引擎信任，提升搜索引擎信任值，有利于提升权重和<a href="http://www.dugutianjiao.com">搜索引擎排名</a>，具体可能涉及到的参数但不限于：</p><p>1、域名的历史。要获得较高信任值，网站的历史肯定是个很重要的因素。包括网站域名的注册时间（域名续费的时间越长越好）和开通时间（即被Google检索到的时间），开通较长的站点更值得信任。</p><p>2、频繁的有规律的更新。更接近一个好站点的实际内容增加模式，持续不断的原创内容。这一点我们可以从几乎所有的新闻源，都是极高的TrustRank看出。</p><p>3、外部连接的质量和连接分布情况；内部链接没有无效链接，404错误等；保证网站良好的导航结构。</p><p>4、服务器的质量。包括独立的IP、网站能够持续稳定的可访问。</p><p>5、没有作弊行为，优化痕迹不要太明显。</p><p>6、尽量不要频繁的改版，会影响搜索引擎对网站的印象。</p><p>7、用户行为。搜索结果被点击情况和工具条搜集的点击量。</p><p>8、一些用户体验的优化，比如关于我们页面、联系方式、版权信息、隐私保护、网站ICP备案许可。对用户体验友好的网站一般也受搜索引擎的喜爱，因为搜索引擎搜索出来的东西本来就是给人看的，<a href="http://www.dugutianjiao.com">SEO</a>不能抛弃内容。</p><p><b>怎么判断Google对站点的TrustRank</b></p><p>虽然我们可以通过站点文章被索引的时间和权重来判断等等因素来综合判断，但目前还没有确切的<a href="http://www.dugutianjiao.com">SEO</a>方法可以操作。不过独孤天骄找到一个简单的办法，就是看Google对你站点的索引有没有形成SiteLink，如果有的话，则证明Google对你网站的TrustRank指数比较高，如果没有，则尚需努力。至于如何形成Sitelink，大家可以看这篇文章：<a href="http://www.dugutianjiao.com/post/seo-sitelinks-secret.html">http://www.dugutianjiao.com/post/seo-sitelinks-secret.html</a>。</p><p>但是，随着时间的推移，Trustrank引起的新问题开始渐渐凸显。搜索结果充斥着著名和权威站点的影子，即使这些页面内容可能是Spam。这就是为什么用一些权重高的站点发布同样的内容页，排名要明显高得多的原因。而一些好的个人站点或企业站点，尤其是新建的站点，即使内容非常好，在排名上也很难获得更多的优势，这个已经渐渐影响Google搜索结果的质量。</p><p>参考文献： <br />SEO两百个秘密：搜索引擎的&ldquo;沙盒效应&rdquo; ：http://www.dugutianjiao.com/post/seo-sandbox-effect.html，独孤天骄。<br />什么是Google信任指数TrustRank? http://www.dunsh.org/2006/08/12/what-is-google-trustrank/，石头<br />SEO两百个秘密：Google TrustRank及其影响因素分析链接地址：<a href="http://www.dugutianjiao.com/post/seo-trustrank-secret.html">http://www.dugutianjiao.com/post/seo-trustrank-secret.html</a></p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-trustrank-secret.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=39</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=39&amp;key=22feb831</trackback:ping></item><item><title>SEO两百个秘密：域名的选取及对SEO的影响</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-domain-secret.html</link><pubDate>Sun, 23 Nov 2008 17:41:00 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-domain-secret.html</guid><description><![CDATA[<p>域名(domain)是网站独一无二的身份证，用户访问并辨别不同网站最重要的途径就是通过域名，因此决定注册或启用一个新域名的时候，必须注意域名的选取及对SEO的影响，这是网站成功的第一步。</p><p>那么，域名的选取和注册到底需要注意什么呢？</p><p><b>1，可以选取包含关键词拼音的字符作为域名</b></p><p align="left">比如SEO研究院的域名（<a href="http://www.dugutianjiao.com/">http://www.dugutianjiao.com/</a>）就是直接将我的名字融入域名之中，这样做，对提升主关键词&ldquo;独孤天骄&rdquo;在搜索引擎的位置是很有帮助的，也有助于树立品牌效应。我们在搜索引擎上搜索关键词&ldquo;独孤天骄&rdquo;，都排在索引前三位，随着权重的逐步上升，一定可以达到第一位的。</p><p align="left">另外，从浏览者的角度来看，选择好记的拼音作为中文网站的域名，浏览者可以清晰的阅读你的域名或者理解其含义，不仅方便了访客的记忆，还可以提高访客的回访率。</p><p align="left"><b>2，域名的后缀。</b></p><p>大家都知道.edu和.gov等域名在搜索引擎中实际占的权重会比一般的后缀高。因为edu域名是专门给教育机构注册的，gov则为政府官方专用域名，所以这两个域名天生在搜索引擎中的权重就要比一般的域名高。</p><p>另外，.com原则上比.cn的要好，.org次之，.net权重则可能要更低一点，.cn域名由于现在一元钱一个，所以被大量垃圾站滥用，所以在搜索引擎中的权重也就相对更低一些。但是这并非绝对，如果你的网站仅是针对大陆用户，那么Google等搜索引擎则有可能更加专注.cn。</p><p>最后，这只是猜测，并没有任何一家搜索引擎官方确认这一原则。</p><p align="left"><b>3，域名的长度。</b></p><p align="left">没有任何权威的资料证明域名在<a href="http://www.dugutianjiao.com">SEO</a>中并非越短越好，搜索引擎其实并无所谓域名的长短与否，因为这本身不碍于他的索引结果。</p><p align="left">你可以在百度搜索下&ldquo;<a target="_blank" href="http://www.baidu.com/baidu?word=%D7%EE%B3%A4%B5%C4%D3%F2%C3%FB&amp;tn=brodsun">最长的域名</a>&rdquo;，不乏数十位字符长度的域名。不过对于浏览者便于识别来说，越短的域名却越容易被记忆，在SEO工作中，有一个衡量的标准就是客户的回访度，如果一个域名越容易被识别与记忆，那么对于客户的粘度来说有一定的辅助效应，有利于你的口碑宣传。</p><p align="left"><strong>4、在域名中加&ldquo;-&rdquo;后对SEO的影响</strong></p><p align="left">带有连接符号的域名并不会被搜索引擎特殊对待，不会出现什么收录数目的巨变。对搜索引擎，尤其是英文搜索引擎，&nbsp;使用&ldquo;-&rdquo;则有助于其辨别域名的含义，比如&ldquo;iamaseo&rdquo;，搜索引擎可能会错误分词，但是如果域名写为&ldquo;i-am-a-seo&rdquo;，则搜索引擎一定会正确分词为&ldquo;I am a SEO&rdquo;，不过独孤天骄并不建议使用&ldquo;-&rdquo;。因为搜索引擎完全可以通过判断你的网站主题，渐而给域名正确分词；并且如此之多的连字符，给浏览者的体验很不好。</p><p align="left"><strong>5，注意不要注册有前科的域名</strong></p><p>非常重要的一点，域名选择的时候，一定要注意这个域名以前有没有被人注册过，可以通过<a href="http://www.archive.org/">http://www.archive.org</a>来查询域名历史。如果是有不良记录的，以前被搜索引擎摒弃的，再好的域名也不要考虑使用，除非你像淘宝网那样，可以屏蔽搜索引擎的索引。我曾经注册了<a href="http://www.tj66.com">www.tj66.com</a>，后来发现百度一直不收录，查了一下才知道这个域名原来是国外域名，已经被百度K过，用了许多方法，都无法被百度正确收录，只能放弃，转而采用<a href="http://www.tj66.net">www.tj66.net</a>域名。</p><p>当然，如果你发现一个好域名不是因为被K，而是因为忘记续费等原因被关停，那么就完全可以抢注下来。以前265.com就是将hao123上面已经失效的网址都给注册下来，然后再通过技术手段做转向到265，hao123巨大的流量访问到这些失效的网址便被转移到265，不费吹灰之力，265就拥有了数十万乃至数百万的ip，奠定了前期的流量基础。</p><p><b>6，提高域名信任度。</b></p><p>Google对域名信任度要求越来越高，甚至高到了无以复加的地步。提高自己网站的域名信任度有许多方法，不过都是网站域名注册之后的事情了，在注册之前，我们能做的就是，尽量以最长的时期，比如5年或10年来注册域名，而不是每年续费，按照每年续费的网站最大比例的就是垃圾站，因此SEO研究院建议每次延长的续费时间为5年。这个会让搜索引擎尤其是Google知道你并非想用这个域名来做垃圾站；另外要注意域名的Whois数据和网站上的联系方式吻合，这两点在Google的一个专利申请中曾经提到过，它有助于提高域名的信任度。</p><p>从总体上来说，提高域名信任度的根本方法，还是提供好的内容，吸引其他同样有可信度的域名链接向你。这一点，大家可以查看<a href="http://www.dugutianjiao.com/post/seo-zouweishang.html">SEO三十六计：走为上</a>。</p><p>参考文献：</p><p>1，SEO研究院：<a href="http://www.dugutianjiao.com">http://www.dugutianjiao.com</a><br />2，SEO三十六计：走为上：<a href="http://www.dugutianjiao.com/post/seo-zouweishang.html">http://www.dugutianjiao.com/post/seo-zouweishang.html</a><br />3，最长的域名：<a href="http://www.baidu.com/baidu?word=%D7%EE%B3%A4%B5%C4%D3%F2%C3%FB&amp;tn=brodsun">www.baidu.com/baidu?word=%D7%EE%B3%A4%B5%C4%D3%F2%C3%FB&amp;tn=brodsun</a><br />4，域名历史查询：<a href="http://www.archive.org/">http://www.archive.org</a><br />&nbsp;</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-domain-secret.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=35</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=35&amp;key=4e84f4ea</trackback:ping></item><item><title>SEO两百个秘密：关键词密度的常见问题</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-keywords-density.html</link><pubDate>Fri, 21 Nov 2008 22:41:00 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-keywords-density.html</guid><description><![CDATA[<p><b>一、什么是关键词密度？</b></p><p>要正确理解关键词密度，首先得理解什么是关键词？关键词就是搜索者在查找信息、产品或服务时，在搜索引擎界面中输入的词条。一般的规则是，关键词越长，从搜索引擎索引中返回的信息也就越精确。</p><p>关键词密度(Keyword Density)也叫关键词频率(Keyword Frequency)，所阐述的实质上是同一个概念，它是用来量度关键词在网页上出现的总次数与其他文字的比例，一般用百分比表示。相对于页面总字数而言，关键词出现的频率越高，那么关键词密度也就越大。简单地举个例子，如果某个网页共有100个词，而关键词在其中出现5次，则可以说关键词密度为5%。</p><p>当然，这个例子只是一种理想的简化方式，它没有有效包括HTML代码里面的诸如meta 标签中的Title、Keywords、Description，图像元素的Alt文本、注释文本等，这些在计算关键词密度时也都要考虑在内的。同样地，在计算关键词密度时，也不仅仅指网页可见部分中关键词出现的次数，也包括在上文中提到的非可见部分中的出现次数。同时，也要考虑Stop Words(停用词) ，这些词往往会在很大程度上稀释关键词密度。搜索引擎在算法上要比这复杂得多，但基本策略与此近似。</p><p><b>二、关键字密度对网站排名的影响</b></p><p>许多搜索引擎包括Google、百度、yahoo！等都将关键字密度做为其排名算法考虑因素之一，每个搜索引擎都有一套关于关键字密度的不同的数学公式。合理的关键字密度可使你获得较高的排名位置，密度过大，起到相反的效果。</p><p>&nbsp;就实施惩罚前所容许的关键字密度的阈值而言，不同的搜索引擎之间也存在不同的容许级别。对过度优化如关键词Spam而言，不同的搜索引擎容忍的阈值也不尽相同，从大到小排列大致依次是Google，MSN，然后是百度，sogou ，iask，yahoo！最低。</p><p><b>三、关键词密度的阈值</b></p><p>什么样的关键词密度为妙呢？关键词密度是一个模糊的概念，没有一个准确的公式来限定其密度。各家搜索引擎的密度值控制都不一样，甚至是同一家的搜索引擎，对不同网站的关键词密度的大小所能允许的容忍阈值也不相同，比如同样一个页面，新浪、CCTV的网站密度值达到20%可能就没有什么事情，你的估计就马上被屏蔽了。这还涉及到了搜索引擎的信任值问题，在此先不准备赘述。</p><p>关键词密度并不是越高越好。一般说来，在大多数的搜索引擎中，ing关键词密度在2%~8%是一个较为适当的范围，有利于网站在搜索引擎中排名，同时也不虞被搜索引擎视为关键词Spam。个人感觉在百度上的关键字密度对排名较为重要，5%左右的密度应该是比较理想的，Google的可以更高些。</p><p>怎样查询网页关键词密度，推荐上&ldquo;<a target="_blank" href="http://tool.admin5.com/ ">页面关键词密度查询</a>&rdquo;查询网页关键词的密度。</p><p>相对百度，Google搜索引擎赋予关键词密度的权重更小了，很多排名靠前的网页关键词密度可能高到20％以上，也可能完全没有关键词。独孤天骄曾经专门就这个观点做个实践，通过一个布满关键词的页面进行观察，百度更重视的是关键词密度，而Google相对而言，重视更多的则是外部链接的建立。</p><p>什么是增加keywords密度的最好方式？毫无疑问，最佳选择的是通过网站本身的内容来做为有效支撑！所以只要你按逻辑，按语法正常写你的网页，就不必太顾及关键词密度了。一个页面中出现keywords密度很高的情况，只要是实际需要的，便可以保留，毕竟网站是给你网站的浏览者看的，而不是做给搜索引擎看的，尽量提供最有价值的信息给访客才是最重要的考虑点之一，不过需要澄清的是，那样的页面有可能会被搜索引擎自动的过滤掉，因为关键字过多很可能会触发关键字堆砌过滤器(keyword stuffing filter)。</p><p><b>四、关键词出现的位置如何进行布局</b></p><p>要达到理想的<a href="http://www.dugutianjiao.com">网站优化</a>效果，不仅仅要为我们的网站或网页选定恰当的、有效的关键词，更重要的是如何在网页中恰当地将这些关键词嵌入到内容当中。对<a href="http://www.dugutianjiao.com">SEO</a>来说，这主要包括两方面的考虑：1、关键词的位置，关键词出现在页面文件的哪个部分及先后顺序，这对网页出现在SERP页面中排名影响近来逐步降低；2、关键词密度或关键词频率，在网页中关键词出现的频率越高，搜索引擎便会认为该网页内容与相应关键词的相关性更高，从而更易出现在SERP页面的前端。　</p><p>关键词分布是指这些关键字在网页上的位置。关键词密度中keywords出现的最好地方在哪儿？由于关键词密度是相对于整个网页的文本之比，那么对于出现的位置来说，可以出现关键词的地方可以是title标签、元标签、链接、headings、文本正文，或任何有文字出现的地方，比如alt标签甚至是注释。</p><p>title标签是一个网页最重要的搜索关键词放置的位置。在title标签内，关键字的布局方式是很重要的。最重要的关键字应放置在网页title标签的开头部分。如果放上全部关键字，则在title标签内有造成关键字堆砌(keyword stuffing)的危险。千万不要在title标签内使用任何关键字超过三次，否则有可能造成keywords密度过大而被搜索引擎过滤和抛弃。</p><p>有人使用网页中的alt属性来做为keywords密度加强，这个属性在搜索引擎中的权值已经被降低，但不是说没有用，结合alt属性中的锚文本和主页中的其他元素告诉搜索引擎该网页的主题。这样的做法不会受到惩罚，而且会对搜索引擎优化有一定的好处。</p><p>keyword可以有哪些出现的形式？对此有不同的理解和看法，理想的做法是将keyword整合到一句话中，当然还有复合的keyword词组，使用特别的排列方式，最好的做法是，研究搜索者可能的搜索行为和意识，将此做为参考的有力依据，那么整个的keywords密度会比较合适，从而达到比较好的效果。</p><p>五、<strong>关键字堆砌(keyword stuffing)</strong></p><p>关键字堆砌(keyword stuffing)是指在一个网页中非常密集地放置关键字。一般说来，如果关键字的出现过于频繁，就会盖过网页的其他内容。虽然过度使用关键字有可能触发 Google的过滤器(filter)，但更严重的问题是因内容难于阅读而造成访问流量的潜在损失。如果一个搜索者发现在一个页面到处都充斥着关键字，那么他几乎不可能在这个页面逗留，而且也不可能转变成一个付费客户。因此由于关键字堆砌而造成的损失是双重的。</p><p>关键字堆砌(keyword stuffing)的常见形式有哪些</p><p>众多关键字充斥于网页信息中就会形成关键字堆砌(Keyword stuffing)。这类网页看起来更像是一连串的关键字，而不像是别的什么东西。关键字堆砌的另一形式就是将关键字或关键词尽可能多次的填入页面的 title标签中。搜索引擎通常会降低这类网页的搜索排名，或者完全忽略这些关键字。这两种结果对网站都没有什么好处。关键字堆砌的桥页(doorway pages)或隐形页面(cloaked pages)不仅是过度使用关键字的例子，而且还是因自身原因而受到惩罚的因素。在所有导入链接(inbound links)中频繁使用相同的链接锚文本，也会被看作是关键字堆砌的一种形式。</p><p>一个网站如果采用关键字堆砌(keyword stuffing)的手法进行<a href="http://www.dugutianjiao.com">SEO</a>，将会受到搜索引擎的惩罚。Google似乎对于页面上过度使用关键字非常敏感，因为关键字堆砌会触发过滤器(filter)。搜索引擎巨人可能对网站采取的惩罚措施包括，降低其在搜索结果中的排名、降低其在Google的PR值以及禁止该网站。如同所有搜索引擎优化的努力一样，常识和考虑什么事情有益于你的网站浏览者，是任何一个站长最好的行为。</p><p>因此大家不要比着密度做文章，追求自然才是最好的。我们应该重新回归到建设网站的内容之中去。</p><p><b>参考文献：</b><br />关键词密度(Keyword Density)：<a href="http://seo.highdiy.com/index.php/seo/keyword-density/">http://seo.highdiy.com/index.php/seo/keyword-density/</a></p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-keywords-density.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=34</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=34&amp;key=29877e7d</trackback:ping></item><item><title>SEO两百个秘密：如何生成Google Sitelinks？</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-sitelinks-secret.html</link><pubDate>Wed, 19 Nov 2008 01:41:41 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-sitelinks-secret.html</guid><description><![CDATA[<p><b>一、什么是Google Sitelinks？</b></p><p>Google Sitelinks也叫站内链接，这种方式的索引结果在Google搜索引擎上已经存在了相当长一段时间。如下图，在搜索&ldquo;天骄语文网&rdquo;时，发现排在第一名的结果除了正常的显示标题、描述和网址之外，下面还以链接的方式列出几个该网站其他站内链接的标题，这说明站点&ldquo;天骄语文网（<a href="http://www.tj66.net/">http://www.tj66.net</a>）&rdquo;获得了Google Sitelinks：</p><p><img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/11/tj66.net-sitelink.jpg" alt="" title=""/></p><p><a target="_blank" href="http://www.google.com/support/webmasters/bin/answer.py?answer=47334&amp;topic=8523">Google的站长帮助中心</a>有官方对<font size="2">Google Sitelinks</font>的解释：</p><p><font size="2">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; The links shown below some sites in our search results, called Sitelinks,are meant to help users navigate your site .Our systems analyze the link struture of your site to find shortcurs that will save users time and allow them to quickly find the information they&rsquo;re looking for.<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; We only show Sitelinks for results when we think they&rsquo;ll be useful to the user. If the structure of your site doesn&rsquo;t allow our algorithms to find good Sitelinks , or we don&rsquo;t think that the Sitelinks for your site are relevant for the user&rsquo;s query ,we won&rsquo;t show them.<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; At the moment , Sitelinks are completely automated . We&rsquo;re always working to improve our itelinks algorithm, and we may incorporate webmaster input in the future.</font></p><p>翻译过来的意思就是：<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 显示在有些网站的搜索结果下面的链接，叫做站内链接（Stielinks），这些链接是为了帮助用户更好地访问你的站点。我们的系统通过分析网站的链接结构，来发现这种快捷方式，以帮助用户节省时间、更迅速地找到他们想要的东西。<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 只有当我们觉得这些站内链接对我们的用户非常有价值的时候我们才会把他们显示出来。如果你的网站结构不能让我们的算法找出高质量的站内链接，或者我们认为这些链接跟我们的用户搜索请求并不相关的时候，我们也不会把它们显示出来。<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 目前，站内链接完全是机器自动生成的，我们也一直在致力于提高我们的站内链接算法，将来我们可能会让我们的广大网站管理员参与进来。</p><p><b>二、Google Sitelinks有什么作用？<br /></b></p><p>Google Sitelinks一直被认为是高质量网站的一种表现，它意味着能够产生Google Sitelinks的站点在Google搜索引擎上具有很高的权重，它可以算是Google排名的最高境界了，至少目前而言。在这种情况下，搜索网站名称或品牌时，你的网站出现SiteLinks现象，不单单是可以吸引更多点击，更可彰显行业至尊地位，展示网站在品牌、网络营销方面实力！简而言之，你在Google的索引结果上&ldquo;广告位更大了&rdquo;。</p><p><b>三、Google Sitelinks的管理</b></p><p>如果你的站点产生了Google Sitelinks，你可以在<a target="_blank" href="https://www.google.com/webmasters/tools/siteoverview?hl=zh-CN">Google管理员工具</a>里进行管理，不过仅局限于选择是否接受Goolge自动匹配出的链接。你可以选择拦截不理想的链接显示，但是你无法添加自己认为重要的链接列表，从这点来看，Goolge实现的是完全技术化的匹配。</p><p>怎么拦截不理想的链接列表，其实很简单。</p><p>首先进入GG管理员工具，进入左边&ldquo;链接&rdquo;-&gt;&ldquo;网站链接&rdquo;，如果网站没有出现Google Sitelinks，将会提示&ldquo;Google 尚未针对您的网站生成任何网站链接。 网站链接完全是自动生成的，仅当我们认为这些链接对用户有用时，才会显示网站链接。如果您的网站结构不允许我们的算法查找正常的网站链接，或者我们认为您网站的网站链接与用户查询没有关系，就不会显示该网站链接。不过，我们将不断改进查找和显示网站链接的方法。&rdquo;</p><p>如果已经生成了网站链接，那么就可以选择点击&ldquo;拦截&rdquo;，链接时需要选择拦截原因，包括&ldquo;链接已损坏&rdquo;&ldquo;我不希望强调此页&rdquo;&ldquo;此标题不正确&rdquo;&ldquo;其他&rdquo;四个选项。设置后大概要4天才能见效，Google Sitelinks会被Google重新计算排序。</p><p><b>四、如何让你的网站产生Google Sitelinks？</b></p><p>产生因素可能很多，众说纷纭，有些SEOer说要被DMOZ收录超过半年以上，甚至需要超过50%的原创文章等，其实这些都不是主要的因素，因为<a href="http://www.dugutianjiao.com">独孤天骄</a>经手的几个站点并未被Dmoz等开放式目录收录，绝大部分站点在目前的国情下面也根本不可能有如此之多的原创文章，最多只能说网站拥有独立创造原创内容的能力。Alexa综合排名10w以内，流量在万级别以上，更是不可能，根据我的观察，流量几百上千的网站同样可以产生Sitelinks现象，以下也仅是独孤天骄结合网络上的一些<a href="http://www.dugutianjiao.com">SEO</a>分析，对Sitelinks现象产生的原因的推断，个人觉得，要形成Sitelinks必须有几个要素的共同作用：</p><p>1，首先我们知道，Google做Sitelinks的目的是为了保护网站品牌。触发Google Sitelinks的关键词往往是网站名称或URL中的特殊单词。</p><p>因此，必须确保自己网站在所在领域的影响力或所处行业内的知名度，这样就会伴随着产生大量行业内的相关性导入链接。</p><p>搜索网站名称或者品牌或者网站地址的时候，基本上可以说是网站名称在标题体现程度以及站内网页集相互连接的关系决定的。因此网页标题非常重要，网站所有页面的标题尽量都包含自己网站的名称，尽量使你的网站名称在内部网页集中合理地部署。&ldquo;品牌&rdquo;得到认同，那么产生sitelinks也就是顺理成章的了。&nbsp;网站名称也最好是独一无二的，比如我们在Google搜索&ldquo;中学语文网&rdquo;则无法产生Google Sitelinks现象，搜索&ldquo;<a href="http://www.tj66.net">天骄语文网</a>&rdquo;则可以。</p><p>2，其次，网站的权重要高。Sitelinks的产生需要一个过程，网站年龄得超过1年时间。网站拥有丰富的外链多且网站单向导入链接的锚文字中包含网站名称的比例高，很多外部链接都提到了你的网站名称，加之网站内部网页集中体现了网站品牌，自然会有一些用户直接搜索网站名称，这种非常明确化的搜索需求促使Google为便于搜索用户快速了解目标站点最主要的特色，便产生了链接列表。</p><p>PR值高的网站更容易产生Google Sitelinks，国际域名的权重要高于国内域名。&nbsp;</p><p>3，Sitelinks是高质量的站内链接，和网站的站内结构有很大关系，网站内部链接导航<a href="http://www.dugutianjiao.com">优化</a>是必须的，确保网站每个首页都有链接可以返回首页，站内链接结构清晰。<br />&nbsp;</p><p>4，网站核心关键词排名在前十；在某个关键词如网站名称词排在Google排名第一，并且稳定10个月以上；该关键词需要有一定的搜索量；因为无搜索量的关键词，对搜索引擎来说就是&ldquo;该关键词不受用户欢迎&rdquo;，也就没必要特别处理SERP了。比如搜索&ldquo;天骄语文网&rdquo;有Sitelinks，但搜索&ldquo;独孤天骄的天骄语文网&rdquo;就没有：</p><p>&nbsp;<img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/11/tj66.net-nositelink.jpg" alt="" title=""/></p><p>触发sitelinks的关键词不是唯一的，一个网站可能有几个关键词都可以触发sitelinks，比如&ldquo;天骄语文&rdquo;，&ldquo;天骄语文网&rdquo;：<br /><img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/11/tianjiaowang-sitelink.jpg" alt="" title=""/><br /><img onload="ResizeImage(this,520)" src="http://www.dugutianjiao.com/upload/2008/11/tianjiaoyuwenwang-sitelink.jpg" alt="" title=""/>&nbsp;</p><p>5，Google是按照站内网页的访问量来评定一个网页或一个专题是否可以进入链接列表，这也是促进网站产生Google Sitelinks的因素之一。&nbsp;&nbsp;大型站点更容易产生Google Sitelinks。</p><p><b>参考文献：</b><br /><a href="http://www.bloghuman.com/google-sitelinks-explained-and-analysis/">http://www.bloghuman.com/google-sitelinks-explained-and-analysis/</a>，黑色梦中SEO博客，郝聪</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-sitelinks-secret.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=32</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=32&amp;key=233a9075</trackback:ping></item><item><title>SEO两百个秘密：控制搜索引擎的行为</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-control-searching.html</link><pubDate>Sat, 15 Nov 2008 13:55:12 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-control-searching.html</guid><description><![CDATA[<p>在这一篇文章里面，独孤天骄将向大家介绍如何引导搜索引擎的蜘蛛来访和控制蜘蛛行为。</p><p><b>一、向搜索引擎提交网站地图</b></p><p>如何让搜索引擎知道我们的网站而派出爬虫前来抓取？方法当然有很多样，比如我们可以与其他网站主进行链接交换，搜索引擎爬虫通过遍历对方网站上的链接，从而爬行到我们网站。也可以直接向搜索引擎入口提交网址，或者向搜索引擎提交网站地图等。新网站与其他站点交换链接不容易，因此提交网站地图给搜索引擎不失为一个好的方法。</p><p>提交网站地图可以很简单地让搜索引擎识别你的网站内部结构。以方便搜索引擎抓取，加快索引。</p><p>1.向Google提交网站地图Sitemap:http://www.google.com/addurl/?continue=/addurl 通过网址管理提交；</p><p>各大搜索引擎都提供相应的网站管理工具给站长们使用。例如Google的网站管理工具可以设定抓取频率，提交网站地图，删除失效链接。</p><p>2.向Yahoo!提交网站地图Sitemap:<br />通过网址http://siteexplorer.search.yahoo.com管理提交；</p><p>3.向MSN提交网站地图Sitemap: 用URL直接提交：<br />http://api.moreover.com/ping?u=http://your.domainname/sitemap.xml</p><p>4.百度现在不支持Sitemap。但可通过http://www.baidu.com/search/url_submit.html来提交你的网址，百度会自行索引。</p><p><strong>二、通过编辑robots.txt文件来控制各大搜索引擎的搜索</strong></p><p>搜索引擎派出来的蜘蛛如果不抓取我们的网站，那么我们的网站就无法得到有效索引，网友也就没有办法在搜索引擎搜索到我们的网站，但是如果对网站抓取频度过高，也会导致服务器速度产生问题，大规模的抓取甚至会产生类似于病毒攻击的效果，使网站的访问速度变得极端缓慢。</p><p>因此，SEO要懂得控制各家搜索引擎的蜘蛛抓取频率，其中尤其雅虎搜索的蜘蛛最难于控制。</p><p>怎样才能让雅虎的蜘蛛（Yahoo! Slurp）降低抓取频度呢？</p><p>雅虎的产品经理<a href="http://ysearchblog.cn/2006/07/yahoo_slurp.html">车东的建议</a>是在网站的robots.txt中增加Crawl-delay: 设置，这个设置是目前Slurp独有的，用来告诉Slurp蜘蛛2次访问之间的间隔，单位是秒。</p><p>剩下的问题就是Crawl-delay的值该设置多大，这个要看网站自身可以承受的负载，假设你希望Slurp每10秒来访问一次，这个设置就是：</p><p>User-agent: *<br />Crawl-delay: 10</p><p>但是事实上雅虎美国和雅虎中国有2套蜘蛛在运行，因此实际的访问可能成倍交叉进行。幸好每个蜘蛛都是遵循Crawl-delay间隔的，因此为了进一步降低Slurp压力，希望达到10秒一次请求的频道，实际的Crawl-delay配置就要*2。</p><p>并且雅虎的蜘蛛是分布在很多台服务器上的，而多个服务器集群之间也是不相互协调同一网站的抓取频度的。车东在文章中说到Slurp来源于<u>40多个IP网段</u>，同网段内的蜘蛛协调抓取频度。</p><p>因此：实际的Slurp设置，需要设置为10*40 = 400秒，才能达到期望的Slurp每10秒访问一次频度。</p><p>robots.txt其他具体的设置方法，大家可以参看<a target="_blank" href="http://www.dugutianjiao.com/post/seo-robots-txt.html">SEO两百个秘密：robots.txt文件的秘密</a>，里面有很详细的介绍。</p><p><b>参考文献：</b></p><p>雅虎搜索日志：<a href="http://ysearchblog.cn/2006/07/yahoo_slurp.html">http://ysearchblog.cn/2006/07/yahoo_slurp.html</a>，车东。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-control-searching.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=33</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=33&amp;key=4721e6c3</trackback:ping></item><item><title>SEO两百个秘密：robots.txt文件的秘密</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-robots-txt.html</link><pubDate>Wed, 05 Nov 2008 21:23:35 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-robots-txt.html</guid><description><![CDATA[<p>网站能不能被搜索引擎索引到，除了看有没有向搜索引擎入口提交、有否与其他站点交换链接等之外，还得看根目录底下的robots.txt文件有没有禁止搜索引擎的收录。熟练书写robots.txt语法，是每个SEOer所必须掌握的基本技能。SEO研究院曾经写过一篇《<a target="_blank" href="http://www.dugutianjiao.com/post/zblog-seo-case.html">SEO七十二案例：Z-Blog优化完全攻略</a>》的具体案例，阐述过如何通过robots.txt来优化Z-blog，大家可以先参考下。</p><p>以下robots.txt的语法教学部分的写作参考了一些网络信息，在此SEO研究院表示感谢，写作过程中，有些内容已经老旧，而<a href="http://www.dugutianjiao.com">SEO</a>是不断发展的，因此视情况对其进行了去伪存真以及相关整理。</p><p><strong>一、什么是robots.txt文件：</strong></p><p>搜索引擎通过一种爬虫spider程序（又称搜索蜘蛛、robot、搜索机器人等），自动搜集互联网上的网页并获取相关信息。</p><p>鉴于网络安全与隐私的考虑，搜索引擎遵循robots.txt协议。通过根目录中创建的纯文本文件robots.txt，网站可以声明不想被robots访问的部分。每个网站都可以自主控制网站是否愿意被搜索引擎收录，或者指定搜索引擎只收录指定的内容。当一个搜索引擎的爬虫访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果该文件不存在，那么爬虫就沿着链接抓取，如果存在，爬虫就会按照该文件中的内容来确定访问的范围。<br /><br /><u>robots.txt必须放置在一个站点的根目录下，而且文件名必须全部小写。</u></p><p><strong>二、robots.txt文件的语法：</strong><br /><b>1、网站URL以及相应的robots.txt的URL<br /></b><a href="http://www.w3.org/">http://www.w3.org/</a>对应http://www.w3.org/robots.txt<br /><a href="http://www.w3.org:80/">http://www.w3.org:80/</a>则对应的是<a href="http://www.w3.org:80/robots.txt">http://www.w3.org:80/robots.txt</a><br />下面是一些著名站点的robots.txt：<br />Google的robots.txt：<a href="http://www.google.com/robots.txt">http://www.google.com/robots.txt</a><br />百度的robots.txt：<a href="http://www.baidu.com/robots.txt">http://www.baidu.com/robots.txt</a><br />SEO研究院的robots.txt文件：<a href="http://www.dugutianjiao.com/robots.txt">http://www.dugutianjiao.com/robots.txt</a><br /><b>2、robots.txt文件的格式：<br /></b>robots.txt文件应该包含一条或更多的记录，这些记录通过空行分开。该文件中的记录通常以一行或多行User-agent开始，后面加上若干Disallow行，详细情况如下：<br />User-agent:<br />　　该项的值用于描述搜索引擎robot的名字，在&ldquo;robots.txt&rdquo;文件中，如果有多条User-agent记录说明有多个robot会受到该协议的限制，对该文件来说，至少要有一条User-agent记录。如果该项的值设为*，则该协议对任何机器人均有效，在&ldquo;robots.txt&rdquo;文件中，&ldquo;User-agent:*&rdquo;这样的记录只能有一条。<br />Disallow:<br />　　该项的值用于描述不希望被访问到的一个URL，这个URL可以是一条完整的路径，也可以是部分的，任何以Disallow开头的URL均不会被robot访问到。例如&ldquo;Disallow:/help&rdquo;对/help.html 和/help/index.html都不允许搜索引擎访问，而&ldquo;Disallow:/help/&rdquo;则允许robot访问/help.html，而不能访问/help/index.html。任何一条Disallow记录为空，说明该网站的所有部分都允许被访问，在robots.txt文件中，至少要有一条Disallow记录。如果robots.txt为空文件，则对于所有的搜索引擎robot，该网站都是开放的。<br /><b>3、robots.txt文件用法举例：</b><br />例1. 禁止所有搜索引擎访问网站的任何部分&nbsp;</p><p>User-agent: * <br />Disallow: /</p><p>实例分析：淘宝网的 Robots.txt文件</p><p>User-agent: Baiduspider<br />Disallow: /<br /><br />User-agent: baiduspider<br />Disallow: /</p><p>很显然淘宝不允许百度的机器人访问其网站下其所有的目录。</p><p>例2. 允许所有的robot访问 (或者也可以建一个空文件 &ldquo;/robots.txt&rdquo; file)&nbsp;</p><p>User-agent: *<br />Disallow:</p><p>例3. 禁止某个搜索引擎的访问&nbsp;</p><p>User-agent: BadBot<br />Disallow: /</p><p>例4. 允许某个搜索引擎的访问&nbsp;</p><p>User-agent: baiduspider<br />Disallow: User-agent: *Disallow: /</p><p>例5.一个简单例子　　<br />在这个例子中，该网站有三个目录对搜索引擎的访问做了限制，即搜索引擎不会访问这三个目录。　　<br />需要注意的是对每一个目录必须分开声明，而不要写成 &ldquo;Disallow: /cgi-bin/ /tmp/&rdquo;。　　User-agent:后的*具有特殊的含义，代表&rdquo;any robot&rdquo;，所以在该文件中不能有&rdquo;Disallow: /tmp/*&rdquo; or &ldquo;Disallow:*.gif&rdquo;这样的记录出现.&nbsp;</p><p>User-agent: *<br />Disallow: /cgi-bin/<br />Disallow: /tmp/<br />Disallow: /~joe/</p><p>Robot特殊参数：<br />1.&nbsp;Google<br />允许 Googlebot：<br />如果您要拦截除 Googlebot 以外的所有漫游器访问您的网页，可以使用下列语法：</p><p>User-agent:<br />Disallow:/<br />User-agent:Googlebot<br />Disallow:<br />Googlebot 跟随指向它自己的行，而不是指向所有漫游器的行。</p><p>&ldquo;Allow&rdquo;扩展名：<br />Googlebot 可识别称为&ldquo;Allow&rdquo;的 robots.txt 标准扩展名。其他搜索引擎的漫游器可能无法识别此扩展名，因此请使用您感兴趣的其他搜索引擎进行查找。&ldquo;Allow&rdquo;行的作用原理完全与&ldquo;Disallow&rdquo;行一样。只需列出您要允许的目录或页面即可。</p><p>您也可以同时使用&ldquo;Disallow&rdquo;和&ldquo;Allow&rdquo;。例如，要拦截子目录中某个页面之外的其他所有页面，可以使用下列条目：</p><p>User-Agent:Googlebot<br />Disallow:/folder1/<br />Allow:/folder1/myfile.html<br />这些条目将拦截 folder1 目录内除 myfile.html 之外的所有页面。</p><p>如果您要拦截 Googlebot 并允许 Google 的另一个漫游器（如 Googlebot-Mobile），可使用&rdquo;Allow&rdquo;规则允许该漫游器的访问。例如：</p><p>User-agent:Googlebot<br />Disallow:/<br />User-agent:Googlebot-Mobile<br />Allow:</p><p>使用 * 号匹配字符序列：<br />您可使用星号 (*) 来匹配字符序列。例如，要拦截对所有以 private 开头的子目录的访问，可使用下列条目：</p><p>User-Agent:Googlebot<br />Disallow:/private*/<br />要拦截对所有包含问号 (?) 的网址的访问，可使用下列条目：</p><p>User-agent:*<br />Disallow:/*?*</p><p>使用 $ 匹配网址的结束字符<br />您可使用 $ 字符指定与网址的结束字符进行匹配。例如，要拦截以 .asp 结尾的网址，可使用下列条目：</p><p>User-Agent:Googlebot<br />Disallow:/*.asp$<br />您可将此模式匹配与 Allow 指令配合使用。例如，如果 ? 表示一个会话 ID，您可排除所有包含该 ID 的网址，确保 Googlebot 不会抓取重复的网页。但是，以 ? 结尾的网址可能是您要包含的网页版本。在此情况下，可对 robots.txt 文件进行如下设置：</p><p>User-agent:*<br />Allow:/*?$<br />Disallow:/*?<br />Disallow:/ *?一行将拦截包含 ? 的网址（具体而言，它将拦截所有以您的域名开头、后接任意字符串，然后是问号 (?)，而后又是任意字符串的网址）。</p><p>Allow: /*?$ 一行将允许包含任何以 ? 结尾的网址（具体而言，它将允许包含所有以您的域名开头、后接任意字符串，然后是问号 (?)，问号之后没有任何字符的网址）。&nbsp;</p><p><strong>4、常见搜索引擎机器人Robots名字</strong><br />百度的蜘蛛名字叫&ldquo;Baiduspider&nbsp;&rdquo;，Google的蜘蛛是&ldquo;Googlebot&rdquo;，Yahoo的是&ldquo;Yahoo!Slurp&rdquo;，MSN的蜘蛛则是&ldquo;MSNbot&rdquo;&nbsp;&nbsp;，Alexa也有自己的蜘蛛，叫&ldquo;ia_archiver &rdquo;。</p><p><strong>5、常见robots.txt错误</strong><br />颠倒了顺序：<br />错误写成<br />User-agent: *<br />Disallow: GoogleBot<br /><br />正确的应该是：<br />User-agent:GoogleBot<br />Disallow: /<br /><br />把多个禁止命令放在一行中：<br />例如，错误地写成<br />Disallow:/css//cgi-bin//images/<br /><br />正确的应该是<br />Disallow:/css/<br />Disallow:/cgi-bin/<br />Disallow:/images/<br /><br />行前有大量空格<br />例如写成：&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Disallow:/cgi-bin/<br />尽管在标准没有谈到这个，但是这种方式很容易出问题。<br /><br />404重定向到另外一个页面：<br />当Robot访问很多没有设置robots.txt文件的站点时，会被自动404重定向到另外一个Html页面。这时Robot常常会以处理robots.txt文件的方式处理这个Html页面文件。虽然一般这样没有什么问题，但是<strong>最好能放一个空白的robots.txt文件在站点根目录下</strong>。<br /><br />采用大写<br />USER-AGENT:EXCITE<br />DISALLOW:<br />虽然标准是没有大小写的，但是目录和文件名应该小写，：<br />User-agent:GoogleBot<br />Disallow:<br /><br />语法中只有Disallow，没有Allow！<br />错误的写法是：<br />User-agent: Baiduspider<br />Disallow: /john/<br />Allow: /jane/<br /><br />忘记了斜杠/<br />错误的写做：<br />User-agent: Baiduspider<br />Disallow: css<br /><br />正确的应该是<br />User-agent: Baiduspider<br />Disallow: /css/<br /><br />下面一个小工具专门检查robots.txt文件的有效性：<a href="http://www.searchengineworld.com/cgi-bin/robotcheck.cgi">http://www.searchengineworld.com/cgi-bin/robotcheck.cgi</a>。我们可以通过<a target="_blank" href="http://www.google.com/webmasters/sitemaps"><font color="#800080">google sitemap</font></a>中的robots.txt检测工具来检查网站上是否存在robots.txt文件以及该文件写法是否正确。</p><p><span style="font-size: 12px"><strong>三、Robots Meta标签</strong></span><br /><br /><strong>1、什么是Robots Meta标签</strong><br /><br />Robots.txt文件主要是限制整个站点或者目录的搜索引擎访问情况，而Robots Meta标签则主要是针对一个个具体的页面。和其他的META标签（如使用的语言、页面的描述、关键词等）一样，Robots Meta标签也是放在页面的中，专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。<br /><br /><strong>2、Robots Meta标签的写法：</strong><br /><br />Robots Meta标签中没有大小写之分，name=&rdquo;Robots&rdquo;表示所有的搜索引擎，可以针对某个具体搜索引擎写为name=&rdquo;BaiduSpider&rdquo;。content部分有四个指令选项：index、noindex、follow、nofollow，指令间以&ldquo;,&rdquo;分隔。<br /><br />index指令告诉搜索机器人抓取该页面；<br />follow指令表示搜索机器人可以沿着该页面上的链接继续抓取下去；<br />Robots Meta标签的缺省值是index和follow，只有inktomi除外，对于它，缺省值是index、nofollow。<br />需要注意的是：上述的robots.txt和Robots Meta标签限制搜索引擎机器人（ROBOTS）抓取站点内容的办法只是一种规则，需要搜索引擎机器人的配合才行，并不是每个ROBOTS都遵守的。<br />目前看来，绝大多数的搜索引擎机器人都遵守robots.txt的规则，而对于RobotsMETA标签，目前支持的并不多，但是正在逐渐增加，如著名搜索引擎GOOGLE就完全支持，而且GOOGLE还增加了一个指令&ldquo;archive&rdquo;，可以限制GOOGLE是否保留网页快照。</p><p>Sitemap 网站地图：<br />对网站地图的新的支持方式，就是在robots.txt文件里直接包括sitemap文件的链接。<br />就像这样：<br />Sitemap:http://www.dugutianjiao.com/sitemap.xml<br />目前对此表示支持的搜索引擎公司有Google, Yahoo和MSN。不过，我们建议还是在Google Sitemap进行提交，里面有很多功能可以分析你的链接状态。</p><p><strong>四、Robots.txt利弊分析</strong></p><p><b>robots.txt带来的好处：</b><br />1.&nbsp;几乎所有的搜索引擎Spider都遵循robots.txt给出的爬行规则，协议规定搜索引擎Spider进入某个网站的入口即是该网站的robots.txt，当然，前提是该网站存在此文件。对于没有配置robots.txt的网站，Spider将会被重定向至404 错误页面，相关研究表明，如果网站采用了自定义的404错误页面，那么Spider将会把其视作robots.txt&mdash;&mdash;虽然其并非一个纯粹的文本文件&mdash;&mdash;这将给Spider索引网站带来很大的困扰，影响搜索引擎对网站页面的收录。因此，如果不会写这个文件，建议放一个空的robots.txt文本文件即可。</p><p>2.&nbsp;robots.txt可以制止不必要的搜索引擎占用服务器的宝贵带宽，如email retrievers，这类搜索引擎对大多数网站是没有意义的；再如image strippers，对于大多数非图形类网站来说其也没有太大意义，但却耗用大量带宽。</p><p>3.&nbsp;robots.txt可以制止搜索引擎对非公开页面的爬行与索引，如网站的后台程序、管理程序，事实上，对于某些在运行中产生临时页面的网站来说，如果未配置robots.txt，搜索引擎甚至会索引那些临时文件。</p><p>4.&nbsp;对于内容丰富、存在很多页面的网站来说，配置robots.txt的意义更为重大，因为很多时候其会遭遇到搜索引擎Spider给予网站的巨大压力：洪水般的Spider访问，如果不加控制，甚至会影响网站的正常访问。</p><p>5.&nbsp;同样地，如果网站内存在重复内容，使用robots.txt限制部分页面不被搜索引擎索引和收录，可以避免网站受到搜索引擎关于 duplicate content的惩罚，保证网站的排名不受影响。</p><p><b>robots.txt带来的风险及解决：</b><br />1. 凡事有利必有弊，robots.txt同时也带来了一定的风险：其也给攻击者指明了网站的目录结构和私密数据所在的位置。虽然在Web服务器的安全措施配置得当的前提下这不是一个严重的问题，但毕竟降低了那些不怀好意者的攻击难度。</p><p>比如说，如果网站中的私密数据通过<a href="http://www.yourdomain.com/private/index.html"><font color="#009966">www.yourdomain.com/private/index.html</font></a> 访问，那么，在robots.txt的设置可能如下：</p><p>User-agent: *<br />Disallow: /private/</p><p>这样，攻击者只需看一下robots.txt即可知你要隐藏的内容在哪里，在浏览器中输入<a href="http://www.yourdomain.com/private/"><font color="#009966">www.yourdomain.com/private/</font></a> 便可访问我们不欲公开的内容。<br />2.&nbsp;如果设置不对，将导致搜索引擎将索引的数据全部删除。下面的代码将禁止所有的搜索引擎索引数据：<br />User-agent: *<br />Disallow: /<br />目前看来，绝大多数的搜索引擎机器人都遵守robots.txt的规则，而对于Robots META标签，目前支持的并不多，但是正在逐渐增加，如著名搜索引擎GOOGLE就完全支持，而且GOOGLE还增加了一个指令&ldquo;archive&rdquo;，可以限制GOOGLE是否保留网页快照。例如一下代码表示抓取该站点中页面并沿着页面中链接抓取，但是不在GOOLGE上保留该页面的网页快照：</p><p>＜META NAME=&rdquo;googlebot&rdquo; CONTENT=&rdquo;index,follow,noarchive&rdquo;＞</p><p><b>参考文献：</b><br />A Standard for Robot Exclusion：<a href="http://www.robotstxt.org/orig.html">http://www.robotstxt.org/orig.html</a><br />禁止搜索引擎收录的方法：<a href="http://www.baidu.com/search/robots.html">http://www.baidu.com/search/robots.html</a><br />如何使用robots.txt：<a href="http://www.googlechinablog.com/2008/04/robotstxt.html">http://www.googlechinablog.com/2008/04/robotstxt.html</a><br />維基百科Robots.txt：<a href="http://zh.wikipedia.org/wiki/Robots.txt">http://zh.wikipedia.org/wiki/Robots.txt</a></p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-robots-txt.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=30</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=30&amp;key=c0114a29</trackback:ping></item><item><title>SEO两百个秘密：搜索引擎的“沙盒效应”</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-sandbox-effect.html</link><pubDate>Mon, 03 Nov 2008 14:20:41 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-sandbox-effect.html</guid><description><![CDATA[<p>大家可能在给新网站做排名的时候，经常会遇见一个问题，那就是在百度、Yahoo等搜索引擎很容易排上的关键词，在Google则不然。一些流行度比较高的关键词，没有数月之功几乎是没有办法将排名提升上去的。这个主要是因为Google的时间因子&mdash;&mdash;&ldquo;沙盒效应&rdquo;在作怪。</p><p><b>一、什么是沙盒效应？<br /></b>做SEO的朋友都不会对Google的沙盒感到陌生，除了名字比较好听，所谓的&ldquo;沙盒效应（Sandbox Effect）&rdquo;对于许多网站管理员简直是噩梦，它将自己费力完成的新站埋入了无穷尽的流沙之中，不见天日。对SEO从业者来说，它带来的不仅是对一个新网站的考验，更直接面对的是客户利益的损失与<a href="http://www.dugutianjiao.com">SEO服务</a>的补偿。</p><p>什么是&ldquo;沙盒效应&rdquo;呢？所谓&ldquo;沙盒效应&rdquo;指的是新的网站在Google里面很难得到好的排名，无论你怎么优化这个网站，在一段时间之内，就是很难在Google里面得到好的排名。Google的Sandbox有点像给予新网站的一个试用期。在这段试用期内，新网站几乎无法在竞争比较激烈的关键词下得到好的排名。</p><p>沙盒效应是不可避免的，无论网站的<a href="http://www.dugutianjiao.com">搜索引擎优化</a>做得如何出色，网站的内容如何丰富、网站的结构如何良好、网站的外部连接质量如何的优良，作为新网站来说，进入SandBox是无法避免的。</p><p>一般新网站被Google收录后，在刚被收录的一段时间内，其在Google里有良好的表现，在Google里有着不错的排名。但是再经过一段时间，这个网站在Google的表现就会突然急剧变差，其网页在Google里的排名会大幅度降低，甚至不出现在搜索结果里，这时这个网站就进入了所谓的Sandbox沙盒之中，沙盒效应更多的是发生在以竞争比较激烈的关键词为目标的网站上。那些不太商业的，竞争比较少的关键词，发生沙盒现象的机会就比较小。一般Google沙盒多发生在信息更新匮乏的企业站身上。</p><p>沙盒效应是关于Google SEO最热门的话题之一，但到目前为止，没有人能够确认确实存在沙盒效应，Google官方也从来没有肯定或否定过。沙盒效应(Sandbox Effect)是Google所独有的一种现象，最早是在2004年3月开始被注意到。至今Google虽然没有明确说明Sandbox的存在，但是很多搜索引擎优化人员通过实验，证实了Sandbox沙盒效应的存在。</p><p>有的人认为，沙盒效应本身就是一个独立的过滤算法，把所有新网站的排名暂时都排到后面。也有人认为沙盒效应只是一种效应或现象，它本身并不是一个过滤器，而是很多其他排名因素所造成的一个现象而已。比如说，Google确实在近一两年开始在把链接的年龄以及链接页的历史情况都考虑在内。还有网站获得链接的速度，如果一个网站在短时间内获得了大量的链接，Google会怀疑这些链接是买来的，或者是通过作弊手段得到的。这些与时间有关的因素组合起来，就可能对新网站产生这种沙盒现象。</p><p>大部分人认为Google之所以会制造这种Sandbox效应，是为了清除那些垃圾网站。通常这些垃圾网站都会快速买大量链接，得到好的排名，赚一笔钱后，这些作弊手段被发现了，网站被删除或被惩罚。但是这些人也不在乎，这个域名也就被放弃了，转而开始做另外一个新的网站。在Google开始出现Sandbox以后，有可能大部分的这些垃圾网站制造者都没什么耐心，要等他的网站从沙盒里面出来，从而也就不建这些垃圾网站了。</p><p>通常沙盒效应会维持六个月，有一些针对竞争性不高的关键词的网站，可能在沙盒里会短一些。行业竞争越高，沙盒效应会越长。</p><p><b>二、百度的沙盒效应<br /></b>众所周知，Google有沙盒，Google的沙盒效应(Sandbox Effect)很多&nbsp;Seoer应该都体验过。Google有沙盒，那百度有沙盒吗?这是大家一直都在讨论的一个问题。众说纷纭，有的说百度有沙盒，有的说百度没沙盒，沙盒只是Google的专利而已。通过我个人的SEO实验，可以初步判定百度也存在着沙盒。</p><p>既然百度也有沙盒，那应该怎样正确看待Baidu的沙盒效应呢?</p><p>百度对新站也有一个建立&ldquo;信任期&rdquo;的过程，我称之为对网站信任指数（trust rank）的建立过程，一般是1-3个月。这段时间如果过多地修改网站结构，修改文章标题等，会造成百度对站点信任度的降低。</p><p>当你的网站进入了百度的沙盒效应时期，千万不要慌张！你并没有受到搜索引擎的处罚，你的网站依然存在搜索引擎的索引库里面，搜索引擎的蜘蛛仍然对你的网站进行更新，只是暂时不反映在搜索结果重而已。在沙盒效应时期，我们应该采取有效的措施，尽快从沙盒中跳出来，重新获得排名。</p><p>在这个时刻，我们只能花更多的时间去更新网站的内容；并且利用沙盒效应这段时间加入更多高质量的分类目录与交换更多交换更多的高质量链接。如果有可能和实力，应该采取更多的营销手段保持网站正常的流量。</p><p><b>三、沙盒效应的意图是什么？</b></p><p>很多SEO观察者都认为，沙盒过滤器的目的是劝阻不择手段的WEB站点管理员不要使用违反Google站点管理员指南的做法。Google试图瓦解一些手法，如使用垃圾站点建立初期的流量，购买过期的域名以获得其之前存在的Google网页等级作为跳跃的起点。</p><p>Google可能打击的另一个行为是垃圾站点。如果一个纯粹的垃圾站点制造者（spammer）在网站运行后的头几个月中不能获得好的排名，他们可能会关闭他们的垃圾站点。打击spammer是Google的长期目标。</p><p>Google打击的另一个行为是购买链接获得初始的网页等级（PageRank）。Google公司的人可能认为一个网站应该随着时间的过去而自然获得链接。他们认为购买的链接不是网站自然发展的表现。除非建立更长久的链接，否则短期的链接租用和放置对一个新网站来说并没有什么好处。也存在这种可能性：即Google在索引一个网站后的最初几个月中，并不会给予其全部的网页等级（PageRank）。阻尼效应（dampening effect）造成的缺乏信用的网页等级（PageRank）会降低过期域名引入链接的价值。</p><p>这种情况也完全有可能发生：即一个网站没有被放在沙盒中，但是它的链接正在被监测。算法可能会考虑其链接的时间，它们的链接站点，Internet服务商拥有的链接范围，以及通常情况下整个链接的多样性。</p><p><b>四、沙盒效应并不是一种惩罚</b></p><p>沙盒效应作为Google使用的搜索排名阻尼过滤器（search ranking damping filter），是用于网站首次发布后的头两个月至4个月内获得&ldquo;新站奖励（fresh site bonus）&rdquo;的网站。一个网站陷入沙盒的平均时间长度大约为90天，但是很少在沙盒中持续呆4个月。大多数网站按照关键字的类型分享阻尼下降效应（damping down effect）。沙盒过滤器适用于所有网站，而不管它们是否有很多引入链接，即使有相关性很强的链接也没什么区别。内容丰富的网站也同样会陷入流沙。沙盒效应必然是Google的算法之一，因为它最近很普遍。</p><p>这时，我们应该做的工作内容包括高质量的链接和内容更新，同时不要作弊以获得搜索引擎的高排名，如果你不会作弊的话，那么恭喜你。网站建设要更自然，建立链接，更新内容不要太快，当然也不要太慢。</p><p>沙盒效应并不是一种惩罚。一旦碰上沙盒效应，首先要放宽心坦然接受，因为从根本上说，你没办法逃避沙盒现象。</p><p><br /><b>五、怎么逃出沙盒效应</b></p><p>既然沙盒效应不可避免，那么怎么尽快逃出Sandbox则是我们必须考虑的，如何减少Google沙盒效应的影响呢？</p><p>首先要放宽心，因为从根本上说，你没办法逃避沙盒现象。随着时间的推移，你的新网站或新域名自然会从沙盒里出来。</p><p>如果网站不小心掉进Google沙盒，是没有快速有效的解决方法的。掉进沙盒（Sandbox）的网站多长时间能出来？通过多年的SEO实践经验，这个时间因子并不确定，长短不一，一般情况下，1到3个月就走可以出来，最短的甚至15天左右就可以逃出，长的却可能持续到6个月。掉进Google Sandbox之后，你需要做的就是坚持信息的更新，尤其是原创信息内容，同时此时请避免网站再做优化调整，相信您能在最短的时间内博得Google的信任。</p><p>同时，当你的网站还在被Sandbox沙盒效应影响的时候，你应该利用这段时间来增加网站的内容，坚持更新网站，做到起码每天增加一个新网页，或者每间隔几天增加一个新网页。寻求更多的导入链接。缓慢持续的增加新外部连接。一定要控制好增加外部连接的速度，既不能突然增加大量的外部连接，也不能长时间没有增加新的外部连接。控制好外部连接的质量，找内容相关的网站连接向你。并且连接锚文字多样化。不要总是使用相同的关键词作为连接锚文字，要使锚文字多样化，使用不同的锚文字连接向网站。连接向网站内不同的页面。不要总是连接向首页，而要连接向网站内部各个不同的页面。这一点大家可以参看《<a target="_blank" href="http://www.dugutianjiao.com/post/seo-backlinks-secret.html">SEO两百个秘密：反向链接的秘密</a>》一文。实际上有了沙盒效应，对很多网站运行者来说，可能是一件好事。因为在大概半年的时间里，你只能把精力放在网站内容上面。而不会去考虑排名。但是从长远来看，一旦沙盒效应结束，你的导入链接的年龄也足够长了，会被记入算法当中。你的网站也有了足够的内容，那么你的网站排名会有一个质的飞跃。</p><p>首先，延缓新网站进入Sandbox沙盒的时间。当新网站被Google收录后，还没有进入Sandbox沙盒之时，会在Google里有良好的表现，这时我们可以采取措施，让新网站保持良好状态，延缓Sandbox沙盒效应的影响。这个方法就是控制外部连接增加的速度，缓慢稳定的增加网站的外部连接。通过这个方法，可以延缓新网站进入Sandbox的时间，在网站的Sandbox沙盒效应期间，也可以减少网站在Sandbox沙盒内停留的时间。</p><p>其次，当网站进入Sandbox沙盒之后，使网站尽快走出Sandbox沙盒。网站受到沙盒效应的影响，时间不一。网站在Sandbox沙盒里停留的时间越长，由于在此期间网站在搜索引擎里的表现极差，网站受的影响就越大。因此，我们都希望网站早日从Sandbox沙盒效应里走出来，使该网站能够在Google里取得良好的表现。</p><p>现在还有一种趋势，当网站的连接数量急剧增加或者减少时，也可能使网站进入Sandbox沙盒，因此我们要极力避免网站的外部连接数量急剧增加或者减少。<br />&nbsp;</p><p>进入Google沙盒后，你需要做的就是平心静气的按部就班的做网站，&ldquo;到出来时候自然会出来:)&rdquo;，这只是Google对网站一个短暂的考核，与所谓的k站、降权并非同一搜索引擎惩罚行为。请大家理性应对。</p><p>参考资料：<br />百度百科 沙盒效应：<a href="http://baike.baidu.com/view/870696.htm">http://baike.baidu.com/view/870696.htm</a><br />减少Google的Sandbox沙盒效应的影响：<a href="http://www.doseek.com/google-sandbox-effect.html">http://www.doseek.com/google-sandbox-effect.html</a>，作者：yoo<br />Google的Sandbox沙盒效应：<a href="http://www.chinamyhosting.com/seoblog/2006/04/15/google-sandbox/">http://www.chinamyhosting.com/seoblog/2006/04/15/google-sandbox/</a>，作者：zac<br />我看沙盒效应不是一种惩罚：<a href="http://www.xbaohe.com/2007/08/10/sandbox-isnot-penalty/">http://www.xbaohe.com/2007/08/10/sandbox-isnot-penalty/</a>，作者：fred</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-sandbox-effect.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=29</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=29&amp;key=8b11773e</trackback:ping></item><item><title>SEO两百个秘密：反向链接的秘密</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/seo-backlinks-secret.html</link><pubDate>Sun, 02 Nov 2008 23:46:51 +0800</pubDate><guid>http://www.dugutianjiao.com/post/seo-backlinks-secret.html</guid><description><![CDATA[<p>学习SEO者都知道反向链接的重要性，对所有的搜索引擎来说，高质量的反向链接皆是搜索引擎排名的最重要因素之一。SEO两百个秘密，反向链接绝对是最重要的秘密之一。但，到底什么是反向链接？</p><p><strong>一、反向链接的概念</strong>&nbsp;</p><p><b><i>什么是反向链接？反</i></b><strong><em>向链接也叫外部链接，或者叫导入链接（Backlinks）。</em></strong>简单的说就是网页A 上有一个超级链接指向网页B，则网页A 上的超级链接就是网页B 的反向链接（一般来说，网页A和网页B不属于同一网站）。举个例子，B网站上有个链接，指向A网站（<a href="http://www.dugutianjiao.com">SEO研究院</a>），那么我们称B网站的那个链接为SEO研究院的反向链接。</p><p>反向链接的表现形式分为图片链接和文本链接。</p><p><b>二、</b>&nbsp;<b>反向链接的建立需要注意什么？</b></p><p>国外的搜索引擎优化专家<a target="_blank" href="http://www.andyhagans.com/"><font color="#0063dc">Andy Hagans</font></a>和<a target="_blank" href="http://www.seobook.com/"><font color="#0063dc">Aaron Wall</font></a>写了一篇&quot;<a target="_blank" href="http://www.seobook.com/archives/001792.shtml"><font color="#0063dc">增加反向链接的101个方法</font></a>&quot;，非常有参考价值，Zac 翻译成了中文，大家可以到这个地址下载：<a target="_blank" href="http://www.dunsh.org/101.pdf"><font color="#0063dc">增加反向链接的101个方法</font></a>。</p><p>我归纳了几点比较重要的分享如下：</p><p><b>1、增加反向链接应该重视质量，不能单纯追求数量。</b></p><p>如果你的网站想长久获得好排名，反向链接的质量会比数量更加重要。因此增加反向链接，<u><span id="1225298319876S" style="display: none">&nbsp;</span>最好先验证对方网站与自己网站主题是否相关</u>。甚至我们还需要验证一下反向链接所在页还链接向哪些其他网站？这些其他网站内容是否相关？质量怎么样？</p><p>这个相关度的查看有两种方法：第一种很简单，比如你的网站是中学语文资源下载站，对方也是，那就是主题相近了；第二种则要看具体内容，比如电影网站则可以拓展到娱乐相关网站。如果网站充溢着许多无用的垃圾网站的反向链接，那反倒是有害的，会降低自己网站的主题相关性。&nbsp;我们必须要慎重考虑链接质量的问题。</p><p><b>2、要循序渐进地逐步增加反向链接，不要瞬间巨量增长。</b></p><p>如果短时间内，增加成百上千个反向链接，就容易陷入Google的&ldquo;沙盒效应&rdquo;之中，无法获得好排名。新学习优化的SEOer会让站点的连接在几天之内疯狂增加，甚至不惜采取作弊的方法。以前许多黑帽SEO用连接群发的方法，使排名很快得以提升，后来搜索引擎改正了算法，对垃圾链接的站点进行惩罚，而大量增加链接的方法正有这种黑帽的嫌疑。因此，在与其他站长进行链接交换时，不能用群发工具，也尽量不跟权重低的网站做链接。增加链接太快会有可能遭致搜索引擎的&ldquo;隐性封杀&rdquo;（就是暂时让你无法site到自己的网站），尤其是垃圾网站的反向链接。</p><p><b>3、反向链接应该保持自然，这是反向链接的重要原则。</b></p><p><b><em>反向链接的锚文字（链接文字）应该多样化。</em></b>不能在所有反向链接的锚文字里使用重要关键词或唯一关键词。假设有一万个链接的文字都是&ldquo;SEO&rdquo;，同时指向<a href="http://www.dugutianjiao.com">SEO研究院</a>，这种不自然的链接明显上是不可能，因为如果是人工与他人交换链接，或者是他人的主动链接，站长是无法控制对方的链接文字的。有人用&ldquo;SEO&rdquo;链接站点，也会有人用&ldquo;SEO研究院&rdquo;链接站点，甚至还会有人直接用&ldquo;独孤天骄&rdquo;链接向<a href="http://www.dugutianjiao.com">SEO研究院</a>。因此如果完全一样的链接文字，则容易被视为机器行为，有作弊嫌疑。</p><p><b><i>链接应该来自不同的IP地址。</i></b>同一台服务器上的网站互相链接是大忌。</p><p><strong><em>链接在网页不同的位置。</em></strong>由于Google的几次排名更新，都降低了友情链接（互相链接）的价值，因此最好反向链接不要都来自于网页底部的友情链接区，而应该在各个网页的不同地方。可能是正文，可能是网站导航，也可能是在底部。就是说反向链接锚文字前后周围的文字应该尽量保持不同。</p><p><i><strong>链接到内容网页。</strong></i>千万不要把所有链接都指向你的主页，而应该把一部分链接分散到其他内容网页，同时链接文字也要有相应的变化。博客就是一个很好的例子，很多博客之间在互相引用的时候，都不会链接到主页，而是链接到文章页。</p><p><i><strong>反向链接应该来自不同PR的网页。</strong></i>PR值越高的网页的反向链接当然越好，但若所有的反向链接都来自于高PR的网页，这恐怕就有些问题了。因此要避免大面积地购买高PR的链接。Google对购买链接的惩罚越来越重。要识别一个站的真实的PR值，除了查看Google bar的PR，还需要验证PR的真实性和可靠性。<a href="http://livepr.raketforskning.com/"><font color="#0063dc">http://livepr.raketforskning.com/</font></a> 这个网站可以直接从google数据库里读取PR，建议使用。另外，应该看一下跟你交换链接的网站是否在搜索引擎中充溢着大量的垃圾信息，如blog的评论，留言本等，这种站应该立即放弃。</p><p>&nbsp;当然，还有其他一些需要注意的，比如是否来自新旧网站的链接都有，&nbsp;反向链接所在的域名年龄多长，反向链接所在页第一次被收录的日期等都是影响的因素，我们不可能将所有的因素都研究出来。</p><p><strong>三、链接分析技术：如何对链接进行判断？</strong></p><p>并非所有的网站，我们都适宜与其交换链接。一些我们能眼见为实的网站当然我们很好判断，比如我们一般不会与反动的、暴力的、色情的、政治性的站点交换链接。但是一些隐形的站点，表面看起来非常健康的站点，我们应该怎么办？</p><p>这个时候，我们就不得不借助链接分析技术对链接进行判断了。</p><p>首先，我们应该查看其是否失去投票机制。在Google的算法中，一个网站算一个投票，由于买卖链接以及垃圾链接的存在，Google等站已经开始将一些高PR的站点的link删去，不索引该站点的链出，这类站点是最多的。要特别注意，他有可能已经失去了投票的功能。比如&ldquo;站长网&rdquo;的图王就宣称百度已经有内部人员声明降低了其网站外部链接的价值，就是说你在站长网发布的链接价值已经不像想像中的那么高权重了。</p><p>我们可以在Google中通过link命令反查，如link:www.dugutianjiao.com和link:dugutianjiao.com，如果该站点已经失去了投票机制，在反向链接中，将不会再出现该站点的。当然，需要考虑时间因素，新站自然没有那么快，但是如果一个已经存在较久的网站连一两个外链都没有，则是不正常的。</p><p>其次，与对方网站交换链接时，我们还需要注意两点：</p><p>1，对方交换页的内部链接有多少。如果该链接页面如果已经超过了100个链接，Google非常有可能识别不到该页面的连接，当然，这个数值一般来说，PR越高，数值可能也会增高。基本浮动为120-200个。</p><p>2，如果跟我们交换友情链接的网页已经跟数十乃至数百个网站交换了链接，我们再与其交换链接就失去了应有的意义。</p><p><b>四、如</b><strong>何增加反向链接的数量？</strong></p><p>通过SEO专家所推荐的链接诱饵(link baiting)的方法，靠内容来吸引导入链接，形成自发的反向链接，是独孤天骄觉得最好的增加反向链接的方法。</p><p>一般来说，权威的、实用的内容比较容易成为诱饵，吸引其他人链接向你。首先要说明的一个原则是，获得反向链接的根本在于提供对用户有用的信息，只要你写出独特的有用的文章，别人就会自动链接向你，百试不爽。当然，我们也可以将内容发布到行业新闻网站。比如IT行业可以发布到艾瑞、Donews等网站。这些网站的排名很好，除了增加反向链接，还会给你带来高质量的流量。 SEO的研究性文章，可以提交给<a href="http://www.dunsh.org">点石互动</a>或<a href="http://www.dugutianjiao.com">SEO研究院</a>。 可以与其他网站交换文章发表，高质量的新闻稿甚至可以提交给新闻门户网站。把文章发送给RSS网站如抓虾、鲜果等也是一个不错的方法。 将自己的文章加入百度搜藏、雅虎搜藏、Google书签、QQ书签等社会化书签，以及让用户通过Google阅读器、RSS等订阅你的文章都是可行的方法。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/seo-backlinks-secret.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=28</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=28&amp;key=30e67296</trackback:ping></item><item><title>SEO是什么？</title><author>hyb927@163.com (独孤天骄)</author><link>http://www.dugutianjiao.com/post/what-is-seo.html</link><pubDate>Thu, 23 Oct 2008 22:31:50 +0800</pubDate><guid>http://www.dugutianjiao.com/post/what-is-seo.html</guid><description><![CDATA[<p>SEO是什么？为什么需要学习SEO？&mdash;&mdash;这是初学SEO者必须跨越的第一道槛！因此&ldquo;<a href="http://www.dugutianjiao.com/post/seo-secret.html">SEO两百个秘密</a>&rdquo;开篇我们准备先对它的正确概念进行阐述。</p><p>SEO原本来源于英文<b><u>Search Engine Optimization</u></b>的缩写，翻译成中文便是&ldquo;<b><u>搜索引擎优化</u></b>&rdquo;，一般我们也可简称之为&ldquo;搜索优化&rdquo;，与之相关的还有Search Engine Ranking（搜索引擎排名）等，但是&ldquo;搜索引擎排名&rdquo;这个概念仅仅隶属SEO狭义的一个概念，SEO本身包含的内容远不止Rank本身。<span style="color: #ff0000">在网络上，包括许多自诩为SEO专家的人士都经常提到&ldquo;SEO优化&rdquo;这个词，这其实是错误的叫法。&ldquo;SEO优化&rdquo;全称应该等同于&ldquo;<strike>搜索引擎优化优化</strike>&rdquo;。SEO本身就含有优化的概念，<strong>SEO&ne;SEO优化</strong>。</span></p><p>SEO在国外开展较早，那些专门从事SEO的人员被Google称之为&ldquo;Search Engine Optimizers&rdquo;，简称SEOs，网络上也有写作SEOer的。由于Google是目前世界最大搜索引擎提供商，所以Google也成为了全世界SEOs的主要研究对像。国内从事SEO工作的人员主要负责本公司站点的关键字排名检测，维护，与搜索引擎体验方面的建设工作，一般称之为SEOer或者SEO专员，SEO工程师等。</p><p><b>SEO具体的概念：</b></p><p>SEO的主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术，来对网站的内容、页面元素、整体结构、网站布局、关键词分布、内外部链接及密度等进行优化，使其提高搜索引擎排名，从而提高网站访问量，从大量搜索者中获取潜在目标客户，最终提升网站的销售能力或宣传能力的技术。</p><p>&nbsp;简单的说，SEO是一种让网站在百度，谷歌，雅虎等搜索引擎获得较好的排名从而赢得更多潜在客户一种的网络营销方式，也是SEM(搜索引擎营销）的一种方式。</p><p><b>SEO的操作手法：</b></p><p>SEO在具体的排名（<a href="http://www.dugutianjiao.com">SEO研究院</a>一直反复强调，排名只是一个狭义的范畴）操作手法上可以分为白帽SEO和黑帽SEO，也有再细分为灰帽，甚至绿帽的。简单的说，白帽SEO就是正规合理的运作，黑帽SEO就是反其道而行之的作弊手法。&nbsp;SEO作弊手段不仅仅在中国，在全球都有，只是程度不一样而已。搜索引擎公司里面都有专门的部门和人员负责&ldquo;作弊&rdquo;行为，比如Google公司里面的Matt Cutts。</p><p>SEO的商业操作主要是由SEO公司来进行的，当然目前国内的还是个人行为居多。</p><p>这样的SEO公司根据服务的不同还可以分为顾问公司和操作执行公司。SEO顾问公司，一般只提供咨询服务，更多地是对网站的诊断并给出相关的建议。其次就是操作与执行公司。它一般根据客户的意见，有时候是顾问的意见整理出可实施的优化方案来。</p><p>国外的SEO公司和他们的客户更多关注的不是排名，而是访问量和转化率，或者说是ROI(投资回报率)。这也是<a href="http://www.dugutianjiao.com">独孤天骄</a>一直以来并不提供单纯的关键词排名服务的最大原因，国内的用户经常劈头就问，把&ldquo;美女&rdquo;这个关键词做到第一位多少钱？他们更多的是愿意花500元甚至2000元将类似的关键词排上去，坐收广告费。真正的SEO不论从哪个方面从来不愿意接受这样的排名服务。</p><p><b>SEO具体的操作手法：</b></p><p>主要分为站外SEO和站内SEO。</p><p>&nbsp;站外SEO是脱离站点的线下搜索引擎技术，主要因素体现在反向链接，即我们所说的外部链接。大量的导入链接，从高PR值得网页获得导入链接，从相关内容网站获得导入链接，导入链接指向的网页有具体内容，导入链接的时间长度，一般导入链接的存在时间有3-6个月，单向链接的价值高于交换链接&nbsp;，链接来自不同IP，合理的导入链接增长频率&nbsp;等都有助于站外SEO。<br />&nbsp;</p><p>站内SEO则主要是以整站优化为主，内容涉及到丰富网站关键词、网站主题、站点设计、站点的内部链接和导出链接、网站内容的写作和更新等&hellip;&hellip;&nbsp;URL、网页Title、文字内容、Heading 标签、站内链接、导出链接、图片文件名、Alt标签、comment内容、合理的频率更新内容、内容对搜索引擎的展示位置、PR&nbsp;、关键词进行适当的修饰（加粗、斜体等）都能够影响到站内的优化。</p><p>因此，SEO不仅需要掌握搜索引擎如何抓取网页和如何索引网页，把握关键词的配置和优化技术，同时也应该深刻理解网站的内外部结构、网站链接优化等这些页面之外的因素，甚至应该掌握营销策划，以及付费营销。SEO和SEM不应该是分开的两个范畴，搜索引擎优化(SEO)是搜索引擎营销(SEM)的重要组成部分。这样的观点也开始在全球各地普及起来，一个完整的搜索引擎营销解决方案，应该包括优化和所有的付费排名策略。</p><p>对初学SEO的朋友，以下两个摘录应该会对您有所启发：</p><p><b>SEO 十心：</b></p><p>1、耐心。没有耐心者请打道回府。很多客户也很想今天你给他优化，明天网站就上去了， 这不现实，你要向客户说清楚。<br />2、决心。要花很多精力搞SEO必须需要坚强的决心，不屈不挠，方能成功。　　<br />3、专心。专心研究SEO之成功案例，是关键之所在。<br />4、关心。关心搜索引擎发展之趋势，常看看文章有助于了解SEO界最新动态。<br />5、当心。不要违反一些搜索引擎的明文规定，否则赔了夫人又折兵。<br />6、贪心。不想当将军的士兵不是好兵。<br />7、狠心。舍不得孩子套不到狼，不投资点域名作试验只能固步自封。<br />8、谈心。常和人交流，最好找几个水平不太低于你的SEOer谈。这样会增加你对搜索引擎的热爱程度和信心。<br />9、良心。不要对搜索引擎和其他SEOer过于过分。<br />10、舒心。能适时放松身心，才能保证充沛的精力面对问题。<br />&nbsp;</p><p><b>最新公开的SEO优化公式：</b>SEO=&int;Clock=&int;C1+L2+K3+O4<br />&nbsp;　　1、&int;是一个积分符号，C=content，L=link，K=keywords，O=others。SEO就是一个长期的对&ldquo;时间&rdquo;积分过程，内容是核心。<br />&nbsp;　　2、C1&mdash;丰富的内容是第一位的要素，按照原创、伪原创、转载依次排列内容的重要性满足用户体验。<br />&nbsp;　　3、L2&mdash;链接的合理与丰富是第二位的要素，合理有效的内部链接与丰富的外部链接同等重要，而外部链接中高度相关性高Pr值页面尤为重要。<br />&nbsp;　　4、K3&mdash;关键字因素是第三位的重要因素，包括：合理的Title、Description、Keywords、页面关键字及相关关键字的密度与合理布局。<br />&nbsp;　　5、O4&mdash;其它因素，比如：域名、站龄、服务器、网站架构、排版、邻居、Url、地图等等。</p>]]></description><category>SEO两百个秘密</category><comments>http://www.dugutianjiao.com/post/what-is-seo.html#comment</comments><wfw:comment>http://www.dugutianjiao.com/</wfw:comment><wfw:commentRss>http://www.dugutianjiao.com/feed.asp?cmt=27</wfw:commentRss><trackback:ping>http://www.dugutianjiao.com/cmd.asp?act=tb&amp;id=27&amp;key=ec4d7ca3</trackback:ping></item></channel></rss>
