导航

« SEO两百个秘密:Google的类似网页针对MSN搜索引擎进行网站优化 »

网站防采集方法

推荐:如果你首次访问本博或喜欢本文,请订阅我的全文 RSS Feed来支持SEO研究院,以更快获取信息。

网站最怕的一点肯定是被垃圾网站采集,尤其对于原创站点来说,刚编辑更新的内容,被人时刻盯紧着“自动采集”,那无疑是很令人痛苦的一件事。首先,采集容易造成服务器速度变慢,影响网站用户的访问;其次,从搜索引擎优化的角度上来看,被采集过多,容易造成搜索引擎对网站内容原创性的判断失误。最起码的,会分散原本属于自己站点的流量!

有没有什么办法既能防止采集,又不影响搜索引擎收录呢?

在此,SEO研究院提供自己常用的,证明是行之有效的三个办法:

1,封IP防采集。

具体代码如下:

<%
Dim IP,IPString,VisitIP
'要禁止的IP地址,这个事恶意采集你站点的ip地址。
'可以通过ping对方的服务器得到这些ip,比如“ping www.dugutianjiao.com -t”。
'其中127.0.0.1是防止从本地采集,大量的采集一般都是从本地采集,再远程上传的。
IPString="|127.0.0.1|222.221.220.119|118.117.116.115|"
'获取IP地址
IP = Request.ServerVariables("HTTP_X_FORWARDED_FOR")
If IP = "" Then
IP = Request.ServerVariables("REMOTE_ADDR")
End If
VisitIP="|"&IP&"|"
If instr(1,IPString,VisitIP)>0 Then
response.write "你的IP被禁止,请不要恶意采集SEO研究院的文章。"
response.end
End If
%>

我经常使用的网站系统是动易系统,擅长动易SEO。这个系统可以直接在网站设置里面屏蔽对方的ip地址,不过一定要记得网站的内容页列表应该采用asp格式,如果是html格式,封了对方ip人家还是能照样采集你的内容。不需要每篇文章都放这个代码,只要在列表页的</head>上面放置上述代码即可。因为列表页是采集的必经之页。   

2,删除列表页。

很简单,如果你的网站内容本身不是采集的,那么一般来说,所有的文章都已经被搜索引擎收录,那么我们完全可以删除掉所有列表页。不过这一招比较危险,因为用户也同时无法经过列表页访问更多的内容,你可以在文章内部加强内部链接,以及相关文章、热门文章、推荐文章、随机文章的应用等等。如果你的网站从搜索引擎来的流量占据了绝大多数,那么完全可以删除掉列表页。

3,文案写作的时候注意融入版权。

比如这篇文章,大家认真查看,作者、网站名、网址这三个地方融入了我自己网站的版权信息。


网站防采集方法首发地址:http://www.dugutianjiao.com/post/anti-collection.html ,转载请保留链接。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Copyright 2004-2008 SEO研究院 All Rights Reserved.Powered by Z-blog,Theme by Google黑板报,washun仿制。