很多大型博客屏蔽百度SEOER必看
最近玩免费博客的时候发现很多大型博客都屏蔽了百度,还有不少博客都屏蔽所有搜索引擎了,我今晚就整理了一些主流的博客发到赛欧网上面,给大家分享下,免的大家做无用功。因为不少SEOER都在玩一些免费的博客带新网站和关键词,所以整理的博客如下:
禁止搜索引擎的主流博客有:
QZONE qzone.qq.com
百度空间 hi.baidu.com
迅雷博客 blog.xunlei.com
Blog.com www.blog.com
博客天下 www.blog.com.cn(屏蔽百度)
中华网BLOG blog.china.com
等等,目前只查询了一些主流的博客,其他的还有很多没有一一的查询,大家也可以一起查询下,补充此帖!估计大家会问为什么会屏蔽呢?我个人认为有2个方面,一是由于他们本事的收录数意见达到了很高了,收录不收录已经没用了;二是,数据太大想减轻蜘蛛对服务器的负担,加这些门户有自己的搜索引擎。大致分析是这2方面原因吧!
除了上述禁止搜索引擎收录的博客以外,还有不少主流博客是对seo排名有较大作用的,这里我推荐去的博客有:
新浪博客 blog.sina.com.cn
网易博客 blog.163.com
Live Spaces spaces.live.com
天涯博客 blog.tianya.cn
猫扑博客 blog.mop.com
中国博客网 www.blogcn.com
阿里博客 blog.china.alibaba.com
和讯博客 blog.hexun.com
博客园 www.cnblogs.com
博客动力 www.blogdriver.com
博客大巴 www.blogbus.com
Blogger.com www.blogger.co
天极博客 blog.yesky.com
腾讯博客 blog.qq.com
企业博客网 www.bokee.net
博啦网 www.bolaa.com
博客中国人 www.blogchinese.com
等等,多的不举例了,相信大家都有博客的资源资料!
下面我介绍下怎么看屏蔽搜索引擎:一般你在地址栏上输入 网址+robots.txt 如:blog.sina.com.cn/robots.txt 就可以看到屏蔽语言!里面的词语代表什么意思呢?下面看具体介绍:
robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不能被搜索引擎的漫游器获取的,哪些是可以被(漫游器)获取的。 因为一些系统中的URL是大小写敏感的,所以robots.txt的文件名应统一为小写。robots.txt应放置于网站的根目录下。如果想单独定义搜索引擎的漫游器访问子目录时的行为,那么可以将自定的设置合并到根目录下的robots.txt,或者使用robots元数据。
robots.txt语法教程
用几个最常见的情况,直接举例说明:
1. 允许所有SE收录本站:robots.txt为空就可以,什么都不要写。
2. 禁止所有SE收录网站的某些目录:
User-agent: *
Disallow: /目录名1/
Disallow: /目录名2/
Disallow: /目录名3/
3. 禁止某个SE收录本站,例如禁止百度:
User-agent: Baiduspider
Disallow: /
4. 禁止所有SE收录本站:
User-agent: *
Disallow: /
5. 加入sitemap.xml路径,例如:
Sitemap: sitemap.xml
搜索引擎对应的英文名字
google蜘蛛: googlebot
百度蜘蛛:baiduspider
yahoo蜘蛛:slurp
alexa蜘蛛:ia_archiver
msn蜘蛛:msnbot
altavista蜘蛛:scooter
lycos蜘蛛: lycos_spider_(t-rex)
alltheweb蜘蛛: fast-webcrawler/
inktomi蜘蛛: slurp