

2008年04月23日 by 樂思蜀
上一篇Wordpress文章讲述了Wordpress的Title优化设计,今天樂思蜀分享一下利用Wordpress自定义字段定义Meta标签,以文章页中SEO所需的Keywords和description为例,其他也可用同样的方法实现。
首先说明一下,有很多Wordpress插件可以实现这样的功能,All in One SEO 就是最典型的一个。但是这些插件的资源消耗,对加载速度的影响,实在不敢恭维。如果你觉得使用插件的方法更适合,下面的内容可能对你没有意义。
文章中输入自定义字段(Custom Fields)

如上图,撰写文章时,在“自定义字段”中分别定义keywords和description两个字段(可以定义为自己喜欢的名称,和下面调用中对应起来就行),并填入该文章的keywords、description信息。
在模板中调用自定义字段
编辑Wordpress模板文件header.php,在<head>到</head>之间插入以下代码:
<?php if ( is_single() ) { ?>
<meta name="keywords" content="<?php $key="keywords"; echo get_post_meta($post->ID, $key, true); ?>" />
<meta name="description" content="<?php $key="description"; echo get_post_meta($post->ID, $key, true); ?>" />
<?php } ?>
第1行/第4行:设置仅在文章页(single)中显示;
第2行/第3行:调用keywords、description自定义字段(与在文章中输入的$key对应)。
下次撰写文章时
定义好的Wordpress自定义字段后,信息会保存在数据库中。
下次撰写文章时,只需要在“自定义字段”位置选择keywords和description,输入文章对应的内容就可以了。
Wordpress的自定义字段功能非常强大,善加利用可以打造出很多实用功能,其他使用方法与高级技巧可以参考官方文档:Using Custom Fields。
2008年04月10日 by 樂思蜀
今天网友小贼在QQ上问我,为什么搜索引擎中那么多排在前面的站点,都没有写Keywords和Description,樂思蜀就这个问题发表一下看法。
这两个Meta标签有什么作用?
这两个Meta标签的现状
准确、独特的Meta信息,能为搜索引擎提供参考。但很多网页制作人员,在这两个Meta标签中大量堆砌,以期在搜索引擎中得到好的排名。所以,搜索引擎正逐渐淡化它们的参考作用。
目前,只有准确、独特的Keywords和Description信息,搜索引擎才会有选择的作为参考。
为什么很多排名较好的网站没有这两个Meta标签?
通过交流了解,很多排名较好的网站,并没有设置这两个Meta标签,主要有这几个原因:
1、很多时候搜索引擎抓取到的信息比设置固定的更有优势
搜索引擎抓取到的描述信息,大多数情况下展现在搜索结果中是“动态”的。也可以理解为,搜索引擎自己抓取的描述信息,在搜索结果中显示出来的页面摘要不是固定的,而是根据搜索者搜索的关键词不同,显示不同的页面摘要。
这样,就意味着一个网页具有多个不同的页面摘要信息,根据搜索者搜索的关键词动态匹配。
下图显示的是我的SEO博客中,同一篇关于Robots的文章,在Google中搜索“Robots”和“Robots.txt”显出的两个不同页面摘要。

下图显示的是在Google中搜索“乐思蜀”和“思蜀”显示的页面摘要,因Google使用了DMOZ中樂思蜀SEO博客的描述信息,显示的是固定的摘要。

2、程序原因
目前主流的程序,只有极少数提供独立设置各页面Keywords、Description的功能。
很多程序号称提供SEO功能,能够设置Meta信息,但实际情况是,设置好以后整个网站所有页面全部显示一样的Keywords、Description信息。
这样的方式,不但对网站没有帮助,反而有堆砌、使用不当之嫌,不如不用。
3、工作量原因
很多站包含大量的内容,如果对各个页面一一设置对应的Keywords和Description,将有很大的工作量。现在搜索引擎已经很强大、很聪明,抓取到的页面描述也较准确。
相信搜索引擎,把这些工作省去,让搜索引擎来完成。
4、无法准确设置
很多网站中的页面,是无法设置固定的Keywords和Description。
比如论坛,一篇帖子发布后,回帖中会有各式各样的观点,有些回帖甚至偏离主题,这样的情况下设置固定的Keywords、Description是不合适的。
再比如博客,和论坛一样,只要开启了评论功能,评论信息量一大,指定的Keywords和Description,于整个页面内容就是不准确的。
5、简约论
一切从简,内容致胜。
简约论者认为:可要可不要的一概不要,以优势的内容来获取效果
这个问题谈论到此,参考了很多Description的资料,总结了一些心得,将在下一篇中和大家分享。
2007年11月09日 by 樂思蜀
今天一天之内,准确的说相隔不到3个小时,就有两个朋友在QQ上让我帮他看看网站,为什么搜索引擎不收录。从我个人角度来看,他们的站做的还不错,除了个别地方(如有几页标题相同之类)不够,没有导致不收录的因素。最后一查看robots.txt,“Disallow: /”。
回想起来,找我咨询的朋友中,还真有不少的一部分都是这样的问题,所以写出来,供不熟悉的朋友参考。
1、robots.txt是什么?
robots.txt是一个纯文本文件,用来告诉网络蜘蛛(不仅限搜索引擎蜘蛛)本站中哪些位置允许抓取,哪些位置不允许抓取。
2、如何正确放置robots.txt?
首先,robots.txt文件必须放置在网站根目录;有域名指向到次目录,在次目录放置的robots.txt文件只对此域名有效。
其次,文件名必须小写,如Robots.txt、roBots.txt、robots.TXT都是错误的。
3、robots.txt内容应该如何写?
文件应该同时包含2个域,“User-agent:”和“Disallow:”,每条指令独立一行。
(1)User-agent:
指定允许哪些蜘蛛抓取,如果给出参数,则只有指定的蜘蛛能够抓取;如值为通配符“*”号,代表允许所有蜘蛛抓取。如:
User-agent: Googlebot
只允许Google的蜘蛛抓取;
User-agent: *
允许所有蜘蛛抓取。
注意:User-agent必须出现在第一行(有意义的行,注释除外),首先声明用户代理。
(2)Disallow:
指定禁止蜘蛛抓取的目录或文件,如:
Disallow: /help.php
禁止抓取根目录下help.php文件;
Disallow: /admin/
禁止抓取根目录下的admin子目录中任何内容;
Disallow:
值为空时,表示不限制,蜘蛛可以抓取站内任何内容。
如果需要指定多个目录或文件,可以用多个“Disallow: 文件或目录名”来指定,但必须每一项单独一行。
这就是前面说到的那两位朋友网站robots.txt的问题,他们用“Disallow: /”禁止了蜘蛛抓取根目录下的所有内容。
4、robots.txt需要注意的几个问题:
5、将你的XML格式Sitemap地址放到robots.txt中
Robin新发现,并率先在国内提出的,大家可以到点石博客中下载Robin的“网站如何被高效索引”演讲稿阅读。
加入Sitemap地址的作用是,如果搜索引擎蜘蛛能够识别此行,就能快速获知网站的XML地图文件地址,并将地图文件作为一个URL参考进行高效索引(具体哪些搜索引擎蜘蛛能够识别目前我还不清楚)。
如樂思蜀SEO博客的robots.txt,紧接着User-agent的第二行:
Sitemap: http://www.lesishu.cn/sitemap.xml
此处之前的内容,将Sitemap放在第一行的说法错误,特此更正。
robots Meta标签
robots.txt是放在网站中,文件级的网络蜘蛛授权;而robots Meta标签是放在网页中,一般用于部分网页需要单独设置的情况下。两者的功能是一样的。
Meta robots标签必须放在<head>和</head>之间,格式:
<meta name="robots" content="index,follow" />
content中的值决定允许抓取的类型,必须同时包含两个值:是否允许索引(index)和是否跟踪链接(follow,也可以理解为是否允许沿着网页中的超级链接继续抓取)。共有4个参数可选,组成4个组合:
以上1和4还有另一种写法:
index,follow可以写成all,如:
<meta name="robots" content="all" />
noindex,nofollow可以写成none,如:
<meta name="robots" content="none" />
需要注意的是,robots Meta标签很多搜索引擎是不支持的,只有少数搜索引擎能够识别并按给定的值抓取。所以,尽可能的使用robots.txt文件来限制抓取。
最后,给大家一个建议,不要太刻意的在robots.txt中设置过多禁止文件或目录,只设置确实不希望被搜索引擎索引的目录和文件就可以了。
特别是在不清楚文件或目录的作用时,不要轻易禁止抓取。前阵一位做旅游的朋友,网站中有大量的旅游景点图片,几大搜索引擎中却都没有索引,后来对网站检查时发现图片目录upload在管理目录admin下,被robots.txt禁止抓取了。
虽然网上关于robots的文章已经很多了,发现都不尽全面,整理了一下供参考。