SEO探索

中文网站搜索引擎优化技术研究


存档: 2006/04

关键词密度(Keyword Density)

2006/04/29

  要达到理想的网站优化效果,不仅仅要为我们的网站或网页选定恰当的、有效的关键词(见如何选定关键词?),更重要的是如何在网页中恰当地将这些关键词嵌入到内容当中。对SEO来说,这主要包括两方面的考虑:1、关键词的位置,关键词出现在页面文件的哪个部分及先后顺序,这对网页出现在SERP页面中排名影响近来逐步降低;2、关键词密度或关键词频率,在网页中关键词出现的频率越高,搜索引擎便会认为该网页内容与相应关键词的相关性更高,从而更易出现在SERP页面的前端。今天我们先来探讨一下关键词密度,至于关键词位置留待日后再予讨论。

关键词密度与关键词频率

  实质上,关键词密度(Keyword Density)与关键词频率(Keyword Frequency)所阐述的是同一个概念,用来量度关键词在网页上出现的总次数与其他文字的比例,一般用百分比表示。相对于页面总字数而言,关键词出现的频率越高,那么关键词密度也就越大。简单地举个例子,如果某个网页共有100个词,而关键词在其中出现5次,则可以说关键词密度为5%。

正确理解关键词密度

  但是,上文我们给出的例子只是一种理想的简化方式,事实上,在我们的网页中,还有很多的HTML部件,如meta 标签中的Title、Keywords、Description,如图像元素的Alt文本、如HTML文件中的注释文本等,这些在计算关键词密度时也都要考虑在内的。继续使用上文的例子,即网页内容为100个词,但同时,页面的Title有10个词,Description 有20个词,图像的alt则用了70个词,HTML注释用了10个词,这样,页面中的文本字数即为 100 + 10 + 20 + 70 + 10 = 210。

  同样地,在计算关键词频率时,也不仅仅指网页可见部分中关键词出现的次数,也包括在上文中提到的非可见部分中的出现次数。同样以上文的例子来说,如果关键词在页面Title中出现3次,在Description中出现5次,在Alt文本中出现30次,在注释中出现2次,那么总的关键词出现次数即为 5 + 3 + 5 + 30 + 2 = 45。那么,这样关键词密度即为45/210 x 100 = 21%。当然,搜索引擎在算法上要比这复杂得多,但基本策略与此近似。

  同时,也要考虑Stop Words(停用词) ,这些词往往会在很大程度上稀释关键词密度。

适当的关键词密度

  不同的搜索引擎,包括Google、Yahoo和MSN Search,在对关键词密度的算法上其数学公式有所差别,其接受的最佳关键词密度不尽相同。而就过度优化如关键词Spam而言,不同的搜索引擎在采取惩罚前的容忍级别也不尽相同。

  一般说来,在大多数的搜索引擎中,关键词密度在2%~8%是一个较为适当的范围,有利于网站在搜索引擎中排名,同时也不虞被搜索引擎视为关键词填充。

  Tags: , ,

网页Title的优化的原则

2006/04/28

  在对页面优化要素的讨论中,我们把Page Title列为影响页面优化效果的第一位,这并不是夸张,各项测试与研究均表明Page Title在SEO方面的决定性作用。但是,网页Title的作用远远不仅于此:网页优化及各种SEO技术的采用只是保证我们的网页能够出现在搜索引擎SERP页面的前列,但是,仅仅出现在SERP页面的前列并不是我们进行网站优化的真正目标,我们要的是用户的点击、访问,而用户是否点击,我们对网站所做的优化工作能否转换为实际的访问量也在相当程度上取决于Page Title设置是否合理,是否切中用户的搜索需求。

  我们都知道,网页标题,也即Page Title,是对网页内容的概括与总结,这是用户了解网页所涵盖内容的最直观途径。在搜索引擎的SERP页面中,Page Title以醒目的标题形式出现,这几乎是用户决定是否点击、查看相应页面的惟一判断条件。(尽管在Page Title下方会有网页的基本描述、内容摘要,但很多用户对那些部分基本上是忽略不见的)。

SERP页面中Page Title决定用户是否点击访问

网页Title优化的原则

  Page Title的长度:虽然随着搜索引擎技术的不断进步,对Page Title文字长度的限制渐渐不那么苛刻了,相关的测试表明,即便一个非常长的网页Title,其对SEO方面带来的负面影响也越来越小了。但是,即使如此,我们也要注意控制一下Page Title的字数,因为,在SERP页面中用来展示Page Title的字数是有限定的,过长的标题则会被搜索引擎截去,这样的话,一个不能完整展现的标题则使得我们对Title就算再优秀的架构再意味深长的规划都失去意义。

  目前各主要搜索引擎对Page Title的字数限制分别为:(注:单位为汉字,非英文字母。因未找到相应的官方数据,只是本人观察,可能具体数字有误,不过,总的原则应该没问题)

  • baidu:20字
  • google:30字
  • Yahoo:20字
  • MSN Search:25字

过长的标题被截断
(过长的标题被截断)

  Page Title的内容:除了对网页内容的概括与提炼外,Page Title中还应该包括什么内容?一般说来,为永续经营考虑,大多数网站都希望将自己的网站名称,或企业名称、商标名称打造成一个知名品牌,这就需要在Page Title中出现或强调相应部分,即将网站名称或商标或企业名称出现在Page Title中;对于内容丰富结构复杂的网站,一种较好的处理是将导航信息也嵌入到Page Title中,这样,用户在浏览某个网页时,可以通过Page Title直观地了解目前在该网站中的位置,等等。当然,这么做的时候要兼顾到上面一条中所探讨的Page Title字数考虑。

  Page Title中的关键词:为优化考虑,Page Title要注意有机地嵌入内容相关的关键词,而这些关键词的重要性则与位置有关:即出现在Page Title中最左边的关键词最重要,第二个次之,等等。必要的时候,也可以考虑重复关键词以强调。当然,前提是“有机地嵌入”,而非单纯的关键词罗列。

  在下一部分我们将探讨网页Title优化的实施策略。

  Tags: , ,

如何摆脱Sandbox

2006/04/26

其实,之所以谈Sandbox这个话题,主要是因为HighDiy 论坛这个月访问量的异常变化:在3月份,HighDiy 论坛来自Google与Baidu的访问量之比为3:2,Google略占上风;4月份来自Google的访问却几乎突然消失,到目前为止来自Google与Baidu的访问量之比为1:78,明显地被Google置入了Sandbox,尽管HighDiy 论坛内容单薄,尽管HighDiy 论坛缺乏足够的链接,尽管HighDiy 论坛的PageRank上升为5。老实说,在本人以前的理解中,Sandbox对子域名似乎是“高抬贵手”的,现在看,不尽然,在WFW论坛上也有多人谈到其子域名的Sandbox问题。HighDiy 论坛子域名的启用大概在2月中旬,也就是说,在其运行1个半月后掉入了Sandbox,照这个速度推算,也许SEO探索将在5月20号左右访问量也将有大的下降,当然,如果能有例外更好。

那么,当我们的网站被“放入”了Sandbox后应该怎么办?

耐心等待!

这是无奈但又最有效的答案。正如我们在上篇文章中说的,被置入Sandbox并不是Google对网站的惩罚,而只是类似于“考验期”的性质,因此,没必要惊惶失措,只需耐心等待,时机一到自然便会恢复在SERP正常的网页排名。

照原有的正确方式建设网站

Google的排名规则本身并没有大的变化,网站的排名取决于内容的质量、反相链接的质量等。我们要做的便是在这一段时期进一步丰富内容、建立链接等,这样,在离开Sandbox时才能保证页面在SERP中能有较理想的位置。

另外,这也给我们建立除搜索引擎特别是Google外更多访问来源的动力。

一般说来,在这段时间,应该:

  • 正常地更新内容,特别是高质量的原创内容。
  • 尽可能稳定地、逐步地得到一些高质量的外部链接,这也可以成为访问量的另一个来源。
  • 通过其他的搜索引擎给网站带来访问量。

针对非竞争性关键词优化

被置入Sandbox,并不意味着被Google屏蔽。相比较而言,Sandbox效应在竞争性强的关键词上表现异常明显,而在竞争性较弱的关键词上则放开一面。通过对非竞争性的关键词进行优化,依然可以让我们出现在SERP的前面,虽然这样带来的访问量不大。另一方面,有关研究表明,选用竞争性强关键词的网站其在Sandbox中呆的时间要长于选用非竞争性关键词的网站,这样,通过选用非竞争性关键词可以让我们尽快摆脱Sandbox。

相信没人愿意自己的新网站被置入Sandbox,但是,我们对此没有选择,只能尽量减小其带来的影响。

  Tags: , ,

AWStats在linux/Apache下的安装使用

2006/04/25

在前面的文章中,我们介绍了AWStats在Windows/IIS下的安装使用,而在Linux/Apache下,其安装则更为简单, 8) 一般来说,这类Open Source软件对Linux的支持力度总是要强于对Windows支持的。

1、首先,当然是下载AWStats,如果Apache原配置不支持cgi,则要稍做修改:

./apxs -c -i /usr/local/src/httpd-2.0.4/modules/generators/mod_cgi.c

再在httpd.conf 中添加

LoadModule cgi_module         modules/mod_cgi.so

2、不过,在Apache下,日志截断则相对麻烦些,需要使用cronolog,下载cronolog工具后:

# tar -xzvf cronolog-1.6.2.tar.gz
# cd cronolog-1.6.2
# ./configure
# make
# make install

安装完成将在/usr/local/sbin目录下生成以下两个文件:cronolog cronosplit

然后修改apache配置文件中相应部分:

自定义日志格式
CustomLog “|/usr/local/sbin/cronolog /opt/apache/logs/access_log.%Y%m%d” combined
如果存在多个虚拟站点
可以考虑在VirtualHost进行相应设置

3、AWStats的安装

tar zxf awstats-version.tgz

awstats的脚本和静态文件缺省都在wwwroot目录下,将awstats.pl程序到 /home/apache/cgi-bin/awstats/ 下

mv awstats-version/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats

把icon等文件目录复制到WEB的HTML文件发布目录下:/home/apache/htdocs/ 下发布,更多的批量更新脚本等在tools 目录下,可以一并放到cgi-bin/awstats/ 目录下

4、编辑配置文件

默认配置文件下在/etc/awstats目录下,如awstats.www.highdiy.com.conf,根据我们的需要改变某些配置,如:

SiteDomain=”www.highdiy.com”
LogFile=”/var/log/httpd/access_awstat.%YYYY-0%MM-0%DD-0″
HostAliases=”highdiy.com”
DefaultFile=”index.html”
DirData=”/home/cgi-bin/awstats/data/”
AllowToUpdateStatsFromBrowser=1。

5、生成日志分析数据

进入../awstats/wwwroot/cgi-bin/目录里执行如下语句:

./awstats.pl -update -config=www.highdiy.com

6、即可通过浏览器访问日志

http://www.somedomain.com/awstats/awstats.pl?config=www.highdiy.com

7、至于在WIndows/Apache下AWStats的安装使用,可参考AWStats在Windows/IIS下的安装使用

  Tags: , , ,

SEO探索建站总结(第二周)

2006/04/24

4月17日 - 4月24日,SEO探索建站第二周总结。

Google收录页面数量在第二周上升到第一位,联系到其Spider频繁的访问,这也是应该的,不然就得考虑屏蔽掉其Spider的访问了。 8) MSN Search的收录数量下降到第二位,不过,从收录速度上看,其仍然是最快的,昨天改的几个地方在其他搜索引擎中均未反应出来,惟独MSN Search。Yahoo与Yahoo中文则有点奇怪,似乎二者之间的数据存在不能共享的部分(?)。

页面收录情况记录(4/24)

Google                   51
MSN search(其中文搜索Beta版为同一结果)  34
MSN search 中文搜索Beta版         38
yahoo                    26
yahoo 中文                  3
BaiDu                    1

Baidu依然只收录一个页面令人困惑,怀疑其是不是对本站这样的Url格式不能识别,即把类似于“http://seo.highdiy.com/index.php/category/seo-general/”这样的Url在处理中统统将“index.php”之后的内容删减掉了?所有才只有“index.php”一个页面?

在日志中,各搜索引擎的Spider读取页面次数分别为:

googlebot     507
Yahoo Slurp    103
MSNBot      89
BaiDuSpider    45

在反相链接方面,Yahoo与MSN Search分别为234(Yahoo)、1080(Yahoo中文,这个数字肯定是有问题的)、11(MSN Search)、12(MSN search 中文搜索Beta版)

从访问情况看,来自搜索引擎的访问量限于Baidu与Google(Yahoo 与MSN Search均为1, :oops: ),数量分别为36与30,Baidu以收录的一个页面实现超出其他搜索引擎的访问量,说明,1、其在中文网站搜索中庞大的用户基础;2、相对于Google对新网站与新网页的滞后处理,Baidu似乎更喜欢给新网站或新网页较高的排名。

  Tags: , , , ,