SEO探索

中文网站搜索引擎优化技术研究


存档: 2006/07

Alexa排名及比较

2006/07/13

  Alexa对访问量的统计基于网站在三个月内被安装了Alexa工具条用户的访问情况,其中,用户链接数(Users Reach)指访问人数,计算方法为访问某个特定网站的人数占所有Internet用户数的比例来表示。即:用户链接数 = (访问人数/全部Alexa用户数)* 100%,Alexa以每百万人作为计数单位。页面浏览数(Page Views)指用户访问了某个特定网站的多少个页面,是所有访问该网站的用户浏览的页面数之和。

  而Alexa排名则是基于该网站3个月访问量记录的累积,其计算主要取决于用户链接数(Users Reach)和页面浏览数(Page Views)。Alexa通过对每个网站的用户链接数和页面浏览数进行统计,通过这两个量的三个月累积值的几何平均得出当前名次。

  当然,ALexa统计与排名究竟有多大的实际意义则见仁见智,我们的观点可参看也谈Alexa排名是与非,此处提供这个查询工具Just For Fun!

域名
输入一个或多个(最多10个)域名(格式 : domain.com 或 www.domain.com)

宽度
图表的宽度(像素)
高度
图表的高度(像素)
图表类型
访问统计
排  名
时段
3个月
6个月
1 年
2 年

  Tags:

控制Googlebot对网站的索引与收录

2006/07/12

  一般说来,在网站建设中,总是希望搜索引擎的机器人能够尽可能地在网站内爬行,收录网站尽可能多的页面,要实现这一点,需要在网页设计与制作时尽可能照顾搜索引擎Spider,避免或减少使用图片、Flash、JavaScript等。但是,对大多数网站而言,往往也存在着部分私密性数据不想公诸于众,比如网站的后台程序部分,比如存放于Internet网站服务器上的企业内部信息页面等,对这部分不希望被搜索引擎收录的内容,应如何控制搜索引擎Spider对其的爬行与索引呢?

  Matt Cutts近日提供了一个控制Googlebot索引网页的说明,尽管他所言只是针对Google,但适用于大多数搜索引擎,简要归纳如下:

  1. 网站/目录级别,推荐使用 .htaccess文件来对网站的私密部分加以密码保护,这是最安全的作法,目前各搜索引擎的Spider对密码保护的内容都是无能为力的。同时,.htaccess也可将初级的入侵者拒之门外。不过,.htaccess文件只在Unix/Linux下起作用,国内流行的Windows 平台服务器则无法使用这一功能。
  2. 网站/目录级别,也可以使用robots.txt来控制搜索引擎抓取,这也是不支持.htaccess文件的Windows 平台服务器下的的必须选择。不过,与采用.htaccess文件的方式,控制权完全掌握在网站建设者手中相比,robots.txt能否完全控制搜索引擎的Spider取决于搜索引擎是不是严格遵循robots.txt文件的要求,如Baidu的Spider就曾多次被质疑。
  3. 网页级别,在html文件中使用meta标签,“noindex”标签将告诉搜索引擎的Spider该页面拒绝收录,“nofollow”标签则告诉搜索引擎的Spider该网页内的所有链接拒绝爬行。同样地,这些标签Googlebot能够很好地辨识并遵循,但有些搜索引擎则未必。
  4. 链接级别,可以为某个单独的链接使用“nofollow”标签
  5. 如果要保护的内容已经被Google收录,可以使用google的网址删除系统。一般说来,这是最后的手段,要慎重地使用,在Google索引中被删除的内容在180天内不会被重新收录。具体可参考Google的帮助

  当然,要完全杜绝私密内容被搜索引擎、被别人看到,最有效的还是不要将其放在面向公众访问的Internet服务器上。

  Tags: , , ,

文本/代码比率

2006/07/10

  我们都知道,类似于FrontPage和DreamWeaver之类的“所见即所得”型编辑器往往会在HTML页面文件中产生大量冗余的垃圾代码,这是SEO的大忌,这一方面大大降低代码的可读性,另一方面,也会使您欲突出的关键词淹没在大量的代码中。

  当然,冗余代码并不仅仅由所见即所得编辑器,设计不够专业的页面,往往由于代码的复用率不高,重复使用相同或类似的代码,造成页面文件的臃肿。

  本工具通过计算段落中的文本和链接中Anchor text文本占整个页面HTML文件的比例,给出页面精减程度的轮廓。

在SEO中文本/代码比率的重要性

  文本/代码比率在搜索引擎衡量页面的相关性时非常重要,一般说来,页面文件中文本的比率越高,您的网页在搜索结果页面中排名靠前的几率便越大。

  虽然不是所有的搜索引擎在其索引算法中使用文本/代码比率因子,但大多数主流搜索引擎考虑这方面的影响。一般说来,具有比您的竞争对手稍高的文本/代码比率,是进行On-Page优化的基础。

网址
输入待查询网页的地址

  Tags:

PageRank预测

2006/07/7

  我们都知道,使用Google Toolbar或PageRank查询工具,可以查看某个特定网址的PageRank,这些工具的查询都是基于toolbarqueries.google.com中的数据。一般说来,toolbarqueries.google.com与Google其他数据中心的数据是一致的,但在某些时候特别是Google更新时,各数据中心的数据则可能不同步。

  本工具可以同时查询某个特定的url在Google不同的数据中心中的PageRank数值。当不同数据中心返回的PageRank数值不同时,意味着该Url对应的网页PageRank下一步将有变化。

  通过该工具,您可以对某个网站/网页Pagerank未来可能的上升或下降趋势有基本的把握。

URL
输入待查询的网站/网页地址

  Tags:

6月网站优化效果分析:关于搜索引擎

2006/07/6

  6月份,无论IT技术点评还是SEO探索,来自Baidu的访问量全面压倒了Google。虽然对SEO探索来说,这种访问来源构成似乎比较合理,毕竟对新建网站来说,似乎Baidu总是有优势的。但对IT技术点评,则令人玩味,Baidu上次领先还是在2月份,即IT技术点评运行的前2个月。IT技术点评6月份来自Baidu与Google的访问量之比为7:5,与5月相比,6月来自Baidu的访问量几乎提高一倍的幅度,是正常还是某种特殊的原因造成?

Baidu

  无论IT技术点评上月来自Baidu访问量的上升是否与Google被封有关,但不可否认,Baidu在中文搜索市场的优势毋庸置疑,庞大的用户数量是其最大的优势。

  但仅仅靠这些恐怕仍不好解释为什么来自Baidu的访问量6月份提升近一倍,是不是可以认为:Baidu除了收录速度快,“喜欢”新网站外,还对“大”网站即内部页面更多的网站?对IT技术点评而言,随着网站内容的不断积累,6月份到了Baidu青睐的某个类似的“临界点”,才有这种访问量的飞跃?这点似乎也可以从很多没有原创内容,仅靠所谓的“采集器”一夜之间拷贝上千个页面建成的网站也能在Baidu中获得不错排名的现象中看出。

Google

  与Baidu相对应的是,IT技术点评6月来自google的访问量则让人失望,与5月份相比,不但没有上升,反倒下降了约7%,这点我们曾在Google索引中的网页标题故障中进行过探讨:Google的收录似乎出了问题。

  下面是IT技术点评的网页被Google收录情况(在Google中使用“site:”查询或使用搜索引擎收录页面查询工具)

6/21 15:13 约有 604 项符合的查询结果
6/22 17:36 约有 656 项符合的查询结果
6/24 20:05 约有 792 项符合的查询结果
6/25 21:05 约有 812 项符合的查询结果
6/26 27:34 约有 829 项符合的查询结果
……
7/03 17:01 约有 880 项符合的查询结果
7/04 11:57 约有 918 项符合的查询结果
7/06 13:39 约有 937 项符合的查询结果

  至于这是由于Google.com与Google.cn的切换造成的还是由于BigDaddy更新,不得而知,好在逐渐恢复正常。当然,这仅仅是收录情况,具体的访问量还需进一步观察。

Yahoo

  至于Yahoo,则与上述二者明显不在同一量级,来自Yahoo+3721的访问量之和约为Google的10%,虽然来自Yahoo的Spider是最活跃的。——老实说,直有把它禁了的冲动,6月Yahoo Slurp的读取数据量为170.31M,与之相对的是Googlebot的57.48M和BaiduSpider 39.26M,明显的投入产出比较差 :evil: ,有点可笑的是,6月Yahoo Slurp读取Robots.txt的次数为3104,平均每天100次,不知道是不是因为Yahoo Slurp从不记录Robots.txt的内容,每读取一次网页就要查看一下Robots.txt 8O

  来自Yahoo的访问量少得可怜当然可能与我们网站自身没有做好针对Yahoo的优化,在Yahoo中排名较低有关,但也不能不让人怀疑众多的所谓调查报告中显示的Yahoo在中文搜索引擎市场中排行第二结论属于标准的中国式操作。

  Tags: , , ,