SEO探索

中文网站搜索引擎优化技术研究


存档: 2006/06

Favicon:为网站打造个性标志

2006/06/30

  从严格意义上,favicon的话题无关SEO技术,也与Web服务器技术方面的讨论没有太大干系,不过,在我们的网站建设中,为网站打造一个契合网站主题的个性化标志则是必需的,这直接关系到能否成功地塑造网站的品牌。这从某些角度看仍在网站推广的范畴之内,而欲取得成功,不仅包括良好的页面设计、令人印象深刻的网站Logo,也包括favicon。

什么是favicon?

收藏夹中的favicon

  所谓favicon,即Favorites Icon的缩写,顾名思义,便是其可以让浏览器的收藏夹中除显示相应的标题外,还以图标的方式区别不同的网站。当然,这不仅仅是Favicon的全部,根据浏览器的不同,Favicon的显示也有所区别:在大多数主流浏览器如FireFox和Internet Explorer (5.5及以上版本)中,favicon不仅在收藏夹中显示,还会同时出现在地址栏上,这时用户可以拖曳favicon到桌面以建立到网站的快捷方式;除此之外,标签式浏览器甚至还有不少扩展的功能,如FireFox甚至支持动画格式的favicon等。

地址栏中的favicon  从特定的技术角度看,favicon也并不只是仅仅让网站给人更专业的观感,也可以在一定程度上减轻服务器的流量带宽占用:一般为了提高网站的可用性,我们都会为自己的网站创建一个自定义的404错误文件,在这种情况下,如果网站没有相应的favicon.ico文件,每当有用户收藏网站/网页时,Web服务器都会调用这个自定义的404文件,并在网站的错误日志中记录。这显然是应该予以避免的。

如何制作Favicon.ico

  制作Favicon.ico的方法相当简单,首先,利用图形工具创建2个反映网站主题的256色的小图片:1个为32×32像素,另一个为16×16像素。需要注意的是,调色板要选用“Windows 默认调色板”,不然,在最终的效果展示中图形可能会发生迥异于您初衷的颜色上变化。

  需要说明的是,在很多关于Favicon.ico的说明中,常见到要求图片为16色的说法,应该说这类说法大大过时:在早期如Windows 95时期,16色的Favicon.ico可能是个稳妥的选择,保证其在大多数情况下正常使用,但现在,完全不存在那类限制,16色只能使图标的展示效果大大降低。

  至于在浏览器中使用时16×16像素的图片已经足够,为什么还要准备32×32像素的图片,原因在于,正如上文所言,favicon也显示在地址栏中,用户可以拖曳favicon到桌面以建立到网站的快捷方式,而桌面图标则要以32×32显示的,如果您的Favicon.ico不包括32像素的图片,系统就只能使用默认的浏览器图标来标注网站/网页,如Internet Explorer的蓝色“e”,起不到我们意欲通过Favicon.ico打造网站品牌的作用。

  图片制作好后,使用如Image2Ico之类的小程序即可将2张图片转换到一个Icon文件中。也可以通过可以在线制作Favicon的网站来制作,不过,需要注意的是,这个网站要求图片源文件格式为Pic。

在网页中使用Favicon.ico

  浏览器调用Favicon的原则是首先在网页所在的目录下寻找Favicon.ico文件,如果没有,便到网站的根目录下寻找。

  因此,在网页中使用Favicon最简单的办法便是将制作好的图标文件命名为Favicon.ico,然后将其上传到网站的根目录即可。

  如果您需要将Favicon.ico放到其他目录下,或者希望让不同的网页显示不同的Favicon,就需要在网页Html文件中做设定了,具体设置也很简单,在Html中的<head>部分加入如下的代码:

<link rel=”icon” href=”/dir/favicon.ico” mce_href=”/dir/favicon.ico” type=”image/x-icon”>
<link rel=”shortcut icon” href=”/dir/favicon.ico” mce_href=”/dir/favicon.ico” type=”image/x-icon”>

  Tags:

Google索引中的网页标题故障

2006/06/28

  自进入6月份以来,IT技术点评来自Google的访问量约下降了10%,当然,这大概与6月初的Google被封事件有关,——许多人根本上不去Google,更谈不上用它搜索了——也可能是进入世界杯以来,只顾得看球 :roll: ,在网站内容上投入的精力不够,无论更新频率还是内容质量较诸以前都有所下降。

  本来对此倒并没有太在意,毕竟来自Baidu访问量的上升足够抵消,还略有赢余,到目前(6/27)为止,与上月的总访问量相比,也有近15%的提高。况且,对Google的访问量下降,如果原因是1,即Google被封导致,以后只要Google正常便可逐渐回到以往的轨道上来;如果原因是2,世界杯结束后继续增加内容就行了。

  不过,今天发现,可能问题并不那么简单,也许是我的网站,也许是Google,可能在哪些方面出了问题:SEO探索最近有不少页面被置入了补充材料(Supplemental Results),而且,在搜索结果页面中显示的标题很怪异,不仅包括正常的在<title></title>之间的内容,还将页面开始处的部分内容也放到了标题中,如下图:

网页标题在SERP中变长了

  不过,图中例示的这个网页被视作补充材料倒情有可原:这是一个最初错误设定post slug,发现后做了修改的页面,也即是目前这个页面在SEO探索中并不存在。但是,网页的标题为什么会变成这个样子?

  搜索了一下,发现类似的问题其他人也已发现,WMW上关于这种现象的讨论很激烈,而Rustybrick 在Google’s Supplemental Index Showing More Than the Title Tag as the Title?则对这种现象提出了很有趣的解释:

Google isn’t always doing this, it may depend on the query at hand. Is this a sign that Google may be producing dynamic titles based on queries? I know Google sometimes opts for DMOZ titles, but this is way different than that.

  老实说,究竟怎么回事,现在似乎很难下结论。不知朋友们是否也遇到类似的情况?

  Tags: ,

网页Title的优化探讨

2006/06/26

  近日Problogger的 Darren Rowse撰写了一篇Title Tags and SEO的文章,尽管其探讨的是Blog中网页Title的优化原则,但其中的策略对大多数网站均适用。

  在文中,Darren Rowse比较了Blog中常见的几种网页Title的格式,并分别探讨了其优缺点,这几种格式包括:

Post Title | Blog Name
Blog Name | Post Title
Blog Name | Category | Post Title
Blog Name
Post Title

  即我们在网页Title优化的实施一文中探讨的中的6、5、3、7类,见下:

  1. SEO探索 | 中文网站推广技术研究 | OnPage优化 | 网页Title优化的实施
  2. 网页Title优化的实施 | OnPage优化 | SEO探索 | 中文网站推广技术研究
  3. SEO探索 | OnPage优化 | 网页Title优化的实施
  4. 网页Title优化的实施 | SEO探索 | OnPage优化
  5. SEO探索 | 网页Title优化的实施
  6. 网页Title优化的实施 | SEO探索
  7. 网页Title优化的实施
  8. 网页Title优化的实施 | 中文网站推广技术研究

  对于我们当时认为不值得的讨论而未列入的以Blog Name作为网页标题一类情况,Darren Rowse也简单地分析了其致命的缺陷。

  此外,Darren Rowse还给出了在制订网页Title策略时应考虑的因素,包括品牌、SEO、可用性以及网页Title长度等,观点与我们在网页Title优化的实施网页Title的优化的原则中的讨论有共同之处。

  Tags: ,

网站间的相关性探讨

2006/06/25

  在链接伙伴的选择中,我们曾指出在建立链接时必须考虑网站之间的相关性,只有这样才能保证链接价值能够最终体现,不然,在无关网站上建立的链接不仅无益于网站的排名,甚至还会因此导致被搜索引擎处罚。

  那么,一个对许多网站建设者而言相当困惑的问题便出现了:如何判断某个网站是自己网站的相关站点(relevant website)?事实上,很多人认为自己的链接伙伴都是与自己网站内容相关的,但是,却没有因此而获得理论上应有的网站优化效果,问题究竟出在哪儿?

人们对相关性的判断存在主观性

  应该说,对网站之间是否具有相关性以及在多大程度上存在相关性的判断是很主观的,同样的两个网站,不同的两个人得出的结论可能截然相反:是相关网站或无关网站,这与每个人的知识水平、分析能力以及判断时所在的角度息息相关,也与具体网站的内容覆盖面有关,比如说对IT技术点评,是不是所有涉及信息技术的网站可认为是相关网站,或者范围再小点,是不是PC硬件与技术类的网站便可认为是相关网站?答案显然是否定的。

  当网页具有很多网站建设者认为“相关网站”的链接但最终的网站优化效果却不理想时,至少说明,在判断网站间相关性的过程,网站建设者所用的判断依据与搜索引擎的判断标准存在差异。尽管我们不能就此而认为搜索引擎的判断标准更为科学或更为准确,但要想获得理想的网站优化效果,我们所应做的只能是接受搜索引擎的标准,在此基础上吃透它从而最终获益,而不是挑战它。

搜索引擎如何判断网站相关性

  网站的历史因素

  当我们判断网站的相关性时,往往采用的方式是到对方网站看浏览一下其涉及的具体内容,这当然是必需的,但很多时候却难免存在偏差,其中最主要的问题在于我们的这种浏览与分析建基于该网站目前的内容,甚至某种意义上说是目前浮现于表面的内容,而非对该网站在搜索引擎眼中“面貌”的整体把握。

  比如说,某个网站之前可能讨论的主题是汽车方面,但随时间的推移慢慢演变为旅游,这样,对一个旅游网站的建设者来说,其浏览该网站的结论是与其自身的网站相关的,但是,在搜索引擎的历史数据中,没准该网站更多的内容仍是关于汽车的,而不会将其视为旅游类的相关网站,或者只认为其具有较低的相关性。

  当然,这个例子可能绝对了些,大部分网站不会在内容方向上做如何大的转变,但是,内容的调整或者微调则是任何网站都难以避免的,比如IT技术点评近日将软件与网络部分的内容加了进来,从原来主要涉及PC硬件及技术的主题延伸到涵盖相应的软件与网络技术,对应地,搜索引擎在判断网站相关性时也会随时间做相应的改变,但在目前,恐怕其还是更多地认为IT技术点评的主题仍是关于PC硬件技术的。

  网站的相关性有程度之分

  当我们在讨论网站的相关性,应当清楚网站的相关性是有程度之分的,换言之,网站的相关性不是那种非黑即白的简单判断,而是一个连续的变量,如果将两个网站完全相关假设为100%相关度而完全无关假设为0时,现实条件下的网站相关度则会从0-100%间浮动。

  仍以IT技术点评为例,比如说网站A是宽泛地讨论信息技术的网站,网站B为讨论PC应用技术的网站,当然我们可以说网站A与B对IT技术点评来说都是相关网站,但二者的相关程度肯定是有区别的,来自这二个网站的链接,在其他条件都相同的情况下,对搜索引擎其价值也是具有很大差别的。

  搜索引擎更多地根据网站的出站链接判断

  尽管从理论上说,搜索引擎在判断网站的主题时应主要以具体的网页内容做依据,但是,许多人的研究表明,至少在现阶段,搜索引擎在判断网站涉及的主题尤其在判断网站不同网站间的相关性时,更多的是依据网站的出站链接。这可能缘于搜索引擎的技术仍有待提高,也可能缘于许多网站的内容涉及面十分繁杂,搜索引擎无法从众多的主题中找出网站的真正主题,当然,真正原因不是本文可以探究的,但要切记,对搜索引擎而言,网站自身的出站链接是网站建设者为自己网站所探讨主题的自主设定,在某种意义上更准确。

  比如说,如果某个旅游网站的大部分出站链接都是指向汽车类网站,搜索引擎便极有可能认为该网站的“真正主题”更多地面向汽车领域,而目前网站内关于旅游的内容只不过是网站在一定程度上偏离了该主题,那么,这个网站对另一个关于旅游的网站而言,其相关性能够达到什么程度就很难说了。

  Tags: , ,

关于对SEO探索内容的拷贝与复制

2006/06/22

  昨日,天闷且燥,人便沉不下心来继续写些东西——虽然自世界杯开赛以来,SEO探索的更新频率降低了许多,需要尽快地添加新内容。——但闲着又有些无聊,于是,便找了个工具查查SEO探索文章的转载情况,结果很出乎我意料。

  首先,SEO探索中文章被转载的数量还是蛮多的,粗看了一下,约被转载了三百多篇次,满足了一下个人小小的虚荣心 :oops: ,至少说明本站所写的东西还是有点价值的,而不是堆砌了一堆垃圾文章。不管怎么说,能对大家有所助益,是本站的初衷。

  其次,尽管很清楚大家都把Internet上的Copy /Paste当成一件很普通、很正常的事,也相信尽管不能说百分之百但百分之九十多的网站存在着Copy别人内容的现象,比如说我自己的网站IT技术点评也有不少转载文章,但没有想到的是,我逐一检查了将近一百个转载本站文章的网页,却仅有一个注明了转自本站,其他统统不加说明甚至注明为“原创”,更好笑的是其中一个网站,除目录及链接页外,真正的内容仅有17页,却有14页转自本站,且无一例外地声称为其“原创”。

  在此无意拿道德来说事,毕竟如果道德能够真正约束人的行为的话,法律也就没有存在的基础了;毕竟中文界的Internet发展史整体来说本就是一个与道德无关的历程,不然,那些靠流氓软件起家的行业开创者也不可能那么快就洗白,甚至似乎道德上的洁癖在某种程度上代表着“创新能力”的不足,但仍然感到困惑的是,为转载的文章加上原文出处就那么难么?是不是只有这样并加上“原创”之类的词才代表着Internet的未来发展趋势?

  老实说,以前遇到类似的情况下,我还曾经到几个网站上留言,类似于“转载不是不可以,但是不是应该加上原文出处链接啊”之类,现在也懒得去说了,当一种做法成为潮流的时候,妄图螳螂挡车总是不智的。

  不过,仍然不能释疑的是,其中的大多数网站看起来并不像那个什么芯或那个什么操作系统,打算申请国家科研基金,需要将别人的版权找民工磨掉或删除,那么,所为何来矣?